google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910 中的缺失值

Posted

技术标签:

【中文标题】google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910 中的缺失值【英文标题】:Missing values in google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910 【发布时间】:2013-11-06 04:29:18 【问题描述】:

我正在使用实践存储库,为即将使用 BQ 的大型企业客户开展工作做准备。存储库链接是:google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910

关于示例存储库和一个已运行的查询,我有 3 个问题要问(请参阅链接底部以了解引发该问题的查询:

1) customDimensions.index, customDimensions.value 和 hits.customDimensions.index, hits.customDimensions.value 有什么区别?

2) 如果单个匹配具有多个自定义维度/指标,如何返回/查询?我只在示例数据中看到匹配级别的单个维度。

3) 示例数据中没有传递自定义指标值,这些值是什么样的?

这是引发前 3 个问题的查询:

SELECT hits.page.pagePath AS urls,
       hits.time,
       customDimensions.index,
       customDimensions.value,
       hits.customMetrics.index,
       hits.customMetrics.value,
       trafficSource.medium,
       hits.customVariables.index,
       hits.customVariables.customVarName,
       hits.customVariables.customVarValue
FROM [google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910]

【问题讨论】:

【参考方案1】:

该表中的每条记录都代表一个 Google Analytics 会话。 Big Query 具有nested fields 的概念,这就是单个命中的定义方式。它们嵌套在点击记录中。

回答您的问题:

1) customDimensions.index 和 customDimensions.value 是用户或会话范围的自定义维度的索引和值。 hits.customDimensions.index 和 hits.customDimensions.value 是在命中范围级别设置的自定义维度。范围是在您通过 GA 界面创建自定义维度时定义的。索引是从 1 到 20 的整数(在管理部分中定义),值是作为该自定义维度的值传递的字符串。 More info about Custom Dimensions/Metrics

2) rows 和 rows.customDimensions 都是 Big Query 中的重复记录。所以本质上,该 BQ 表中的每一行都是这样的:

|- date
|- (....)
+- hits
   |- time
   +- customDimensions
      |- index
      |- value

但是当您查询数据时,默认情况下应该是 FLATTEN。因为如果单个匹配具有多个自定义维度和指标,它应该会显示多行,每行一个。

3) 应与 customDimensions 相同,但值为 INTEGER 而不是 STRINGS。

对于更简单且更具教育意义的数据集,我建议您创建一个全新的 BQ 表并加载this developer document page 上提供的数据。

PS:告诉我在 Cardinal Path 的好朋友爱德华多说你好!

【讨论】:

感谢爱德华多!也很高兴与您联系。我期待着保持联系!会将您的问候发送给 CP 的团队!

以上是关于google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910 中的缺失值的主要内容,如果未能解决你的问题,请参考以下文章