google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910 中的缺失值
Posted
技术标签:
【中文标题】google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910 中的缺失值【英文标题】:Missing values in google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910 【发布时间】:2013-11-06 04:29:18 【问题描述】:我正在使用实践存储库,为即将使用 BQ 的大型企业客户开展工作做准备。存储库链接是:google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910
关于示例存储库和一个已运行的查询,我有 3 个问题要问(请参阅链接底部以了解引发该问题的查询:
1) customDimensions.index, customDimensions.value 和 hits.customDimensions.index, hits.customDimensions.value 有什么区别?
2) 如果单个匹配具有多个自定义维度/指标,如何返回/查询?我只在示例数据中看到匹配级别的单个维度。
3) 示例数据中没有传递自定义指标值,这些值是什么样的?
这是引发前 3 个问题的查询:
SELECT hits.page.pagePath AS urls,
hits.time,
customDimensions.index,
customDimensions.value,
hits.customMetrics.index,
hits.customMetrics.value,
trafficSource.medium,
hits.customVariables.index,
hits.customVariables.customVarName,
hits.customVariables.customVarValue
FROM [google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910]
【问题讨论】:
【参考方案1】:该表中的每条记录都代表一个 Google Analytics 会话。 Big Query 具有nested fields 的概念,这就是单个命中的定义方式。它们嵌套在点击记录中。
回答您的问题:
1) customDimensions.index 和 customDimensions.value 是用户或会话范围的自定义维度的索引和值。 hits.customDimensions.index 和 hits.customDimensions.value 是在命中范围级别设置的自定义维度。范围是在您通过 GA 界面创建自定义维度时定义的。索引是从 1 到 20 的整数(在管理部分中定义),值是作为该自定义维度的值传递的字符串。 More info about Custom Dimensions/Metrics
2) rows 和 rows.customDimensions 都是 Big Query 中的重复记录。所以本质上,该 BQ 表中的每一行都是这样的:
|- date
|- (....)
+- hits
|- time
+- customDimensions
|- index
|- value
但是当您查询数据时,默认情况下应该是 FLATTEN。因为如果单个匹配具有多个自定义维度和指标,它应该会显示多行,每行一个。
3) 应与 customDimensions 相同,但值为 INTEGER 而不是 STRINGS。
对于更简单且更具教育意义的数据集,我建议您创建一个全新的 BQ 表并加载this developer document page 上提供的数据。
PS:告诉我在 Cardinal Path 的好朋友爱德华多说你好!
【讨论】:
感谢爱德华多!也很高兴与您联系。我期待着保持联系!会将您的问候发送给 CP 的团队!以上是关于google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910 中的缺失值的主要内容,如果未能解决你的问题,请参考以下文章