谷歌分析差异
Posted
技术标签:
【中文标题】谷歌分析差异【英文标题】:Google Analytics discrepancies 【发布时间】:2021-04-29 22:27:08 【问题描述】:我有目标完成情况的谷歌分析报告,这与我在 BigQuery 中看到的不同。我正在使用以下查询来完成目标。差异非常小,大约在 1 到 20 之间。
SELECT
distinct visitId
FROM
`gcp_project.ganalytics.ga_sessions_*` AS sessions,
UNNEST(hits) AS hits
WHERE
regexp_contains(hits.page.pagepath, '/booking/complete*')
and _table_suffix = '20210424'
and totals.visits=1
gcp_project 位于美国地区,目标报告基于法国网页。时区有区别吗?
【问题讨论】:
您是否尝试过将 fullVisitorId 和 visitId 结合起来,而不是仅仅结合 visitId?输出不同吗?另外,差异如何减少或增加?是否一致? 它在 1 到 20 之间的变化非常小。 您是否尝试更新您的 visitId? 我希望你的意思是在 visitorid 和 fullvisitorId 之间使用 union all。是的,我做到了,但数量急剧增加。比预期值高 95%+。我试过 select distinct(visitorid) from (select visitiorid from时区是一个因素。 BigQuery 导出数据集将采用 UTC,而在 GA UI 中,时区是用户为每个属性定义的。
在 GA UI 中,计数是使用 HyperLogLog 函数完成的近似值,而在 BigQuery 查询中,您执行的是常规 COUNT DISTINCT。 BigQuery 中的等效项是使用Approximate aggregate functions in Standard SQL。但是,即使这样,由于 GA 和 BigQuery 中 HyperLogLog 的实现方式不同,您也可能会有细微的差异。
【讨论】:
以上是关于谷歌分析差异的主要内容,如果未能解决你的问题,请参考以下文章
Google Analytics(分析)门户中的唯一用户数与我从 BigQuery 获得的结果之间的差异。查询有问题吗?