谷歌分析差异

Posted

技术标签:

【中文标题】谷歌分析差异【英文标题】:Google Analytics discrepancies 【发布时间】:2021-04-29 22:27:08 【问题描述】:

我有目标完成情况的谷歌分析报告,这与我在 BigQuery 中看到的不同。我正在使用以下查询来完成目标。差异非常小,大约在 1 到 20 之间。

SELECT
    distinct visitId
FROM
    `gcp_project.ganalytics.ga_sessions_*` AS sessions,
    UNNEST(hits) AS hits
WHERE
    regexp_contains(hits.page.pagepath, '/booking/complete*')
    and _table_suffix = '20210424'
    and totals.visits=1

gcp_project 位于美国地区,目标报告基于法国网页。时区有区别吗?

【问题讨论】:

您是否尝试过将 fullVisitorId 和 visitId 结合起来,而不是仅仅结合 visitId?输出不同吗?另外,差异如何减少或增加?是否一致? 它在 1 到 20 之间的变化非常小。 您是否尝试更新您的 visitId? 我希望你的意思是在 visitorid 和 fullvisitorId 之间使用 union all。是的,我做到了,但数量急剧增加。比预期值高 95%+。我试过 select distinct(visitorid) from (select visitiorid from union all select fullvisitorid from ) 【参考方案1】:

    时区是一个因素。 BigQuery 导出数据集将采用 UTC,而在 GA UI 中,时区是用户为每个属性定义的。

    在 GA UI 中,计数是使用 HyperLogLog 函数完成的近似值,而在 BigQuery 查询中,您执行的是常规 COUNT DISTINCT。 BigQuery 中的等效项是使用Approximate aggregate functions in Standard SQL。但是,即使这样,由于 GA 和 BigQuery 中 HyperLogLog 的实现方式不同,您也可能会有细微的差异。

【讨论】:

以上是关于谷歌分析差异的主要内容,如果未能解决你的问题,请参考以下文章

谷歌分析差异 - 不包括 IP 地址

Google Analytics(分析)门户中的唯一用户数与我从 BigQuery 获得的结果之间的差异。查询有问题吗?

差异分析

DEseq2差异表达分析

R语言DESeq2基因差异表达分析

基因差异表达分析方法