Google Analytics 与 BigQuery 中的会话 - 差异

Posted

技术标签:

【中文标题】Google Analytics 与 BigQuery 中的会话 - 差异【英文标题】:Sessions in Google Analytics vs BigQuery - discrepancies 【发布时间】:2015-06-29 15:37:03 【问题描述】:

我发现我在 Google Analytics(分析)和 BigQuery 上的数据中的会话总数存在一些差异。为了在 BQ 中计算这个,我使用以下内容:

SELECT date, 
EXACT_COUNT_DISTINCT(CONCAT(fullvisitorid, STRING(visitid))) 
AS sessions 
FROM [MyData]

使用此查询获得的结果如下:

查询结果 行日期会话 1 20150601 1269258 2 20150602 1269299 3 20150603 1131770

在 Google Analytics 中,每天的会话数是:

日索引会话 2015 年 6 月 1 日 1113088 2015 年 6 月 2 日 1112203 2015 年 6 月 2 日 993178

这种差异有什么原因吗?

【问题讨论】:

运行报告时分析中的 AFAIK 是一个近似值,并显示在屏幕的左上角。 但我认为这应该是非抽样数据。 @SilviaPina 我更像是一个 BQ/App Engine 人,但查看 GA 文档,我发现了这个:support.google.com/analytics/answer/… 这表示如果您有大量数据。我不知道他们认为什么高......但 1100 万会话可能会达到阈值 如果你改为使用“SUM(totals.visits) 作为会话”,你会得到什么数字? 使用该变体,我得到另一个结果: 20150601 1268011 ; 20150602 1269063; 20150603 1131540 【参考方案1】:

您可能想尝试以下查询

SELECT date2, 
       Count(DISTINCT sessionid) 
FROM  (SELECT Concat(clientid, "-", visitnumber, "-", date)       AS sessionId, 
              Date_trunc(Date(Parse_date('%Y%m%d', date)), month) AS date2 
       FROM   `project-id.dataset-id.ga_sessions_*` 
       WHERE  _table_suffix BETWEEN '20191201' AND '20210131' 
              AND totals.visits = 1) 
GROUP  BY date2 
ORDER  BY date2 

本文给出了不符原因及相关代码: Google Analytics + BigQuery Tips: Users and Sessions

【讨论】:

以上是关于Google Analytics 与 BigQuery 中的会话 - 差异的主要内容,如果未能解决你的问题,请参考以下文章

html 调整以使InVision原型与Google Analytics配合使用

将Google Analytics与CRM集成

内容安全政策能否与 Google Analytics 和 AdSense 兼容?

与链接到 Google Adwords 帐户的 Google Analytics API 相比,Google Adwords API 报告可以获得多少?

Google Analytics 与 BigQuery 中的会话 - 差异

Google Analytics Premium VS Adobe Analytics