Google Analytics 与 BigQuery 中的会话 - 差异
Posted
技术标签:
【中文标题】Google Analytics 与 BigQuery 中的会话 - 差异【英文标题】:Sessions in Google Analytics vs BigQuery - discrepancies 【发布时间】:2015-06-29 15:37:03 【问题描述】:我发现我在 Google Analytics(分析)和 BigQuery 上的数据中的会话总数存在一些差异。为了在 BQ 中计算这个,我使用以下内容:
SELECT date,
EXACT_COUNT_DISTINCT(CONCAT(fullvisitorid, STRING(visitid)))
AS sessions
FROM [MyData]
使用此查询获得的结果如下:
查询结果 行日期会话 1 20150601 1269258 2 20150602 1269299 3 20150603 1131770
在 Google Analytics 中,每天的会话数是:
日索引会话 2015 年 6 月 1 日 1113088 2015 年 6 月 2 日 1112203 2015 年 6 月 2 日 993178
这种差异有什么原因吗?
【问题讨论】:
运行报告时分析中的 AFAIK 是一个近似值,并显示在屏幕的左上角。 但我认为这应该是非抽样数据。 @SilviaPina 我更像是一个 BQ/App Engine 人,但查看 GA 文档,我发现了这个:support.google.com/analytics/answer/… 这表示如果您有大量数据。我不知道他们认为什么高......但 1100 万会话可能会达到阈值 如果你改为使用“SUM(totals.visits) 作为会话”,你会得到什么数字? 使用该变体,我得到另一个结果: 20150601 1268011 ; 20150602 1269063; 20150603 1131540 【参考方案1】:您可能想尝试以下查询
SELECT date2,
Count(DISTINCT sessionid)
FROM (SELECT Concat(clientid, "-", visitnumber, "-", date) AS sessionId,
Date_trunc(Date(Parse_date('%Y%m%d', date)), month) AS date2
FROM `project-id.dataset-id.ga_sessions_*`
WHERE _table_suffix BETWEEN '20191201' AND '20210131'
AND totals.visits = 1)
GROUP BY date2
ORDER BY date2
本文给出了不符原因及相关代码: Google Analytics + BigQuery Tips: Users and Sessions
【讨论】:
以上是关于Google Analytics 与 BigQuery 中的会话 - 差异的主要内容,如果未能解决你的问题,请参考以下文章
html 调整以使InVision原型与Google Analytics配合使用
内容安全政策能否与 Google Analytics 和 AdSense 兼容?
与链接到 Google Adwords 帐户的 Google Analytics API 相比,Google Adwords API 报告可以获得多少?