如何在 Big Query 中复制 GA 字段访问

Posted

技术标签:

【中文标题】如何在 Big Query 中复制 GA 字段访问【英文标题】:How to replicate the GA field Visits in Big Query 【发布时间】:2018-03-13 23:31:35 【问题描述】:

在典型的 GA 会话中,选择视图 ID 和日期范围后,

我们可以像这样获得一周的数据:

Users
146,207

New Users
124,582

Sessions
186,191

问题是,要查询哪些 BQ 字段才能获得此用户值?

这是一个带有 2 个方法的示例查询(第 2 个方法被注释掉了)。

SELECT      
        count(DISTINCT(CONCAT(CAST(visitID as STRING),cast(visitNumber as 
STRING)))) as visitors,   

 --  count(DISTINCT(fullVisitorId)) as visitors

我注意到 FVID 方法与我在 GA 中看到的非常接近(用户在 BQ 中被低估了 3%),如果我使用注释掉的方法,我得到的值被高估了 15%与GA相比。 BQ中是否有更可靠的方法来获取GA中的Users值?

【问题讨论】:

你检查过之前的问题吗?这听起来与之前提出的一些问题非常相似——看看*** search。 您可以检查***.com/questions/30419771/… 以重新创建访问/会话 对于标准sql 中的访问者 COUNT(DISTINCT fullvisitorid) 是一种可靠的方法,并且比 GA 更精确,即使他们说,他们也没有采样. 【参考方案1】:

COUNT(DISTINCT fullVisitorId) 方法是最正确的方法,但它与默认情况下 Analytics 360 报告的内容不匹配。从去年开始,Google Analytics 360 默认使用a different calculation for the Users metric than it previously did。非抽样报告中仍在使用的旧计算方法更有可能与您从 BigQuery 中得到的结果相匹配。您可以通过将报告导出为非抽样报告或使用 Management API 中的非抽样报告功能来验证这一点。

如果您希望数字完全匹配,您可以使用指令here 关闭新计算。新计算的精确细节不公开,因此在 BigQuery 中复制该值非常困难。

仍有一些原因可能会导致您看到不同的数字,即使使用旧的计算方法也是如此。一种是如果网站已实施 User ID,在这种情况下,GA 编号将低于 fullVisitorId 的 BigQuery。另一个是抽样,尽管在 Analytics 360 中你所说的数量不太可能。

【讨论】:

以上是关于如何在 Big Query 中复制 GA 字段访问的主要内容,如果未能解决你的问题,请参考以下文章

Google Big Query 页面查看次数与 GA 页面查看次数不匹配

将 Google Analytics 360 链接到 Big Query,权限问题

BIG QUERY SQL:如何在具有相同唯一键但访问期间不同的访问中查找不同的重复集?

如何在 Big Query 视图中计算短语

找出每个字段在 Google Big Query 中占用的空间量

Big Query 透视和聚合重复字段