BigQuery Google Analytics sessionWithEvent 指标

Posted

技术标签:

【中文标题】BigQuery Google Analytics sessionWithEvent 指标【英文标题】:BigQuery Google Analytics sessionsWithEvent metric 【发布时间】:2017-02-16 15:20:18 【问题描述】:

我在创建允许我获取 Google Analytics(分析)ga:sessionsWithEvent 指标的 BigQuery 查询时遇到问题。

这是我尝试过的:

SELECT
  EXACT_COUNT_DISTINCT(concat(fullvisitorid, string(visitid))) AS distinctVisitIds
FROM
  (TABLE_DATE_RANGE([xxxxxxxx.ga_sessions_], TIMESTAMP('2016-11-30'), TIMESTAMP('2016-12-26')))
WHERE
  hits.type='EVENT'

上述查询中的逻辑似乎是合理的 - 获取所有具有 hit.type 'EVENT' 的行并总结不同 fullVisitorId/VisitId 结果的确切计数 - 也就是。一个事件的唯一会话数。

但是我从这里得到的数字很接近,但比我使用 query explorer 得到的要高

谢谢。

编辑:解决下面的评论以使用更广泛的日期范围和日期过滤器

日期范围 +-5 天,这使得查询

SELECT
  EXACT_COUNT_DISTINCT(concat(fullvisitorid, string(visitid))) AS distinctVisitIds
FROM
  (TABLE_DATE_RANGE([xxxxxxxx.ga_sessions_], TIMESTAMP('2016-11-25'), TIMESTAMP('2016-12-31')))
WHERE
  hits.type='EVENT'
  AND ('20161130'<=date AND date<='20161226')

不幸的是,我仍然得到相同的号码

【问题讨论】:

【参考方案1】:

不要依赖表格日期,通常即使在较晚的日子里,您也可以获得前几天的指标。而是在列上使用更大的日期范围和确切的日期范围。

AFAIK 数据浏览器也会进行近似计算。

【讨论】:

谢谢。我用 +/- 5 天更新了我的查询,并在会话中使用了日期过滤器,但得到了相同的结果。 Query explorer 还说“Contains sampled data:No”,这意味着结果应该是准确的。 好吧,我误读了您的问题,认为数字较小,但您说您在 BQ 中的数字较高,这很好。在这里查看一个答案解释了原因:***.com/questions/26410832/… 那个链接的问题提到了 API 的数据采样(查询资源管理器在其上运行)。如果查询资源管理器显示“包含抽样数据:是”,这将是有意义的,但对我来说,它显示“否”,这意味着不应该涉及抽样,它应该与 BigQuery 非抽样数据匹配。 由于您在导出分析时已经拥有溢价,您可以创建支持票并询问您是否看到丢失的数据,或者可能存在哪些差异 我希望那是真的>..

以上是关于BigQuery Google Analytics sessionWithEvent 指标的主要内容,如果未能解决你的问题,请参考以下文章

无法在 BigQuery 中访问 Google Analytics 的示例数据集

Google Analytics 4 Bigquery 链接的配额限制是多少

在 BigQuery 中回填 Google Analytics

如何将 Google Analytics 数据导出到 Google GCS 存储桶或 BigQuery?

BigQuery - 从 Google Analytics 导出不同的事件

Google Analytics 与 BigQuery 中的会话 - 差异