按页面计算综合浏览量

Posted

技术标签:

【中文标题】按页面计算综合浏览量【英文标题】:Count pageviews by page 【发布时间】:2017-10-03 12:07:16 【问题描述】:

我想使用 Google Analytics(分析)数据源表在 BigQuery 中按页面计算浏览量。我只想计算具有ProductList_UAProductDetails_UA 的自定义页面内容分组的页面,并且我想从页面 URL 的末尾修剪所有参数,以便返回更易于管理的页面列表。

到目前为止,我的查询如下所示,但是我的浏览量、跳出和退出次数太高(大约 8 倍) - 我哪里出错了?

SELECT IFNULL(REGEXP_EXTRACT(hits.page.pagePath,r'^(.*?)\?'), hits.page.pagePath) AS Trimmed_Page, COUNT(hits.page.pagepath) AS Pageviews, SUM(totals.bounces) AS Bounces, SUM(IF(hits.isexit = TRUE, 1,0)) AS Exits, SUM(IF(hits.isentrance = TRUE, 1,0)) AS Entrances, MIN(hits.contentGroup.contentGroup3) AS Content_Group
FROM `xxx.ga_sessions_20*` AS m
  CROSS JOIN UNNEST(m.customdimensions) AS customDimension
  CROSS JOIN UNNEST(m.hits) AS hits
WHERE parse_date('%y%m%d', _table_suffix) between 
DATE_sub(current_date(), interval 1 day) and
DATE_sub(current_date(), interval 1 day)
AND (hits.contentGroup.contentGroup3 = 'ProductList_UA' OR hits.contentGroup.contentGroup3 = 'ProductDetails_UA')
AND hits.type="PAGE"
AND hits.isInteraction = TRUE
GROUP BY Trimmed_Page
ORDER BY Pageviews DESC
LIMIT 1000

【问题讨论】:

【参考方案1】:

我怀疑与 customDimensions 的交叉连接是导致您看到比预期更多的结果的原因,因为每行匹配都会乘以该行中的 customDimensions 数量。不使用交叉连接进行实验,看看它是否能解决问题。

【讨论】:

以上是关于按页面计算综合浏览量的主要内容,如果未能解决你的问题,请参考以下文章

IE浏览器中页面不能显示的常见错误提示及原因

高并发架构的相关概念

PV和并发

关于js鼠标事件综合各大浏览器能获取到坐标的属性总共以下五种

关于js鼠标事件综合各大浏览器能获取到坐标的属性总共以下五种

前端综合知识小集