GOOGLE DATA STUDIO BIG QUERY count distinct aggregation is NOT WORKING

Posted

技术标签:

【中文标题】GOOGLE DATA STUDIO BIG QUERY count distinct aggregation is NOT WORKING【英文标题】:GOOGLE DATA STUDIO BIG QUERY count distinct aggregation IS NOT WORKING 【发布时间】:2018-11-21 10:43:12 【问题描述】:

当我在使用 BigQuery 作为数据库的 Google Data Studio 中选择 CTD 作为聚合时,我遇到了一个大问题。 这需要尽快修复。非常重要。

这里是 Bigquery 中 Count Distinct 结果的图像

https://prnt.sc/ll2r4n

这里是 APROX COUNT DISTINCT 结果的图像

https://prnt.sc/ll2swm

当我在 google data studio 中选择 CTD 聚合时,GOOGLE DATA STUDIO 正在发送 APROX COUNT DISTINCT。

是个大问题,因为报告没用。有时当值>1000 时,APROX COUNT DISTINCT 的结果不正确。我们需要 count Distinct no APROX 才能准确地向我们的客户提供报告。

更多信息:https://www.en.advertisercommunity.com/t5/forums/v3_1/forumtopicpage/board-id/Data-Studio/thread-id/2091/highlight/true/page/1

距离那个帖子快两年了,没有任何消息....

【问题讨论】:

鉴于该限制,您不能先在 BigQuery 中创建所需的正确数据集并将报告链接到该数据集吗? 当然可以。但是每次我需要在指标中生成 CTD 时,我都需要创建一个新数据集吗?不是解决方案。 我期待 Google 团队在截止日期前给出答复。 那么我建议在这里为这个问题投票issuetracker.google.com/issues/72937416 感谢我们正在这样做。我希望我们能尽快得到答复。 【参考方案1】:

数据洞察已更新 COUNT_DISTINCT 以执行准确的非重复计数。

现在您可以根据具体情况控制哪个更关键:准确性或性能。

APPROXIMATE_COUNT_DISTINCT 采用一个参数,该参数可以是任何类型的指标、维度或表达式的名称,以执行更快的近似非重复计数。

请注意,对于 BigQuery 以外的数据源,APPROXIMATE_COUNT_DISTINCT 等价于 COUNT_DISTINCT。

【讨论】:

以上是关于GOOGLE DATA STUDIO BIG QUERY count distinct aggregation is NOT WORKING的主要内容,如果未能解决你的问题,请参考以下文章

Google Data Studio:如何使用自定义 Big Query 查询创建时间序列图表

如何根据 Big Query 中的 UTC 时间戳在 Data Studio 中显示本地时区的日期/时间

tMatchGroup 在 Talend Open Studio for Big Data 中的位置

使用 Azure 数据工厂将数据从 Google Big Query 移动到 Azure Data Lake Store

google data studio如何收费

Android Studio Emulator : Unhandled exit 1d (Mac OS : Big Sur Beta)