Clickhouse 数组连接与左连接和计算计数

Posted

技术标签:

【中文标题】Clickhouse 数组连接与左连接和计算计数【英文标题】:Clickhouse Array Join with Left Join and Computed Counts 【发布时间】:2020-10-02 14:05:27 【问题描述】:

我有一个 SearchImpressions 表,该表有一个嵌套类型列,其中包含在搜索期间显示的 Product_Id 和 Price 数组。我还有一个表格,其中包含有关用户何时单击其中一个搜索结果的详细信息。

问题:

给定一个产品 ID,我想找出按天分组的总展示次数和点击次数。

产品搜索结果表

EventDateTime 查询结果(ProductId[], Price[])

产品点击次数表

EventDateTime 产品ID

所需输出

EventDate    ProductId TotalImpressions TotalClicks

11-11-2020   0001      56               6
12-11-2020   0002      21               0

我已经尝试过,但两个计数似乎相同

SELECT pr.EventDate,
       impressions.ProductId,
       count(impressions.ProductId) As TotalImpressions,
       count(clicks.productId) as TotalClicks
FROM ProductResults pr
ARRAY JOIN results as impressions
LEFT JOIN ProductClicks clicks on
          impressions.ProductId = clicks.ProductId
GROUP BY pr.EventDate,
         pr.DealershipId,
         pr.Vrm
ORDER BY pr.EventDate Desc;

谢谢

【问题讨论】:

问题是什么? 必需的输出——用于什么输入? @DennyCrane 抱歉,目前尚不清楚 - 我只是想知道如何计算搜索结果中返回的产品数量以及每天点击它们的次数,而不是打扰哪个搜索点击来自我只需要显示产品 1 在搜索中被返回 30 次并在任何一天点击两次 【参考方案1】:

似乎需要为 clicks.productId 的计数聚合函数添加谓词或使用 uniqIf-function:

SELECT pr.EventDate,
       impressions.ProductId,
       count(impressions.ProductId) As TotalImpressions,
       countIf(clicks.productId != 0) as TotalClicks1 /* <-- v.1 */
       uniqIf(clicks.productId, clicks.productId != 0) as TotalClicks2 /* <-- v.2 */
..

【讨论】:

【参考方案2】:
 SELECT pr.EventDate,
        impressions.ProductId,
        count() As TotalImpressions,
        clicks.TotalClicks
 FROM ProductResults pr ARRAY JOIN results as impressions
 LEFT JOIN    (select ProductId, count(clicks.productId) TotalClicks 
               from  ProductClicks group by ProductId 
              ) clicks on impressions.ProductId = clicks.ProductId
 GROUP BY pr.EventDate, impressions.ProductId
 ORDER BY pr.EventDate Desc;

【讨论】:

以上是关于Clickhouse 数组连接与左连接和计算计数的主要内容,如果未能解决你的问题,请参考以下文章

MySQL更新查询与左连接和分组依据

将 concat 和 sum 与左连接 mysql 分组

LINQ 内连接与左连接

这个查询不好吗? MySql 一对多与左连接和嵌套查询

内连接与左外链接的区别

MySQL 索引优化与子查询与左连接