使用 Redshift 计算特定 ID 字段中值的出现次数

Posted 2023-03-30

技术标签:

【中文标题】使用 Redshift 计算特定 ID 字段中值的出现次数【英文标题】：Count occurrences of value in field for a particular ID using Redshift 【发布时间】：2016-01-08 18:11:11 【问题描述】：

我想计算某个 ID 特定字段中特定值的出现次数。所以我有的是这样的：

| Location ID |   Group  |
|:----------- |:---------|
| 1           |  Group A |      
| 2           |  Group B |      
| 3           |  Group C |   
| 4           |  Group A |  
| 4           |  Group B | 
| 4           |  Group C | 
| 3           |  Group A | 
| 2           |  Group B | 
| 1           |  Group C |    
| 2           |  Group A |

而我希望通过一些计算机魔法得到的是：

| Location ID | Group A Count | Group B Count | Group C count|
|:----------- |:--------------|:--------------|:-------------|
| 1           | 1             | 0             | 1            |
| 2           | 1             | 2             | 0            |
| 3           | 1             | 0             | 1            |
| 4           | 1             | 1             | 1            |

我可以在 Redshift 中使用某种旋转功能来实现这一点吗？

【问题讨论】：

【参考方案1】：

这将需要使用 CASE 函数和 GROUP 子句，如示例所示。

SELECT l_id,
       SUM(CASE WHEN l_group = 'Group A' THEN 1 ELSE 0 END) AS a,
       SUM(CASE WHEN l_group = 'Group B' THEN 1 ELSE 0 END) AS b-- and so on
       FROM location
GROUP BY l_id;

这应该会给你这样的结果：

| l_id | a | b |
|------|---|---|
|    4 | 1 | 1 |
|    1 | 1 | 0 |
|    3 | 1 | 0 |
|    2 | 1 | 2 |

你可以在这个SQL Fiddle上玩它。

【讨论】：

以上是关于使用 Redshift 计算特定 ID 字段中值的出现次数的主要内容，如果未能解决你的问题，请参考以下文章