如何在 MySQL 中返回数据透视表输出?

Posted

技术标签:

【中文标题】如何在 MySQL 中返回数据透视表输出?【英文标题】:How can I return pivot table output in MySQL? 【发布时间】:2011-10-06 13:20:14 【问题描述】:

如果我的 mysql 表看起来像这样:

company_name 操作页数 ------------------------------------------- 公司 A 打印 3 公司 A 打印 2 公司 A 打印 3 B公司邮箱 公司 B 打印 2 公司 B 打印 2 公司 B 打印 1 公司 A 打印 3

是否可以运行 MySQL 查询以获得如下输出:

company_name EMAIL 打印 1 页 打印 2 页 打印 3 页 -------------------------------------------------- ------------ A公司 0 0 1 3 B公司 1 1 2 0

这个想法是 pagecount 可以变化,因此输出列的数量应该反映这一点,每个 action/pagecount 对对应一列,然后每个 company_name 的命中数。我不确定这是否称为数据透视表,但有人建议这样做?

【问题讨论】:

这称为旋转,在 SQL 之外进行这种转换要快得多。 Excel 会处理这样的事情,在 MySQL 中真的很难,因为没有“CROSSTAB”运算符 :( 是的,它目前是在 Excel 中手动完成的,我们正在尝试将其自动化。 @N.B.是建议在我们的应用层执行它还是在我们的应用层执行它更简单? @giannischristofakis - 这真的取决于你和你的同事认为什么更简单。自从我发表评论(4 年)以来,技术已经赶上了很多,所以它完全取决于你觉得更好 - 无论是在应用程序还是 SQL 中。例如,在我的工作中,我们处理类似的问题,但我们将 SQL 和应用内方法结合起来。基本上,除了给出固执己见的答案之外,我无能为力,这不是你所需要的:) 【参考方案1】:

这基本上一个数据透视表。

可以在此处找到有关如何实现此目的的精彩教程:http://www.artfulsoftware.com/infotree/qrytip.php?id=78

我建议阅读这篇文章并根据您的需求调整此解决方案。

更新

在上面的链接目前不再可用之后,我觉得有义务为所有在这里搜索 mysql pivot 答案的人提供一些额外的信息。它确实有大量的信息,我不会把那里的所有东西都放在这里(甚至更多,因为我只是不想复制他们的大量知识),但我会就如何处理枢轴提供一些建议用首先提出问题的 peku 的示例来概括 sql 方式。

也许链接很快就会恢复,我会留意它。

电子表格方式...

许多人只是为此目的使用 MSExcel、OpenOffice 或其他电子表格工具等工具。这是一个有效的解决方案,只需复制那里的数据并使用 GUI 提供的工具来解决这个问题。

但是...这不是问题所在,它甚至可能导致一些缺点,例如如何将数据放入电子表格、有问题的缩放等等。

SQL 方式...

鉴于他的桌子看起来像这样:

CREATE TABLE `test_pivot` (
  `pid` bigint(20) NOT NULL AUTO_INCREMENT,
  `company_name` varchar(32) DEFAULT NULL,
  `action` varchar(16) DEFAULT NULL,
  `pagecount` bigint(20) DEFAULT NULL,
  PRIMARY KEY (`pid`)
) ENGINE=MyISAM;

现在查看他/她想要的表:

company_name    EMAIL   PRINT 1 pages   PRINT 2 pages   PRINT 3 pages
-------------------------------------------------------------
CompanyA        0       0               1               3
CompanyB        1       1               2               0

行(EMAILPRINT x pages)类似于条件。主要分组是company_name

为了设置条件,这需要使用CASE-statement。为了按某事分组,好吧,使用... GROUP BY

提供此数据透视的基本 SQL 可能如下所示:

SELECT  P.`company_name`,
    COUNT(
        CASE 
            WHEN P.`action`='EMAIL' 
            THEN 1 
            ELSE NULL 
        END
    ) AS 'EMAIL',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '1' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 1 pages',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '2' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 2 pages',
    COUNT(
        CASE 
            WHEN P.`action`='PRINT' AND P.`pagecount` = '3' 
            THEN P.`pagecount` 
            ELSE NULL 
        END
    ) AS 'PRINT 3 pages'
FROM    test_pivot P
GROUP BY P.`company_name`;

这应该会很快提供所需的结果。这种方法的主要缺点是,您希望数据透视表中的行越多,您需要在 SQL 语句中定义的条件就越多。

这也可以处理,因此人们倾向于使用准备好的语句、例程、计数器等。

有关此主题的一些附加链接:

http://anothermysqldba.blogspot.de/2013/06/pivot-tables-example-in-mysql.html http://www.codeproject.com/Articles/363339/Cross-Tabulation-Pivot-Tables-with-MySQL http://datacharmer.org/downloads/pivot_tables_mysql_5.pdf https://codingsight.com/pivot-tables-in-mysql/

【讨论】:

该链接现在似乎可以使用...如果它再次出现故障,请尝试以下操作:Google 的缓存 webcache.googleusercontent.com/… 或 Internet Wayback Machine (web.archive.org/web/20070303120558*/artfulsoftware.com/infotree/queries.php)跨度> 链接可通过此网址访问artfulsoftware.com/infotree/qrytip.php?id=78 还有另一种不使用“if”、“case”或“GROUP_CONCAT”来生成数据透视表的方法:en.wikibooks.org/wiki/MySQL/Pivot_table 您可以从您的 CASE 中删除 ELSE NULL,因为帽子是默认行为(条件聚合已经够罗嗦了)【参考方案2】:

我的解决方案是在 T-SQL 中,没有任何枢轴:

SELECT
    CompanyName,  
    SUM(CASE WHEN (action='EMAIL') THEN 1 ELSE 0 END) AS Email,
    SUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END) AS Print1Pages,
    SUM(CASE WHEN (action='PRINT' AND pagecount=2) THEN 1 ELSE 0 END) AS Print2Pages,
    SUM(CASE WHEN (action='PRINT' AND pagecount=3) THEN 1 ELSE 0 END) AS Print3Pages
FROM 
    Company
GROUP BY 
    CompanyName

【讨论】:

即使在 PostgreSQL 上也适用于我。我更喜欢这种方法而不是在 Postgres 上使用交叉表扩展,因为这是 cleaner “我的解决方案是在没有任何枢轴的 T-SQL 中:” 不仅是 SQL Server,它应该适用于大多数遵循 ANSI SQL 标准的数据库供应商。请注意,SUM() 只能使用数字数据,如果您需要旋转字符串,则必须使用 MAX() 我认为 CASESUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END) 中是不必要的,你可以只做SUM(action='PRINT' AND pagecount=1) 因为条件将转换为1 时为真,0 时假 @kajacx 是的,尽管在没有那种布尔操作的数据库上需要它。如果在“适用于所有 dB 的较长语法”和“仅适用于...的较短语法”之间进行选择,我会选择前者【参考方案3】:

对于 MySQL,您可以直接将条件放在 SUM() 函数中,它将被评估为布尔值 01,因此您可以根据您的条件进行计数,而无需使用 @ 987654327@语句

SELECT
    company_name,  
    SUM(action = 'EMAIL')AS Email,
    SUM(action = 'PRINT' AND pagecount = 1)AS Print1Pages,
    SUM(action = 'PRINT' AND pagecount = 2)AS Print2Pages,
    SUM(action = 'PRINT' AND pagecount = 3)AS Print3Pages
FROM t
GROUP BY company_name

DEMO

【讨论】:

这是一个非常整洁的。您知道这是否符合其他平台(如 Postgres)的标准? @itsols 没有它只适用于 Mysql 特定 @itsols:我添加了另一个standard SQL version。 Postgres 还有一个dedicated crosstab() function. 也适用于 SQLite 这就是我要找的……真的很棒【参考方案4】:

对于动态枢轴,使用GROUP_CONCATCONCAT。 GROUP_CONCAT 函数将一组字符串连接成一个带有各种选项的字符串。

SET @sql = NULL;
SELECT
    GROUP_CONCAT(DISTINCT
    CONCAT(
      'SUM(CASE WHEN action = "',
      action,'"  AND ', 
           (CASE WHEN pagecount IS NOT NULL 
           THEN CONCAT("pagecount = ",pagecount) 
           ELSE pagecount IS NULL END),
      ' THEN 1 ELSE 0 end) AS ',
      action, IFNULL(pagecount,'')

    )
  )
INTO @sql
FROM
  t;

SET @sql = CONCAT('SELECT company_name, ', @sql, ' 
                  FROM t 
                   GROUP BY company_name');

PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;

DEMO HERE

【讨论】:

Pacerier,真正的男人,但动态旋转是最好的方法之一 如果您在“操作”列中有许多值或期望该列表随着时间的推移而增长,这很有效,因为为每个值编写案例语句可能很耗时且难以保持最新状态.【参考方案5】:

使用boolean logic的标准SQL版本:

SELECT company_name
     , COUNT(action = 'EMAIL' OR NULL) AS "Email"
     , COUNT(action = 'PRINT' AND pagecount = 1 OR NULL) AS "Print 1 pages"
     , COUNT(action = 'PRINT' AND pagecount = 2 OR NULL) AS "Print 2 pages"
     , COUNT(action = 'PRINT' AND pagecount = 3 OR NULL) AS "Print 3 pages"
FROM   tbl
GROUP  BY company_name;

SQL Fiddle.

怎么做?

TRUE OR NULL 产生TRUEFALSE OR NULL 产生NULLNULL OR NULL 产生NULL。 而COUNT 只计算非空值。瞧。

【讨论】:

@Erwin,但是你怎么知道有三列呢?如果有5个呢? 10? 20? @Pacerier:问题中的示例似乎表明了这一点。无论哪种方式,SQL 要求 知道返回类型。 完全动态查询是不可能的。如果输出列的数量可以变化,您需要两个步骤:第一个构建查询,第二个:执行它。【参考方案6】:

正确答案是:

select table_record_id,
group_concat(if(value_name='note', value_text, NULL)) as note
,group_concat(if(value_name='hire_date', value_text, NULL)) as hire_date
,group_concat(if(value_name='termination_date', value_text, NULL)) as termination_date
,group_concat(if(value_name='department', value_text, NULL)) as department
,group_concat(if(value_name='reporting_to', value_text, NULL)) as reporting_to
,group_concat(if(value_name='shift_start_time', value_text, NULL)) as shift_start_time
,group_concat(if(value_name='shift_end_time', value_text, NULL)) as shift_end_time
from other_value
where table_name = 'employee'
and is_active = 'y'
and is_deleted = 'n'
GROUP BY table_record_id

【讨论】:

这只是你手头的一个例子吗? other_value 表的结构是什么? “正确答案是:” 很可能不是,因为它缺少 SET 查询以增加默认值,该值在 1024 GROUP_CONCAT 被截断后限制为 1024 GROUP_CONCAT没有错误的字符串意味着可能会发生意外结果.. 抱歉,伙计们不记得更多细节了。我做一些有趣的事情,然后忘记或破坏整个项目。但是当我偶然遇到一个挑战时,我会分享我是如何解决它的。我知道我的例子不是很详细,但我想它可能会为那些知道他们要面对什么的人指明方向:)【参考方案7】:

有一个名为 MySQL Pivot table generator 的工具,它可以帮助您创建基于 Web 的数据透视表,您可以稍后将其导出到 excel(如果您喜欢)。如果您的数据在单个表或多个表中,它可以工作。

您需要做的就是指定列的数据源(它支持动态列),行,表体中的值和表关系(如果有的话)

这个工具的主页是http://mysqlpivottable.net

【讨论】:

【参考方案8】:
select t3.name, sum(t3.prod_A) as Prod_A, sum(t3.prod_B) as Prod_B, sum(t3.prod_C) as    Prod_C, sum(t3.prod_D) as Prod_D, sum(t3.prod_E) as Prod_E  
from
(select t2.name as name, 
case when t2.prodid = 1 then t2.counts
else 0 end  prod_A, 

case when t2.prodid = 2 then t2.counts
else 0 end prod_B,

case when t2.prodid = 3 then t2.counts
else 0 end prod_C,

case when t2.prodid = 4 then t2.counts
else 0 end prod_D, 

case when t2.prodid = "5" then t2.counts
else 0 end prod_E

from 
(SELECT partners.name as name, sales.products_id as prodid, count(products.name) as counts
FROM test.sales left outer join test.partners on sales.partners_id = partners.id
left outer join test.products on sales.products_id = products.id 
where sales.partners_id = partners.id and sales.products_id = products.id group by partners.name, prodid) t2) t3

group by t3.name ;

【讨论】:

【参考方案9】:

一种选择是结合在 MySQL 数据库的聚合中使用 CASE..WHEN 语句是多余的,并考虑所需的动态查询生成 以及为结果集获取正确的列标题,如以下代码块所示:

SET @sql = NULL;

SELECT GROUP_CONCAT(
             CONCAT('SUM( `action` = ''', action, '''',pc0,' ) AS ',action,pc1)
       )
  INTO @sql
  FROM 
  ( 
   SELECT DISTINCT `action`, 
          IF(`pagecount` IS NULL,'',CONCAT('page',`pagecount`)) AS pc1,
          IF(`pagecount` IS NULL,'',CONCAT(' AND `pagecount` = ', pagecount, '')) AS pc0
     FROM `tab` 
    ORDER BY CONCAT(action,pc0) 
  ) t;

SET @sql = CONCAT('SELECT company_name,',@sql,' FROM `tab` GROUP BY company_name'); 
SELECT @sql; 

PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;

Demo

【讨论】:

【参考方案10】:
SELECT company_name, SUM(CASE WHEN ACTION = 'Email' THEN 1 ELSE 0 END) AS "Email",
SUM(CASE WHEN ACTION = 'Print' AND pagecount = 1 THEN 1 ELSE 0 END) AS "print 1 PAGE",
SUM(CASE WHEN ACTION = 'Print' AND pagecount = 2 THEN 1 ELSE 0 END) AS "print 2 PAGE",
SUM(CASE WHEN ACTION = 'Print' AND pagecount = 3 THEN 1 ELSE 0 END) AS "print 2 PAGE"
FROM test1 GROUP BY company_name;

【讨论】:

以上是关于如何在 MySQL 中返回数据透视表输出?的主要内容,如果未能解决你的问题,请参考以下文章

如何在同一资源LARAVEL中返回数据透视表的数据

如何使用codeigniter显示mysql数据透视表数据

Mysql执行数据透视表查询

【MySQL】13|为啥表数据删掉一半,表文件大小不变?

MySQL/MariaDB 如何实现数据透视表

如何从 MYSQL 中的数据透视表中获取最后更新的价格