如何在 MySQL 中返回数据透视表输出?
Posted
技术标签:
【中文标题】如何在 MySQL 中返回数据透视表输出?【英文标题】:How can I return pivot table output in MySQL? 【发布时间】:2011-10-06 13:20:14 【问题描述】:如果我的 mysql 表看起来像这样:
company_name 操作页数 ------------------------------------------- 公司 A 打印 3 公司 A 打印 2 公司 A 打印 3 B公司邮箱 公司 B 打印 2 公司 B 打印 2 公司 B 打印 1 公司 A 打印 3是否可以运行 MySQL 查询以获得如下输出:
company_name EMAIL 打印 1 页 打印 2 页 打印 3 页 -------------------------------------------------- ------------ A公司 0 0 1 3 B公司 1 1 2 0这个想法是 pagecount
可以变化,因此输出列的数量应该反映这一点,每个 action
/pagecount
对对应一列,然后每个 company_name
的命中数。我不确定这是否称为数据透视表,但有人建议这样做?
【问题讨论】:
这称为旋转,在 SQL 之外进行这种转换要快得多。 Excel 会处理这样的事情,在 MySQL 中真的很难,因为没有“CROSSTAB”运算符 :( 是的,它目前是在 Excel 中手动完成的,我们正在尝试将其自动化。 @N.B.是建议在我们的应用层执行它还是在我们的应用层执行它更简单? @giannischristofakis - 这真的取决于你和你的同事认为什么更简单。自从我发表评论(4 年)以来,技术已经赶上了很多,所以它完全取决于你觉得更好 - 无论是在应用程序还是 SQL 中。例如,在我的工作中,我们处理类似的问题,但我们将 SQL 和应用内方法结合起来。基本上,除了给出固执己见的答案之外,我无能为力,这不是你所需要的:) 【参考方案1】:这基本上是一个数据透视表。
可以在此处找到有关如何实现此目的的精彩教程:http://www.artfulsoftware.com/infotree/qrytip.php?id=78
我建议阅读这篇文章并根据您的需求调整此解决方案。
更新
在上面的链接目前不再可用之后,我觉得有义务为所有在这里搜索 mysql pivot 答案的人提供一些额外的信息。它确实有大量的信息,我不会把那里的所有东西都放在这里(甚至更多,因为我只是不想复制他们的大量知识),但我会就如何处理枢轴提供一些建议用首先提出问题的 peku 的示例来概括 sql 方式。
也许链接很快就会恢复,我会留意它。
电子表格方式...
许多人只是为此目的使用 MSExcel、OpenOffice 或其他电子表格工具等工具。这是一个有效的解决方案,只需复制那里的数据并使用 GUI 提供的工具来解决这个问题。
但是...这不是问题所在,它甚至可能导致一些缺点,例如如何将数据放入电子表格、有问题的缩放等等。
SQL 方式...
鉴于他的桌子看起来像这样:
CREATE TABLE `test_pivot` (
`pid` bigint(20) NOT NULL AUTO_INCREMENT,
`company_name` varchar(32) DEFAULT NULL,
`action` varchar(16) DEFAULT NULL,
`pagecount` bigint(20) DEFAULT NULL,
PRIMARY KEY (`pid`)
) ENGINE=MyISAM;
现在查看他/她想要的表:
company_name EMAIL PRINT 1 pages PRINT 2 pages PRINT 3 pages
-------------------------------------------------------------
CompanyA 0 0 1 3
CompanyB 1 1 2 0
行(EMAIL
、PRINT x pages
)类似于条件。主要分组是company_name
。
为了设置条件,这需要使用CASE
-statement。为了按某事分组,好吧,使用... GROUP BY
。
提供此数据透视的基本 SQL 可能如下所示:
SELECT P.`company_name`,
COUNT(
CASE
WHEN P.`action`='EMAIL'
THEN 1
ELSE NULL
END
) AS 'EMAIL',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '1'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 1 pages',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '2'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 2 pages',
COUNT(
CASE
WHEN P.`action`='PRINT' AND P.`pagecount` = '3'
THEN P.`pagecount`
ELSE NULL
END
) AS 'PRINT 3 pages'
FROM test_pivot P
GROUP BY P.`company_name`;
这应该会很快提供所需的结果。这种方法的主要缺点是,您希望数据透视表中的行越多,您需要在 SQL 语句中定义的条件就越多。
这也可以处理,因此人们倾向于使用准备好的语句、例程、计数器等。
有关此主题的一些附加链接:
http://anothermysqldba.blogspot.de/2013/06/pivot-tables-example-in-mysql.html http://www.codeproject.com/Articles/363339/Cross-Tabulation-Pivot-Tables-with-MySQL http://datacharmer.org/downloads/pivot_tables_mysql_5.pdf https://codingsight.com/pivot-tables-in-mysql/【讨论】:
该链接现在似乎可以使用...如果它再次出现故障,请尝试以下操作:Google 的缓存 webcache.googleusercontent.com/… 或 Internet Wayback Machine (web.archive.org/web/20070303120558*/artfulsoftware.com/infotree/queries.php)跨度> 链接可通过此网址访问artfulsoftware.com/infotree/qrytip.php?id=78 还有另一种不使用“if”、“case”或“GROUP_CONCAT”来生成数据透视表的方法:en.wikibooks.org/wiki/MySQL/Pivot_table 您可以从您的 CASE 中删除 ELSE NULL,因为帽子是默认行为(条件聚合已经够罗嗦了)【参考方案2】:我的解决方案是在 T-SQL 中,没有任何枢轴:
SELECT
CompanyName,
SUM(CASE WHEN (action='EMAIL') THEN 1 ELSE 0 END) AS Email,
SUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END) AS Print1Pages,
SUM(CASE WHEN (action='PRINT' AND pagecount=2) THEN 1 ELSE 0 END) AS Print2Pages,
SUM(CASE WHEN (action='PRINT' AND pagecount=3) THEN 1 ELSE 0 END) AS Print3Pages
FROM
Company
GROUP BY
CompanyName
【讨论】:
即使在 PostgreSQL 上也适用于我。我更喜欢这种方法而不是在 Postgres 上使用交叉表扩展,因为这是 cleaner “我的解决方案是在没有任何枢轴的 T-SQL 中:” 不仅是 SQL Server,它应该适用于大多数遵循 ANSI SQL 标准的数据库供应商。请注意,SUM()
只能使用数字数据,如果您需要旋转字符串,则必须使用 MAX()
我认为 CASE 在SUM(CASE WHEN (action='PRINT' AND pagecount=1) THEN 1 ELSE 0 END)
中是不必要的,你可以只做SUM(action='PRINT' AND pagecount=1)
因为条件将转换为1
时为真,0
时假
@kajacx 是的,尽管在没有那种布尔操作的数据库上需要它。如果在“适用于所有 dB 的较长语法”和“仅适用于...的较短语法”之间进行选择,我会选择前者【参考方案3】:
对于 MySQL,您可以直接将条件放在 SUM()
函数中,它将被评估为布尔值 0
或 1
,因此您可以根据您的条件进行计数,而无需使用 @ 987654327@语句
SELECT
company_name,
SUM(action = 'EMAIL')AS Email,
SUM(action = 'PRINT' AND pagecount = 1)AS Print1Pages,
SUM(action = 'PRINT' AND pagecount = 2)AS Print2Pages,
SUM(action = 'PRINT' AND pagecount = 3)AS Print3Pages
FROM t
GROUP BY company_name
DEMO
【讨论】:
这是一个非常整洁的。您知道这是否符合其他平台(如 Postgres)的标准? @itsols 没有它只适用于 Mysql 特定 @itsols:我添加了另一个standard SQL version。 Postgres 还有一个dedicatedcrosstab()
function.
也适用于 SQLite
这就是我要找的……真的很棒【参考方案4】:
对于动态枢轴,使用GROUP_CONCAT
和CONCAT
。
GROUP_CONCAT 函数将一组字符串连接成一个带有各种选项的字符串。
SET @sql = NULL;
SELECT
GROUP_CONCAT(DISTINCT
CONCAT(
'SUM(CASE WHEN action = "',
action,'" AND ',
(CASE WHEN pagecount IS NOT NULL
THEN CONCAT("pagecount = ",pagecount)
ELSE pagecount IS NULL END),
' THEN 1 ELSE 0 end) AS ',
action, IFNULL(pagecount,'')
)
)
INTO @sql
FROM
t;
SET @sql = CONCAT('SELECT company_name, ', @sql, '
FROM t
GROUP BY company_name');
PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;
DEMO HERE
【讨论】:
Pacerier,真正的男人,但动态旋转是最好的方法之一 如果您在“操作”列中有许多值或期望该列表随着时间的推移而增长,这很有效,因为为每个值编写案例语句可能很耗时且难以保持最新状态.【参考方案5】:使用boolean logic的标准SQL版本:
SELECT company_name
, COUNT(action = 'EMAIL' OR NULL) AS "Email"
, COUNT(action = 'PRINT' AND pagecount = 1 OR NULL) AS "Print 1 pages"
, COUNT(action = 'PRINT' AND pagecount = 2 OR NULL) AS "Print 2 pages"
, COUNT(action = 'PRINT' AND pagecount = 3 OR NULL) AS "Print 3 pages"
FROM tbl
GROUP BY company_name;
SQL Fiddle.
怎么做?
TRUE OR NULL
产生TRUE
。FALSE OR NULL
产生NULL
。NULL OR NULL
产生NULL
。
而COUNT
只计算非空值。瞧。
【讨论】:
@Erwin,但是你怎么知道有三列呢?如果有5个呢? 10? 20? @Pacerier:问题中的示例似乎表明了这一点。无论哪种方式,SQL 要求 知道返回类型。 完全动态查询是不可能的。如果输出列的数量可以变化,您需要两个步骤:第一个构建查询,第二个:执行它。【参考方案6】:正确答案是:
select table_record_id,
group_concat(if(value_name='note', value_text, NULL)) as note
,group_concat(if(value_name='hire_date', value_text, NULL)) as hire_date
,group_concat(if(value_name='termination_date', value_text, NULL)) as termination_date
,group_concat(if(value_name='department', value_text, NULL)) as department
,group_concat(if(value_name='reporting_to', value_text, NULL)) as reporting_to
,group_concat(if(value_name='shift_start_time', value_text, NULL)) as shift_start_time
,group_concat(if(value_name='shift_end_time', value_text, NULL)) as shift_end_time
from other_value
where table_name = 'employee'
and is_active = 'y'
and is_deleted = 'n'
GROUP BY table_record_id
【讨论】:
这只是你手头的一个例子吗?other_value
表的结构是什么?
“正确答案是:” 很可能不是,因为它缺少 SET
查询以增加默认值,该值在 1024 GROUP_CONCAT 被截断后限制为 1024 GROUP_CONCAT没有错误的字符串意味着可能会发生意外结果..
抱歉,伙计们不记得更多细节了。我做一些有趣的事情,然后忘记或破坏整个项目。但是当我偶然遇到一个挑战时,我会分享我是如何解决它的。我知道我的例子不是很详细,但我想它可能会为那些知道他们要面对什么的人指明方向:)【参考方案7】:
有一个名为 MySQL Pivot table generator 的工具,它可以帮助您创建基于 Web 的数据透视表,您可以稍后将其导出到 excel(如果您喜欢)。如果您的数据在单个表或多个表中,它可以工作。
您需要做的就是指定列的数据源(它支持动态列),行,表体中的值和表关系(如果有的话)
这个工具的主页是http://mysqlpivottable.net
【讨论】:
【参考方案8】:select t3.name, sum(t3.prod_A) as Prod_A, sum(t3.prod_B) as Prod_B, sum(t3.prod_C) as Prod_C, sum(t3.prod_D) as Prod_D, sum(t3.prod_E) as Prod_E
from
(select t2.name as name,
case when t2.prodid = 1 then t2.counts
else 0 end prod_A,
case when t2.prodid = 2 then t2.counts
else 0 end prod_B,
case when t2.prodid = 3 then t2.counts
else 0 end prod_C,
case when t2.prodid = 4 then t2.counts
else 0 end prod_D,
case when t2.prodid = "5" then t2.counts
else 0 end prod_E
from
(SELECT partners.name as name, sales.products_id as prodid, count(products.name) as counts
FROM test.sales left outer join test.partners on sales.partners_id = partners.id
left outer join test.products on sales.products_id = products.id
where sales.partners_id = partners.id and sales.products_id = products.id group by partners.name, prodid) t2) t3
group by t3.name ;
【讨论】:
【参考方案9】:一种选择是结合在 MySQL 数据库的聚合中使用 CASE..WHEN
语句是多余的,并考虑所需的动态查询生成 以及为结果集获取正确的列标题,如以下代码块所示:
SET @sql = NULL;
SELECT GROUP_CONCAT(
CONCAT('SUM( `action` = ''', action, '''',pc0,' ) AS ',action,pc1)
)
INTO @sql
FROM
(
SELECT DISTINCT `action`,
IF(`pagecount` IS NULL,'',CONCAT('page',`pagecount`)) AS pc1,
IF(`pagecount` IS NULL,'',CONCAT(' AND `pagecount` = ', pagecount, '')) AS pc0
FROM `tab`
ORDER BY CONCAT(action,pc0)
) t;
SET @sql = CONCAT('SELECT company_name,',@sql,' FROM `tab` GROUP BY company_name');
SELECT @sql;
PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;
Demo
【讨论】:
【参考方案10】:SELECT company_name, SUM(CASE WHEN ACTION = 'Email' THEN 1 ELSE 0 END) AS "Email",
SUM(CASE WHEN ACTION = 'Print' AND pagecount = 1 THEN 1 ELSE 0 END) AS "print 1 PAGE",
SUM(CASE WHEN ACTION = 'Print' AND pagecount = 2 THEN 1 ELSE 0 END) AS "print 2 PAGE",
SUM(CASE WHEN ACTION = 'Print' AND pagecount = 3 THEN 1 ELSE 0 END) AS "print 2 PAGE"
FROM test1 GROUP BY company_name;
【讨论】:
以上是关于如何在 MySQL 中返回数据透视表输出?的主要内容,如果未能解决你的问题,请参考以下文章