多个表上的mysql group_concat

Posted

技术标签:

【中文标题】多个表上的mysql group_concat【英文标题】:mysql group_concat on multiple tables 【发布时间】:2019-04-28 00:35:50 【问题描述】:

这是我第一次使用***,……对我温柔一点;)

在映射表上使用多个 JOIN 时,从 GROUP_CONCAT 获取重复结果几乎没有问题。

这个不好解释,但我会尝试:

我创建了一个用于测试的 SQLFiddle:http://sqlfiddle.com/#!9/d2b347/3

我希望所有帖子的查询都只是一个而不是 1,然后对每个测试进行锤击。但由于 GROUP_CONCAT 正在合并这些测试结果,我得到的数据是我想要的两倍。

有可能以某种方式使查询更可靠。要始终让 GROUP_CONCAT 成为确切的测试数?

我期望/希望输出是:

|---------|-----------------|------------|---------|-------------|
| post_id | flows           | flow_types | powers  | power_types |
|---------|-----------------|------------|---------|-------------|
|       1 | 100,140         | a,b        | 1,1     | a,b         |
|---------|-----------------|------------|---------|-------------|
|       2 | 200,200,200     | a,b,c      | (null)  | (null)      |
|---------|-----------------|------------|---------|-------------|

但它是:

|---------|-----------------|------------|---------|-------------|
| post_id | flows           | flow_types | powers  | power_types |
|---------|-----------------|------------|---------|-------------|
|       1 | 100,100,140,140 | a,a,b,b    | 1,1,1,1 | a,b,a,b     |
|---------|-----------------|------------|---------|-------------|
|       2 | 200,200,200     | a,b,c      | (null)  | (null)      |
|---------|-----------------|------------|---------|-------------|

并且使用 GROUP_CONCAT DISTINCT 我得到:

|---------|-----------------|------------|---------|-------------|
| post_id | flows           | flow_types | powers  | power_types |
|---------|-----------------|------------|---------|-------------|
|       1 | 100,140         | a,b        | 1       | a,b         |
|---------|-----------------|------------|---------|-------------|
|       2 | 200             | a,b,c      | (null)  | (null)      |
|---------|-----------------|------------|---------|-------------|

这里是创建查询:

DROP TABLE IF EXISTS `posts`;
CREATE TABLE IF NOT EXISTS `posts` (
  `post_id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
  `post` varchar(256) CHARACTER SET ascii NOT NULL,
  PRIMARY KEY (`post_id`),
  UNIQUE KEY `UNQ_post` (`post`) USING HASH
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

DROP TABLE IF EXISTS `posts_test1`;
CREATE TABLE IF NOT EXISTS `posts_test1` (
  `post_id` bigint(20) unsigned NOT NULL,
  `test1_id` bigint(20) unsigned NOT NULL,
  `type_id` int(10) unsigned NOT NULL DEFAULT 1,
  PRIMARY KEY (`post_id`,`test1_id`,`type_id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

DROP TABLE IF EXISTS `test1`;
CREATE TABLE IF NOT EXISTS `test1` (
  `test1_id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
  `flow` int(10) unsigned NOT NULL,
  PRIMARY KEY (`test1_id`),
  KEY `IDX_FLOW` (`flow`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

DROP TABLE IF EXISTS `posts_test2`;
CREATE TABLE IF NOT EXISTS `posts_test2` (
  `post_id` bigint(20) unsigned NOT NULL,
  `test2_id` bigint(20) unsigned NOT NULL,
  `type_id` int(10) unsigned NOT NULL DEFAULT 1,
  PRIMARY KEY (`post_id`,`test2_id`,`type_id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

DROP TABLE IF EXISTS `test2`;
CREATE TABLE IF NOT EXISTS `test2` (
  `test2_id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
  `power` int(10) unsigned NOT NULL,
  PRIMARY KEY (`test2_id`),
  KEY `IDX_POWER` (`power`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

DROP TABLE IF EXISTS `types`;
CREATE TABLE IF NOT EXISTS `types` (
  `type_id` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `type` varchar(50) CHARACTER SET ascii DEFAULT NULL,
  PRIMARY KEY (`type_id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;


INSERT INTO `types` (`type_id`, `type`) VALUES
  (1, 'a'),
  (2, 'b'),
  (3, 'c');

INSERT INTO `posts` (`post_id`, `post`) VALUES
  (1, 'test1'),
  (2, 'test2');

INSERT INTO `test1` (`test1_id`, `flow`) VALUES
  (1, 100),
  (2, 140),
  (3, 200),
  (4, 200),
  (5, 200);

INSERT INTO `posts_test1` (`post_id`, `test1_id`, `type_id`) VALUES
  (1, 1, 1),
  (1, 2, 2),
  (2, 3, 1),
  (2, 4, 2),
  (2, 5, 3);

INSERT INTO `test2` (`test2_id`, `power`) VALUES
  (1, 1),
  (2, 1);

INSERT INTO `posts_test2` (`post_id`, `test2_id`, `type_id`) VALUES
  (1, 1, 1),
  (1, 2, 2);

这是我的选择查询..

SELECT
p.post_id, p.post,
GROUP_CONCAT(t1.flow) flow,
GROUP_CONCAT(t1t.type) flow_types
FROM posts p
LEFT JOIN posts_test1 pt1 USING (post_id)
    LEFT JOIN test1 t1 USING (test1_id)
        LEFT JOIN types t1t ON (t1t.type_id = pt1.type_id)
GROUP BY p.post_id; # works fine


SELECT
p.post_id, p.post,
GROUP_CONCAT(t2.power) powers,
GROUP_CONCAT(t2t.type) power_types
FROM posts p
LEFT JOIN posts_test2 pt2 USING (post_id)
    LEFT JOIN test2 t2 USING (test2_id)
        LEFT JOIN types t2t ON (t2t.type_id = pt2.type_id)
GROUP BY p.post_id; # works fine


SELECT
p.post_id, p.post,
GROUP_CONCAT(t1.flow) flow,
GROUP_CONCAT(t1t.type) flow_types,
GROUP_CONCAT(t2.power) powers,
GROUP_CONCAT(t2t.type) power_types
FROM posts p
LEFT JOIN posts_test1 pt1 USING (post_id)
    LEFT JOIN test1 t1 USING (test1_id)
        LEFT JOIN types t1t ON (t1t.type_id = pt1.type_id)
LEFT JOIN posts_test2 pt2 USING (post_id)
    LEFT JOIN test2 t2 USING (test2_id)
        LEFT JOIN types t2t ON (t2t.type_id = pt2.type_id)
GROUP BY p.post_id; # getting duplicated GROUP_CONCAT results

SELECT
p.post_id, p.post,
GROUP_CONCAT(DISTINCT t1.flow) flow,
GROUP_CONCAT(DISTINCT t1t.type) flow_types,
GROUP_CONCAT(DISTINCT t2.power) powers,
GROUP_CONCAT(DISTINCT t2t.type) power_types
FROM posts p
LEFT JOIN posts_test1 pt1 USING (post_id)
    LEFT JOIN test1 t1 USING (test1_id)
        LEFT JOIN types t1t ON (t1t.type_id = pt1.type_id)
LEFT JOIN posts_test2 pt2 USING (post_id)
    LEFT JOIN test2 t2 USING (test2_id)
        LEFT JOIN types t2t ON (t2t.type_id = pt2.type_id)
GROUP BY p.post_id; # DISTINCT wipes the GROUP_CONCAT if same result...

谢谢,祝你有美好的一天!

编辑:按照建议添加预期结果,谢谢:)

【问题讨论】:

请将表格格式的预期输出添加到问题中。顺便说一句,在问题表述上做得很好:) 感谢@MadhurBhaiya 添加了预期的结果:) 【参考方案1】:

这里的问题是有两个不同的联结表(和两个不同的连接链),源自一个表post。所以线性JOIN 链不起作用。当线性连接完成时,其中一个连接表中的重复会导致其他链中的重复。

一种方法是在两个单独的Derived Tables(FROM 子句中的子查询)中考虑这两个不同的JOIN 链,并确定它们各自的分组/聚合表达式。然后我们可以使用post_idJOIN 返回这两条链。

查询

SELECT
  dt1.post_id, 
  dt1.flows, 
  dt1.flow_types, 
  dt2.powers, 
  dt2.power_types 
FROM 
(
  SELECT 
    p.post_id, 
    GROUP_CONCAT(t1.flow) AS flows, 
    GROUP_CONCAT(typ.type) AS flow_types
  FROM posts p
  LEFT JOIN posts_test1 pt1 
    ON pt1.post_id = p.post_id 
  LEFT JOIN test1 t1 
    ON t1.test1_id = pt1.test1_id 
  LEFT JOIN types typ 
    ON typ.type_id = pt1.type_id 
  GROUP BY p.post_id 
) AS dt1 
JOIN 
(
  SELECT 
    p.post_id, 
    GROUP_CONCAT(t2.power) AS powers, 
    GROUP_CONCAT(typ.type) AS power_types 
  FROM posts p
  LEFT JOIN posts_test2 pt2 
    ON pt2.post_id = p.post_id 
  LEFT JOIN test2 t2 
    ON t2.test2_id = pt2.test2_id 
  LEFT JOIN types typ 
    ON typ.type_id = pt2.type_id 
  GROUP BY p.post_id 
) AS dt2
  ON dt1.post_id = dt2.post_id;

结果

| post_id | flows       | flow_types | powers | power_types |
| ------- | ----------- | ---------- | ------ | ----------- |
| 1       | 100,140     | a,b        | 1,1    | a,b         |
| 2       | 200,200,200 | a,b,c      |        |             |

View on DB Fiddle

【讨论】:

感谢 Madhur :) 我希望避免使用子查询,因为我需要做的不仅仅是 2 个“映射连接” @TLBang 我不相信不使用子查询就可以解决;由于不同的连接链。其他可能的解决方案将涉及相关子查询。 @TLBang 编写大型查询应该不是问题,只要它是高性能的(定义了正确的索引)并且可以完成工作。

以上是关于多个表上的mysql group_concat的主要内容,如果未能解决你的问题,请参考以下文章

多个表上的mysql group_concat

具有多个表的联结表上的 MySQL SELECT 查询

Mysql在同一张表上的多个左连接

SUM GROUP BY与多个表上的子查询

MySQL join 与关系表上的匹配

MySQL:从另一个表中的值“修补”表上的现有数据