MySQL关联查询 COUNT数据不准确

Posted 爱叨叨的程序狗

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySQL关联查询 COUNT数据不准确相关的知识,希望对你有一定的参考价值。

前提

在业务开发中常遇到关联查询使用count()函数做统计的需求,同样在使用该函数时如果处理不当会导致统计出的数据是真实数据N倍的问题,出现重复问题导致统计不准确。出现该问题的原因是关联查询的主表与关联表关联关系不是一对一而是一对多的关系。

demo数据

以本demo为例,owners表表示车主,vehicle表表示车辆,以下为基础建表语句:

DROP TABLE IF EXISTS `owners`;
CREATE TABLE `owners` (
  `id` int NOT NULL AUTO_INCREMENT,
  `name` varchar(32) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

INSERT INTO `owners` VALUES (1, '张三');
INSERT INTO `owners` VALUES (2, '李四');
INSERT INTO `owners` VALUES (3, '王五');

DROP TABLE IF EXISTS `vehicle`;
CREATE TABLE `vehicle` (
  `id` int NOT NULL AUTO_INCREMENT,
  `brand` varchar(32) DEFAULT NULL,
  `owner_id` int DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

INSERT INTO `vehicle` VALUES (1, '大众', 1);
INSERT INTO `vehicle` VALUES (2, '比亚迪', 2);
INSERT INTO `vehicle` VALUES (3, '奥迪', 1);
INSERT INTO `vehicle` VALUES (4, '大众', 2);
INSERT INTO `vehicle` VALUES (5, '比亚迪', 1);

表关系

车主和车辆的关系为1:N,两表通过own_id关联。

查询语句:

查询车主的姓名和统计功能。

select o.name,count(o.id)
from owners o
         left join vehicle v on v.owner_id = o.id
group by o.id;

查询结果:

张三有三辆车,李四两辆,王五无车,可见统计方法出现了重复统计。

问题出现的原因

mysql在进行关联查询时,首先扫描主表,以主表为基础数据通过on条件匹配关联表数据。on v.owner_id = o.id条件会匹配到张三的车辆表3条数据。

解决方案

使用count()函数同时使用去重DISTINCT方法去重。

select o.name, count(distinct o.id)
from owners o
         left join vehicle v on v.owner_id = o.id
group by o.id;

以上是关于MySQL关联查询 COUNT数据不准确的主要内容,如果未能解决你的问题,请参考以下文章

left join关联查询一对多数据重复问题解决方案

车辆识别代码查车型是哪个软件

MYSQL性能调优06_分页查询优化JOIN关联查询优化in和exsits优化count(*)查询优化

自动驾驶数据到底该归谁?

快充的不同路线和技术升级,给车主带来的充电烦恼和车辆贬值损失

pdi检测记录哪里查