MySQL分组查询后如何获取每组的前N条数据,你会吗?
Posted 程序员实战基地
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySQL分组查询后如何获取每组的前N条数据,你会吗?相关的知识,希望对你有一定的参考价值。
CREATE TABLE `course_type` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(255) CHARACTER SET utf8mb4 NOT NULL COMMENT '类型名',
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='课程类型';
(2)课程信息表:
CREATE TABLE `course` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`type_id` int(11) NOT NULL COMMENT '类型id',
`name` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL COMMENT '课程名称',
`scan_total` int(255) DEFAULT NULL COMMENT '课程浏览量',
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='课程信息表';
现在的需求为:找出每种课程类型中课程浏览量排名前3的课程记录 ,而这种场景经常可以在一些在线教育平台中见到,如下图所示为某个在线教育平台中“后端开发”这一大类型里面每种小分类的课程销量排行榜:
接下来,我们将找寻各种方式去实现这一功能需求!
(1)传统的实现方式一般是采用Java代码的方式先查询出每种课程类型数据,然后再遍历每一种课程类型,在课程表中根据课程类型匹配查询出浏览量前3的课程数据,即 type_id=xx order by scan_total desclimit 3;
其代码实现方式在这里就不贴出来了,感兴趣的小伙伴可以自己动手撸一撸!
此种实现方式最终固然可以实现功能需求,但是,有一个不好的地方在于需要在遍历每一种课程类型时不断发出查询课程数据列表的SQL,如果课程类型有10几种,而每一种需要取几十、甚至几百条数据,那将耗费很大的资源(建立数据库链接是需要耗资源的:内存、CPU、网络、磁盘…)
(2)因此,我们转而求其次,采用SQL查询一次性来搞定!在进行实操之前,debug建议诸位先打开Navicat尝试撸一撸,然后再回过头来看看debug提供的实现方式.
为了实现这种功能,我们需要转换下思考的角度:仔细阅读需求,可以得知它是需要我们查找出每种课程类型下课程浏览量前3的课程列表,其实就是找出每个课程在同种课程类型下的浏览量排名,最后再找出每种课程类型下排名前3的课程!
如下图所示为课程信息表,其中,最后一列为debug自己计算出的每个课程在同种课程类型下课程列表中的排名,即top值:
朝着上图这个方向努力了,我们撸出了相应的SQL,如下所示:
SELECT
a.id,
a.type_id,
c.`name` AS typeName,
a.scan_total,
a.`name`,
(
SELECT
COUNT(b.id)
FROM
course AS b
WHERE
b.type_id = a.type_id
AND b.scan_total > a.scan_total
) AS top
FROM
course AS a
LEFT JOIN course_type AS c ON c.id = a.type_id
ORDER BY
a.type_id ASC,
a.scan_total DESC;
执行上述SQL后得到的结果如下图所示:
(3)到这里我们已经将每种类型下每个课程的排名top计算出来了,需要注意的是,在上图得到的结果中,因为Count(b.id) 得到的值可能为 0 ,因此0代表的就是第 1 名;
可能有些小伙伴还有些疑惑,为什么加个子查询就可以得到上图中的结果呢?其执行过程是怎么样的呢?OK,一图以蔽之,直接看下图相信就可以解答你心中的疑惑了:
(4)最后是直接在外层嵌一个大的查询,然后取排名值 top < 3 的数据列表,即可以得到实现功能需求,其完整的SQL如下所示:
SELECT
t.*
FROM
(
SELECT
a.id,
a.type_id,
c.`name` AS typeName,
a.scan_total,
a.`name`,
(
SELECT
COUNT(b.id)
FROM
course AS b
WHERE
b.type_id = a.type_id
AND b.scan_total > a.scan_total
) AS top
FROM
course AS a
LEFT JOIN course_type AS c ON c.id = a.type_id
ORDER BY
a.type_id ASC,
a.scan_total DESC
) AS t
WHERE
t.top < 3
执行上述SQL后即可以得到相应的结果,如下图所示:
至此,我们已经完成了本文开头提出来的功能需求;那……还有没有其他的实现方式呢?当然有,只不过其实现起来虽然不同,但是其本质思想跟本文开头debug提到的那样“计算出排名top值”是差不多的;
诺,这就是另外的实现方式,从SQL语句就可以看出来,它是上述第一种实现方式的变形:
SELECT
t.*
FROM
course AS t
WHERE
(
SELECT
COUNT(*)
FROM
course AS c
WHERE
c.type_id = t.type_id
AND c.scan_total > t.scan_total
) < 3
ORDER BY
t.type_id ASC,
t.scan_total DESC
OK,本文讲解到此介绍,打完收工,咱们下期再见!
debug最近又出了一本新书:《SpringBoot企业级项目-入门到精通》感兴趣的小伙伴可以前往各大商城平台(淘宝、天猫、当当、京东等)一睹为快!
书籍的封面如下所示,后续debug会专门出篇文章专门介绍这本书。目前,新书已在淘宝(天猫)预售啦!(预售发货时间2021年1月18日)
复制以下链接在PC端打开就可以啦:
https://detail.tmall.com/item.htm?id=633871736552
debug的新书:
《SpringBoot企业级项目-入门到精通》
Debug微信:debug0868
以上是关于MySQL分组查询后如何获取每组的前N条数据,你会吗?的主要内容,如果未能解决你的问题,请参考以下文章