这一周都被客户搞得很惨.... 项目主流程不推进, 尽搞一些无关紧要的事情, 什么界面 ui 美化, 增加什么按钮进度条, 模糊查询...各种乱七八糟的需求, 挡都挡不住呀... 真的是把我当全栈使了, 数据库, 建表; 填报页面, 数据清洗, ui 美化, 权限配置 sql ... 真的太难了.... 发现核心呢, 还是 sql 的比重特别大, 像我们现在数据分析用的 BI 工具, 就是 以 SQL为基础的. 反而, 用 Pyhton 的地方却是很少, 跟我之前的项目差别很大, 这里用Pyhton 就只是一些做数据清洗的事情, 如过滤数据中的特殊字符 (正则) , 类型转换, 顺序调整的... 核心竞争还是 sql 呀. 果然 sql 非常强大. 继续练习呀...
表关系
我平时遇到的一些复杂些的业务场景, 基本也跟着几张表, 背后的相同逻辑所演变的. 都差不多的其实.
需求 01
查询各科成绩最高分, 最低分和平均分; 显示需求如下:
课程id, 课程 name, 最高分, 最低分, 平均分, 及格率, 中等率, 优良率, 优秀率
及格 >= 60; 中等:70-80; 优良: 80-90; 优秀: >=90
分析
目测会用到 group by case when ...
首先来查询, 课程的最高, 最低, 平均分的 (聚合函数, 肯定是结合 group by)
select
a.c_id,
b.c_name,
max(a.score),
min(a.score),
avg(a.score)
from score as a
-- 课程 name 是需要关联课程表才能拿到
inner join course as b
on a.c_id = b.c_id
group by a.c_id, b.c_name
+------+--------+--------------+--------------+--------------+
| c_id | c_name | max(a.score) | min(a.score) | avg(a.score) |
+------+--------+--------------+--------------+--------------+
| 0001 | 语文 | 80 | 80 | 80.0000 |
| 0002 | 数学 | 90 | 60 | 76.6667 |
| 0003 | 英语 | 99 | 80 | 86.3333 |
+------+--------+--------------+--------------+--------------+
3 rows in set (0.01 sec)
这一部分其实还好, 就是基本的 group by 再聚合而已.
接着来算这些什么中等率, 优良率, 优秀率.. 就有些头疼了. 率, 是要用 目标人数 / 总人数 这样的方式. 立马会想到用 count 但, 这里多条件判断嘛, 必然会用 case when 来处理呀. 其实呢, 用 sum 可能会更加普遍一点. 满足条件就舌标记为1, 否则标记 0 这样的方式.
select
a.c_id,
b.c_name,
max(a.score),
min(a.score),
avg(a.score),
-- 及格率
sum(case when a.score >= 60 then 1 else 0 end) / count(a.s_id) "及格率",
-- 中等率
sum(case when a.score >= 70 and a.score < 80 then 1 else 0 end) / count(a.s_id) "中等率",
-- 优良率
sum(case when a.score >= 80 and a.score < 90 then 1 else 0 end) / count(a.s_id) "优良率",
-- 优秀率
sum(case when a.score >= 90 then 1 else 0 end) / count(a.s_id) as "优秀率"
from score as a
-- 课程 name 是需要关联课程表才能拿到
inner join course as b
on a.c_id = b.c_id
group by c_id, c_name
这个例子的关键点, 首先还是基于分组, 聚合 的用法, 中间过程呢, 会涉及表的拼接(inner join). 然后是 case when 可用来做条件计数 这个感觉蛮厉害的, 我其实在工作中都没用过. 类似的我都用 Python 来搞了, 没想到这 sql 原来还这么强大的哦.
需求 02
查询学生的总成绩, 并进行排名
分析
一个基础送分题, 按 s_id 分组, 对 score 统计即可.
select
s_id as "学号",
sum(score) as "总成绩"
from score
group by s_id
+--------+-----------+
| 学号 | 总成绩 |
+--------+-----------+
| 0001 | 269 |
| 0002 | 140 |
| 0003 | 240 |
+--------+-----------+
3 rows in set (0.00 sec)
mysql>
然后排序一波即可. (把姓名也 inner join 过来顺带)
select
a.s_id as "学号",
b.s_name as "姓名",
sum(a.score) as "总成绩"
from score as a
-- 学生信息帖过来
inner join student as b
on a.s_id = b.s_id
group by a.s_id, b.s_name
order by sum(score) desc
+--------+-----------+-----------+
| 学号 | 姓名 | 总成绩 |
+--------+-----------+-----------+
| 0001 | 王二 | 269 |
| 0003 | 胡小适 | 240 |
| 0002 | 星落 | 140 |
+--------+-----------+-----------+
3 rows in set (0.00 sec)
-- 这一句感觉怪怪的, 应该用上面别名的.
order by sum(score) desc
最后修改如下:
select
a.s_id as 学号,
b.s_name as 姓名,
sum(a.score) as 总成绩
from score as a
-- 学生信息帖过来
inner join student as b
on a.s_id = b.s_id
group by a.s_id, b.s_name
order by 总成绩 desc
+--------+-----------+-----------+
| 学号 | 姓名 | 总成绩 |
+--------+-----------+-----------+
| 0001 | 王二 | 269 |
| 0003 | 胡小适 | 240 |
| 0002 | 星落 | 140 |
+--------+-----------+-----------+
3 rows in set (0.00 sec)
可以, 发现, 在 mysql 中, 可以直接用 中文 作为别名.
小结
- sum(case when ..then 1 else 0 end) 可以用来进行 条件计数哦 (配合 group by )
- 表 join 可以在中途进行, 理清楚 sql 的执行顺序即可 from > on > join > where > group by > having > select > distinct > order by
- 发现 mysql 中, 别名可以直接使用中文, 比如 之前是 xxx as "总成绩", 也可直接 xxx as 总成绩 .