SQL数据分析:从基础入门到进阶,提升SQL能力
Posted Lucifer三思而后行
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SQL数据分析:从基础入门到进阶,提升SQL能力相关的知识,希望对你有一定的参考价值。
📚 前言
SQL语言有40多年的历史,从它被应用至今几乎无处不在。我们消费的每一笔支付记录,收集的每一条用户信息,发出去的每一条消息,都会使用数据库或与其相关的产品来存储,而操纵数据库的语言正是 SQL !
SQL 对于现在的互联网公司生产研发等岗位几乎是一个必备技能,如果不会 SQL 的话,可能什么都做不了。你可以把 SQL 当做是一种工具,利用它可以帮助你完成你的工作,创造价值。
点我跳转文末 领书,新出版的 《SQL数据分析:从基础破冰到面试题解》!
本篇文章
点赞
+收藏
+评论
!皆可参与送书活动!
🌴 SQL 介绍
🌼 什么是 SQL
SQL 是用于访问和处理数据库的标准的计算机语言。
- SQL 指结构化查询语言
- SQL 使我们有能力访问数据库
- SQL 是一种 ANSI 的标准计算机语言
SQL 可与数据库程序协同工作,比如 MS Access、DB2、Informix、MS SQL Server、Oracle、Sybase 以及其他数据库系统。但是由于各种各样的数据库出现,导致很多不同版本的 SQL 语言,为了与 ANSI 标准相兼容,它们必须以相似的方式共同地来支持一些主要的关键词(比如 SELECT、UPDATE、DELETE、INSERT、WHERE 等等),这些就是我们要学习的SQL基础。
🌀 SQL 的类型
可以把 SQL 分为两个部分:数据操作语言 (DML) 和 数据定义语言 (DDL)。
- 数据查询语言(DQL: Data Query Language)
- 数据操纵语言(DML:Data Manipulation Language)
🌵 学习 SQL 的作用
SQL 是一门 ANSI 的标准计算机语言,用来访问和操作数据库系统。SQL 语句用于取回和更新数据库中的数据。
- SQL 面向数据库执行查询
- SQL 可从数据库取回数据
- SQL 可在数据库中插入新的记录
- SQL 可更新数据库中的数据
- SQL 可从数据库删除记录
- SQL 可创建新数据库
- SQL 可在数据库中创建新表
- SQL 可在数据库中创建存储过程
- SQL 可在数据库中创建视图
- SQL 可以设置表、存储过程和视图的权限
🍄 数据库是什么
顾名思义,你可以理解为数据库是用来存放数据的一个容器。
打个比方,每个人家里都会有冰箱,冰箱是用来干什么的?冰箱是用来存放食物的地方。
同样的,数据库是存放数据的地方。正是因为有了数据库后,我们可以直接查找数据。例如你每天使用余额宝查看自己的账户收益,就是从数据库读取数据后给你的。
最常见的数据库类型是关系型数据库管理系统(RDBMS):
RDBMS 是 SQL 的基础,同样也是所有现代数据库系统的基础,比如 MS SQL Server, IBM DB2, Oracle, mysql 以及 Microsoft Access等等。
RDBMS
中的数据存储在被称为表(tables)的数据库对象中。表
是相关的数据项的集合,它由列和行组成。
由于本文主要讲解 SQL 基础,因此对数据库不做过多解释,只需要大概了解即可。咱们直接开始学习SQL!
🐥 SQL 基础语言学习
在了解 SQL 基础语句使用之前,我们先讲一下 表
是什么?
一个数据库通常包含一个或多个表。每个表由一个名字标识(例如“客户”或者“订单”)。表包含带有数据的记录(行)。
下面的例子是一个名为 “Persons” 的表:
Id | LastName | FirstName | Address | City |
---|---|---|---|---|
1 | Adams | John | Oxford Street | London |
2 | Bush | George | Fifth Avenue | New York |
3 | Carter | Thomas | Changan Street | Beijing |
上面的表包含三条记录(每一条对应一个人)和五个列(Id、姓、名、地址和城市)。
有表才能查询,那么如何创建这样一个表?
🐤 CREATE TABLE – 创建表
CREATE TABLE 语句用于创建数据库中的表。
语法:
CREATE TABLE 表名称
(
列名称1 数据类型,
列名称2 数据类型,
列名称3 数据类型,
....
);
数据类型(data_type)规定了列可容纳何种数据类型。下面的表格包含了SQL中最常用的数据类型:
数据类型 | 描述 |
---|---|
integer(size),int(size),smallint(size),tinyint(size) | 仅容纳整数、在括号内规定数字的最大位数 |
decimal(size,d),numeric(size,d) | 容纳带有小数的数字、“size” 规定数字的最大位数、“d” 规定小数点右侧的最大位数 |
char(size) | 容纳固定长度的字符串(可容纳字母、数字以及特殊字符)、在括号中规定字符串的长度 |
varchar(size) | 容纳可变长度的字符串(可容纳字母、数字以及特殊的字符)、在括号中规定字符串的最大长度 |
date(yyyymmdd) | 容纳日期 |
实例:
本例演示如何创建名为 “Persons” 的表。
该表包含 5 个列,列名分别是:“Id_P”、“LastName”、“FirstName”、“Address” 以及 “City”:
CREATE TABLE Persons
(
Id_P int,
LastName varchar(255),
FirstName varchar(255),
Address varchar(255),
City varchar(255)
);
Id_P 列的数据类型是 int,包含整数。其余 4 列的数据类型是 varchar,最大长度为 255 个字符。
空的 “Persons” 表类似这样:
可使用 INSERT INTO 语句向空表写入数据。
🐑 INSERT – 插入数据
INSERT INTO 语句用于向表格中插入新的行。
语法:
INSERT INTO 表名称 VALUES (值1, 值2,....);
我们也可以指定所要插入数据的列:
INSERT INTO table_name (列1, 列2,...) VALUES (值1, 值2,....);
实例:
本例演示 “Persons” 表插入记录的两种方式:
1、插入新的行
INSERT INTO Persons VALUES (1, 'Gates', 'Bill', 'Xuanwumen 10', 'Beijing');
2、在指定的列中插入数据
INSERT INTO Persons (LastName, Address) VALUES ('Wilson', 'Champs-Elysees');
插入成功后,数据如下:
这个数据插入之后,是通过 SELECT
语句进行查询出来的,别急马上讲!
🐼 SELECT – 查询数据
SELECT 语句用于从表中选取数据,结果被存储在一个结果表中(称为结果集)。
语法:
SELECT * FROM 表名称;
我们也可以指定所要查询数据的列:
SELECT 列名称 FROM 表名称;
📢 注意: SQL 语句对大小写不敏感,SELECT 等效于 select。
实例:
SQL SELECT * 实例:
SELECT * FROM Persons;
📢 注意: 星号(*)是选取所有列的快捷方式。
如需获取名为 “LastName” 和 “FirstName” 的列的内容(从名为 “Persons” 的数据库表),请使用类似这样的 SELECT 语句:
SELECT LastName,FirstName FROM Persons;
🐫 DISTINCT – 去除重复值
如果一张表中有多行重复数据,如何去重显示呢?可以了解下 DISTINCT
。
语法:
SELECT DISTINCT 列名称 FROM 表名称;
实例:
如果要从 “LASTNAME” 列中选取所有的值,我们需要使用 SELECT
语句:
SELECT LASTNAME FROM Persons;
可以发现,在结果集中,Wilson 被列出了多次。
如需从 “LASTNAME” 列中仅选取唯一不同的值,我们需要使用 SELECT DISTINCT 语句:
SELECT DISTINCT LASTNAME FROM Persons;
通过上述查询,结果集中只显示了一列 Wilson,显然已经去除了重复列。
🐸 WHERE – 条件过滤
如果需要从表中选取指定的数据,可将 WHERE 子句添加到 SELECT 语句。
语法:
SELECT 列名称 FROM 表名称 WHERE 列 运算符 值;
下面的运算符可在 WHERE 子句中使用:
操作符 | 描述 |
---|---|
= | 等于 |
<> | 不等于 |
> | 大于 |
< | 小于 |
>= | 大于等于 |
<= | 小于等于 |
BETWEEN | 在某个范围内 |
LIKE | 搜索某种模式 |
📢 注意: 在某些版本的 SQL 中,操作符 <> 可以写为 !=。
实例:
如果只希望选取居住在城市 “Beijing” 中的人,我们需要向 SELECT 语句添加 WHERE 子句:
SELECT * FROM Persons WHERE City='Beijing';
📢 注意: SQL 使用单引号来环绕文本值(大部分数据库系统也接受双引号)。如果是数值,请不要使用引号。
🐹 AND & OR – 运算符
AND 和 OR 可在 WHERE 子语句中把两个或多个条件结合起来。
- 如果第一个条件和第二个条件都成立,则 AND 运算符显示一条记录。
- 如果第一个条件和第二个条件中只要有一个成立,则 OR 运算符显示一条记录。
语法:
AND 运算符实例:
SELECT * FROM 表名称 WHERE 列 运算符 值 AND 列 运算符 值;
OR 运算符实例:
SELECT * FROM 表名称 WHERE 列 运算符 值 OR 列 运算符 值;
实例:
由于 Persons 表数据太少,因此增加几条记录:
INSERT INTO Persons VALUES (2, 'Adams', 'John', 'Oxford Street', 'London');
INSERT INTO Persons VALUES (3, 'Bush', 'George', 'Fifth Avenue', 'New York');
INSERT INTO Persons VALUES (4, 'Carter', 'Thomas', 'Changan Street', 'Beijing');
INSERT INTO Persons VALUES (5, 'Carter', 'William', 'Xuanwumen 10', 'Beijing');
SELECT * FROM Persons;
AND 运算符实例:
使用 AND 来显示所有姓为 “Carter” 并且名为 “Thomas” 的人:
SELECT * FROM Persons WHERE FirstName='Thomas' AND LastName='Carter';
OR 运算符实例:
使用 OR 来显示所有姓为 “Carter” 或者名为 “Thomas” 的人:
SELECT * FROM Persons WHERE firstname='Thomas' OR lastname='Carter';
结合 AND 和 OR 运算符:
我们也可以把 AND 和 OR 结合起来(使用圆括号来组成复杂的表达式):
SELECT * FROM Persons WHERE (FirstName='Thomas' OR FirstName='William') AND LastName='Carter';
🐰 ORDER BY – 排序
ORDER BY 语句用于根据指定的列对结果集进行排序,默认按照升序对记录进行排序,如果您希望按照降序对记录进行排序,可以使用 DESC 关键字。
语法:
SELECT * FROM 表名称 ORDER BY 列1,列2 DESC;
默认排序为 ASC 升序,DESC 代表降序。
实例:
以字母顺序显示 LASTNAME
名称:
SELECT * FROM Persons ORDER BY LASTNAME;
空值(NULL)默认排序在有值行之后。
以数字顺序显示ID_P
,并以字母顺序显示 LASTNAME
名称:
SELECT * FROM Persons ORDER BY ID_P,LASTNAME;
以数字降序显示ID_P
:
SELECT * FROM Persons ORDER BY ID_P DESC;
📢 注意: 在第一列中有相同的值时,第二列是以升序排列的。如果第一列中有些值为 null 时,情况也是这样的。
🐱 UPDATE – 更新数据
Update 语句用于修改表中的数据。
语法:
UPDATE 表名称 SET 列名称 = 新值 WHERE 列名称 = 某值;
实例:
更新某一行中的一个列:
目前 Persons
表有很多字段为 null
的数据,可以通过 UPDATE
为 LASTNAME 是 “Wilson” 的人添加FIRSTNAME:
UPDATE Persons SET FirstName = 'Fred' WHERE LastName = 'Wilson';
更新某一行中的若干列:
UPDATE Persons SET ID_P = 6,city= 'London' WHERE LastName = 'Wilson';
🐨 DELETE – 删除数据
DELETE 语句用于删除表中的行。
语法:
DELETE FROM 表名称 WHERE 列名称 = 值;
实例:
删除某行:
删除 Persons
表中 LastName 为 “Fred Wilson” 的行:
DELETE FROM Persons WHERE LastName = 'Wilson';
删除所有行:
可以在不删除表的情况下删除所有的行。这意味着表的结构、属性和索引都是完整的:
DELETE FROM table_name;
🐵 TRUNCATE TABLE – 清除表数据
如果我们仅仅需要除去表内的数据,但并不删除表本身,那么我们该如何做呢?
可以使用 TRUNCATE TABLE 命令(仅仅删除表格中的数据):
语法:
TRUNCATE TABLE 表名称;
实例:
本例演示如何删除名为 “Persons” 的表。
TRUNCATE TABLE persons;
🐯 DROP TABLE – 删除表
DROP TABLE 语句用于删除表(表的结构、属性以及索引也会被删除)。
语法:
DROP TABLE 表名称;
实例:
本例演示如何删除名为 “Persons” 的表。
drop table persons;
从上图可以看出,第一次执行删除时,成功删除了表 persons
,第二次执行删除时,报错找不到表 persons
,说明表已经被删除了。
🥇 评论区抽粉丝送书啦
📚 本书介绍
作者通过自己的经验总结为如下几点:
- 在数据分析挖掘工作中最常用但对初学者困难的SQL语法知识
- 如何快速梳理SQL代码中的表结构关系
- 常见的SQL易错点
- 常见的数据分析SQL代码案例
- 只学了基础语法,没有通过大量题目实战练习
本书一共16章,分两个部分,主要内容如下:
第一部分(第1~13章)为数据分析SQL基础与进阶内容,主要介绍SQL环境的安装与SQL基础与进阶语法。
第1章先介绍数据库与SQL,数据分析人员的日常工作,数据分析工作的技能要求,数据分析笔试面试的SQL考察点和SQL环境搭建。
第2章介绍SQL的基础检索,包括查询单列与多列数据,正确使用DISTINCT,数据查询并排序,限制数据返回行数。
第3章介绍对查询数据行的过滤,包括使用WHERE过滤数据,多条件过滤的优先级,使用BETWEEN过滤的边界问题,关于NULL的过滤,表达式匹配过滤。
第4章介绍计算字段的使用,包括字段拼接出需要的格式和字段计算生成所需新字段。
第5章介绍各种常用函数的使用,包括文本处理函数,时间日期处理函数和数值处理函数。
第6章介绍各种聚合函数的使用,包括常用聚合函数的使用场景和聚合函数对NULL的处理。
第7章介绍分组的使用,包括使用GROUP BY分组,使用HAVING过滤分组和使用分组排序。
第8章介绍子查询的使用,包括选择合适时机使用子查询,分辨多种子查询和灵活使用EXISTS。
第9章介绍多种多表连接的使用,包括多表连接使用场合和多种多表连接的区别
第10章介绍组合查询的使用,包括使用组合查询的场景,UNION和UNION ALL的区别和对组合查询结果排序。
第11章介绍经常使用的CASE WHEN,包括CASE WHEN的几种形式和其使用场景。
第12章介绍窗口函数的使用,包括常见窗口函数的区别和各个窗口函数的使用场景。
第13章介绍除查询外的常用数据库操作,包括创建新表,插入数据,修改表内容和删除表。
第二部分(第14~16章)为数据分析SQL题目与参考解析,题目分为3种难度等级,分别为初级难度,中级难度和高级难度。
第14章给出22个初级难度的SQL题目,在招聘笔试面试中较常出现,读者可作为对SQL基础掌握程度的衡量。
第15章给出17个中级难度的SQL题目,属于进阶提升部分,对数据分析工作中的SQL书写帮助较大。
第16章给出9个高级难度的SQL题目,难度高主要体现在思维的巧妙和思考的全面性上,可以帮助读者开阔思路。
为了让大家更直接地了解到全书的内容,这里就直接放目录了:
没有基础可以学吗?
可以,本书从环境搭建开始,从基础入门到进阶,然后通过题目实战提升SQL能力,是一本关于SQL 数据分析的实战手册。
本书对比市面上大部分SQL书籍的特色是什么?
将数据分析挖掘中所需的SQL能力抽出来专门写,不会涉及很多不常用的功能语法,由浅入深,并配套大量练习题(可作为求职笔试面试的练习题),每个练习题都配有数据导入、解题思路和参考答案。练习题会结合当前数据分析很多场景需求来编制,例如“活跃用户分析”、“连续登录用户分析”、“社区团购行为分析”、“商品销量同环比”。
本书适合数据分析相关岗位求职备考准备么?
很适合,本书展现了数据分析工作的日常内容,给出了数据分析岗位的工作技能要求,然后讲述了数据分析笔试与面试中对SQL 的考查知识点。通过3种难度的题目练习,能提升求职能力并达到初级数据分析挖掘岗位对SQL的能力要求。
本书的适合什么样的读者?
- 数据分析与数据开发求职者和从业者
- 计算机科学与技术、统计学、数学、大数据、人工智能、数据科学相关专业的师生
- 对数据分析和SQL感兴趣人群
- 转行做数据分析与数据开发的人员
大咖推荐
宣传彩页
另外编辑还为本书制作了几张宣传彩页,是对整本书的一个宣传介绍,大家可以看下:
有不想靠抽,想自己买的同学可以参考下面的链接!
5 折速抢:
📢 注意:
🏆 想要跟着我一起打卡的朋友,可以 添加微信:Lucifer-4622
一起打卡,我保证能让你学习之余收获奖品🏅!
新的一周,活动奖励升级,增加抽奖池,绝对丰厚!详情戳:https://bbs.csdn.net/topics/603632186
社区每日打卡地址(日更):https://docs.qq.com/doc/DRWJIV2VGdktPS3NE
以上是关于SQL数据分析:从基础入门到进阶,提升SQL能力的主要内容,如果未能解决你的问题,请参考以下文章
SQL Server AlwaysON从入门到进阶——何为AlwaysON?
SQL Server 扩展事件(Extented Events)从入门到进阶——扩展事件引擎——基本概念
Mybatis入门到入坟 一站式基础及进阶——囊括面试点与初学基础框架分析——从0到1 不会私我 我手把手教你