SQL数据分析:从基础入门到进阶,提升SQL能力

Posted Lucifer三思而后行

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SQL数据分析:从基础入门到进阶,提升SQL能力相关的知识,希望对你有一定的参考价值。

📚 前言

SQL语言有40多年的历史,从它被应用至今几乎无处不在。我们消费的每一笔支付记录,收集的每一条用户信息,发出去的每一条消息,都会使用数据库或与其相关的产品来存储,而操纵数据库的语言正是 SQL !

SQL 对于现在的互联网公司生产研发等岗位几乎是一个必备技能,如果不会 SQL 的话,可能什么都做不了。你可以把 SQL 当做是一种工具,利用它可以帮助你完成你的工作,创造价值。

点我跳转文末 领书,新出版的 《SQL数据分析:从基础破冰到面试题解》!

本篇文章 点赞 + 收藏 + 评论!皆可参与送书活动!

🌴 SQL 介绍

🌼 什么是 SQL

SQL 是用于访问和处理数据库的标准的计算机语言。

  • SQL 指结构化查询语言
  • SQL 使我们有能力访问数据库
  • SQL 是一种 ANSI 的标准计算机语言


SQL 可与数据库程序协同工作,比如 MS Access、DB2、Informix、MS SQL Server、Oracle、Sybase 以及其他数据库系统。但是由于各种各样的数据库出现,导致很多不同版本的 SQL 语言,为了与 ANSI 标准相兼容,它们必须以相似的方式共同地来支持一些主要的关键词(比如 SELECT、UPDATE、DELETE、INSERT、WHERE 等等),这些就是我们要学习的SQL基础。

🌀 SQL 的类型

可以把 SQL 分为两个部分:数据操作语言 (DML) 和 数据定义语言 (DDL)。

  • 数据查询语言(DQL: Data Query Language)
  • 数据操纵语言(DML:Data Manipulation Language)

🌵 学习 SQL 的作用

SQL 是一门 ANSI 的标准计算机语言,用来访问和操作数据库系统。SQL 语句用于取回和更新数据库中的数据。

  • SQL 面向数据库执行查询
  • SQL 可从数据库取回数据
  • SQL 可在数据库中插入新的记录
  • SQL 可更新数据库中的数据
  • SQL 可从数据库删除记录
  • SQL 可创建新数据库
  • SQL 可在数据库中创建新表
  • SQL 可在数据库中创建存储过程
  • SQL 可在数据库中创建视图
  • SQL 可以设置表、存储过程和视图的权限

🍄 数据库是什么

顾名思义,你可以理解为数据库是用来存放数据的一个容器。

打个比方,每个人家里都会有冰箱,冰箱是用来干什么的?冰箱是用来存放食物的地方。

同样的,数据库是存放数据的地方。正是因为有了数据库后,我们可以直接查找数据。例如你每天使用余额宝查看自己的账户收益,就是从数据库读取数据后给你的。

最常见的数据库类型是关系型数据库管理系统(RDBMS):

RDBMS 是 SQL 的基础,同样也是所有现代数据库系统的基础,比如 MS SQL Server, IBM DB2, Oracle, mysql 以及 Microsoft Access等等。

RDBMS 中的数据存储在被称为表(tables)的数据库对象中。 是相关的数据项的集合,它由列和行组成。

由于本文主要讲解 SQL 基础,因此对数据库不做过多解释,只需要大概了解即可。咱们直接开始学习SQL!

🐥 SQL 基础语言学习

在了解 SQL 基础语句使用之前,我们先讲一下 是什么?

一个数据库通常包含一个或多个表。每个表由一个名字标识(例如“客户”或者“订单”)。表包含带有数据的记录(行)。

下面的例子是一个名为 “Persons” 的表:

IdLastNameFirstNameAddressCity
1AdamsJohnOxford StreetLondon
2BushGeorgeFifth AvenueNew York
3CarterThomasChangan StreetBeijing

上面的表包含三条记录(每一条对应一个人)和五个列(Id、姓、名、地址和城市)。

有表才能查询,那么如何创建这样一个表?

🐤 CREATE TABLE – 创建表

CREATE TABLE 语句用于创建数据库中的表。

语法:

CREATE TABLE 表名称
(
列名称1 数据类型,
列名称2 数据类型,
列名称3 数据类型,
....
);

数据类型(data_type)规定了列可容纳何种数据类型。下面的表格包含了SQL中最常用的数据类型:

数据类型描述
integer(size),int(size),smallint(size),tinyint(size)仅容纳整数、在括号内规定数字的最大位数
decimal(size,d),numeric(size,d)容纳带有小数的数字、“size” 规定数字的最大位数、“d” 规定小数点右侧的最大位数
char(size)容纳固定长度的字符串(可容纳字母、数字以及特殊字符)、在括号中规定字符串的长度
varchar(size)容纳可变长度的字符串(可容纳字母、数字以及特殊的字符)、在括号中规定字符串的最大长度
date(yyyymmdd)容纳日期

实例:

本例演示如何创建名为 “Persons” 的表。

该表包含 5 个列,列名分别是:“Id_P”、“LastName”、“FirstName”、“Address” 以及 “City”:

CREATE TABLE Persons
(
Id_P int,
LastName varchar(255),
FirstName varchar(255),
Address varchar(255),
City varchar(255)
);

Id_P 列的数据类型是 int,包含整数。其余 4 列的数据类型是 varchar,最大长度为 255 个字符。


空的 “Persons” 表类似这样:

可使用 INSERT INTO 语句向空表写入数据。

🐑 INSERT – 插入数据

INSERT INTO 语句用于向表格中插入新的行。

语法:

INSERT INTO 表名称 VALUES (1,2,....);

我们也可以指定所要插入数据的列:

INSERT INTO table_name (1,2,...) VALUES (1,2,....);

实例:

本例演示 “Persons” 表插入记录的两种方式:

1、插入新的行

INSERT INTO Persons VALUES (1, 'Gates', 'Bill', 'Xuanwumen 10', 'Beijing');

2、在指定的列中插入数据

INSERT INTO Persons (LastName, Address) VALUES ('Wilson', 'Champs-Elysees');


插入成功后,数据如下:

这个数据插入之后,是通过 SELECT 语句进行查询出来的,别急马上讲!

🐼 SELECT – 查询数据

SELECT 语句用于从表中选取数据,结果被存储在一个结果表中(称为结果集)。

语法:

SELECT * FROM 表名称;

我们也可以指定所要查询数据的列:

SELECT 列名称 FROM 表名称;

📢 注意: SQL 语句对大小写不敏感,SELECT 等效于 select。

实例:

SQL SELECT * 实例:

SELECT * FROM Persons;


📢 注意: 星号(*)是选取所有列的快捷方式。

如需获取名为 “LastName” 和 “FirstName” 的列的内容(从名为 “Persons” 的数据库表),请使用类似这样的 SELECT 语句:

SELECT LastName,FirstName FROM Persons;

🐫 DISTINCT – 去除重复值

如果一张表中有多行重复数据,如何去重显示呢?可以了解下 DISTINCT

语法:

SELECT DISTINCT 列名称 FROM 表名称;

实例:

如果要从 “LASTNAME” 列中选取所有的值,我们需要使用 SELECT 语句:

SELECT LASTNAME FROM Persons;


可以发现,在结果集中,Wilson 被列出了多次。

如需从 “LASTNAME” 列中仅选取唯一不同的值,我们需要使用 SELECT DISTINCT 语句:

SELECT DISTINCT LASTNAME FROM Persons;


通过上述查询,结果集中只显示了一列 Wilson,显然已经去除了重复列。

🐸 WHERE – 条件过滤

如果需要从表中选取指定的数据,可将 WHERE 子句添加到 SELECT 语句。

语法:

SELECT 列名称 FROM 表名称 WHERE 列 运算符 值;

下面的运算符可在 WHERE 子句中使用:

操作符描述
=等于
<>不等于
>大于
<小于
>=大于等于
<=小于等于
BETWEEN在某个范围内
LIKE搜索某种模式

📢 注意: 在某些版本的 SQL 中,操作符 <> 可以写为 !=。

实例:

如果只希望选取居住在城市 “Beijing” 中的人,我们需要向 SELECT 语句添加 WHERE 子句:

SELECT * FROM Persons WHERE City='Beijing';


📢 注意: SQL 使用单引号来环绕文本值(大部分数据库系统也接受双引号)。如果是数值,请不要使用引号。

🐹 AND & OR – 运算符

AND 和 OR 可在 WHERE 子语句中把两个或多个条件结合起来。

  • 如果第一个条件和第二个条件都成立,则 AND 运算符显示一条记录。
  • 如果第一个条件和第二个条件中只要有一个成立,则 OR 运算符显示一条记录。

语法:

AND 运算符实例:

SELECT * FROM 表名称 WHERE 列 运算符 值 AND 列 运算符 值;

OR 运算符实例:

SELECT * FROM 表名称 WHERE 列 运算符 值 OR 列 运算符 值;

实例:

由于 Persons 表数据太少,因此增加几条记录:

INSERT INTO Persons VALUES (2, 'Adams', 'John', 'Oxford Street', 'London');
INSERT INTO Persons VALUES (3, 'Bush', 'George', 'Fifth Avenue', 'New York');
INSERT INTO Persons VALUES (4, 'Carter', 'Thomas', 'Changan Street', 'Beijing');
INSERT INTO Persons VALUES (5, 'Carter', 'William', 'Xuanwumen 10', 'Beijing');
SELECT * FROM Persons;


AND 运算符实例:

使用 AND 来显示所有姓为 “Carter” 并且名为 “Thomas” 的人:

SELECT * FROM Persons WHERE FirstName='Thomas' AND LastName='Carter';


OR 运算符实例:

使用 OR 来显示所有姓为 “Carter” 或者名为 “Thomas” 的人:

SELECT * FROM Persons WHERE firstname='Thomas' OR lastname='Carter';


结合 AND 和 OR 运算符:

我们也可以把 AND 和 OR 结合起来(使用圆括号来组成复杂的表达式):

SELECT * FROM Persons WHERE (FirstName='Thomas' OR FirstName='William') AND LastName='Carter';

🐰 ORDER BY – 排序

ORDER BY 语句用于根据指定的列对结果集进行排序,默认按照升序对记录进行排序,如果您希望按照降序对记录进行排序,可以使用 DESC 关键字。

语法:

SELECT * FROM 表名称 ORDER BY1,2 DESC;

默认排序为 ASC 升序,DESC 代表降序。

实例:

以字母顺序显示 LASTNAME 名称:

SELECT * FROM Persons ORDER BY LASTNAME;


空值(NULL)默认排序在有值行之后。

以数字顺序显示ID_P,并以字母顺序显示 LASTNAME 名称:

SELECT * FROM Persons ORDER BY ID_P,LASTNAME;


以数字降序显示ID_P

SELECT * FROM Persons ORDER BY ID_P DESC;


📢 注意: 在第一列中有相同的值时,第二列是以升序排列的。如果第一列中有些值为 null 时,情况也是这样的。

🐱 UPDATE – 更新数据

Update 语句用于修改表中的数据。

语法:

UPDATE 表名称 SET 列名称 = 新值 WHERE 列名称 = 某值;

实例:

更新某一行中的一个列:

目前 Persons 表有很多字段为 null 的数据,可以通过 UPDATE 为 LASTNAME 是 “Wilson” 的人添加FIRSTNAME:

UPDATE Persons SET FirstName = 'Fred' WHERE LastName = 'Wilson';


更新某一行中的若干列:

UPDATE Persons SET ID_P = 6,city= 'London' WHERE LastName = 'Wilson';

🐨 DELETE – 删除数据

DELETE 语句用于删除表中的行。

语法:

DELETE FROM 表名称 WHERE 列名称 =;

实例:

删除某行:

删除 Persons 表中 LastName 为 “Fred Wilson” 的行:

DELETE FROM Persons WHERE LastName = 'Wilson';


删除所有行:

可以在不删除表的情况下删除所有的行。这意味着表的结构、属性和索引都是完整的:

DELETE FROM table_name;

🐵 TRUNCATE TABLE – 清除表数据

如果我们仅仅需要除去表内的数据,但并不删除表本身,那么我们该如何做呢?

可以使用 TRUNCATE TABLE 命令(仅仅删除表格中的数据):

语法:

TRUNCATE TABLE 表名称;

实例:

本例演示如何删除名为 “Persons” 的表。

TRUNCATE TABLE persons;

🐯 DROP TABLE – 删除表

DROP TABLE 语句用于删除表(表的结构、属性以及索引也会被删除)。

语法:

DROP TABLE 表名称;

实例:

本例演示如何删除名为 “Persons” 的表。

drop table persons;


从上图可以看出,第一次执行删除时,成功删除了表 persons,第二次执行删除时,报错找不到表 persons,说明表已经被删除了。


🥇 评论区抽粉丝送书啦

💌 欢迎大家在评论区提出意见和建议! (抽 5 位幸运儿送书,实物图如下)💌

《SQL数据分析:从基础破冰到面试题解》

📚 本书介绍

作者通过自己的经验总结为如下几点:

  • 在数据分析挖掘工作中最常用但对初学者困难的SQL语法知识
  • 如何快速梳理SQL代码中的表结构关系
  • 常见的SQL易错点
  • 常见的数据分析SQL代码案例
  • 只学了基础语法,没有通过大量题目实战练习

本书一共16章,分两个部分,主要内容如下:

第一部分(第1~13章)为数据分析SQL基础与进阶内容,主要介绍SQL环境的安装与SQL基础与进阶语法。

第1章先介绍数据库与SQL,数据分析人员的日常工作,数据分析工作的技能要求,数据分析笔试面试的SQL考察点和SQL环境搭建。

第2章介绍SQL的基础检索,包括查询单列与多列数据,正确使用DISTINCT,数据查询并排序,限制数据返回行数。

第3章介绍对查询数据行的过滤,包括使用WHERE过滤数据,多条件过滤的优先级,使用BETWEEN过滤的边界问题,关于NULL的过滤,表达式匹配过滤。

第4章介绍计算字段的使用,包括字段拼接出需要的格式和字段计算生成所需新字段。

第5章介绍各种常用函数的使用,包括文本处理函数,时间日期处理函数和数值处理函数。

第6章介绍各种聚合函数的使用,包括常用聚合函数的使用场景和聚合函数对NULL的处理。

第7章介绍分组的使用,包括使用GROUP BY分组,使用HAVING过滤分组和使用分组排序。

第8章介绍子查询的使用,包括选择合适时机使用子查询,分辨多种子查询和灵活使用EXISTS。

第9章介绍多种多表连接的使用,包括多表连接使用场合和多种多表连接的区别

第10章介绍组合查询的使用,包括使用组合查询的场景,UNION和UNION ALL的区别和对组合查询结果排序。

第11章介绍经常使用的CASE WHEN,包括CASE WHEN的几种形式和其使用场景。

第12章介绍窗口函数的使用,包括常见窗口函数的区别和各个窗口函数的使用场景。

第13章介绍除查询外的常用数据库操作,包括创建新表,插入数据,修改表内容和删除表。

第二部分(第14~16章)为数据分析SQL题目与参考解析,题目分为3种难度等级,分别为初级难度,中级难度和高级难度。

第14章给出22个初级难度的SQL题目,在招聘笔试面试中较常出现,读者可作为对SQL基础掌握程度的衡量。

第15章给出17个中级难度的SQL题目,属于进阶提升部分,对数据分析工作中的SQL书写帮助较大。

第16章给出9个高级难度的SQL题目,难度高主要体现在思维的巧妙和思考的全面性上,可以帮助读者开阔思路。

为了让大家更直接地了解到全书的内容,这里就直接放目录了:





没有基础可以学吗?

可以,本书从环境搭建开始,从基础入门到进阶,然后通过题目实战提升SQL能力,是一本关于SQL 数据分析的实战手册。

本书对比市面上大部分SQL书籍的特色是什么?

将数据分析挖掘中所需的SQL能力抽出来专门写,不会涉及很多不常用的功能语法,由浅入深,并配套大量练习题(可作为求职笔试面试的练习题),每个练习题都配有数据导入、解题思路和参考答案。练习题会结合当前数据分析很多场景需求来编制,例如“活跃用户分析”、“连续登录用户分析”、“社区团购行为分析”、“商品销量同环比”。

本书适合数据分析相关岗位求职备考准备么?

很适合,本书展现了数据分析工作的日常内容,给出了数据分析岗位的工作技能要求,然后讲述了数据分析笔试与面试中对SQL 的考查知识点。通过3种难度的题目练习,能提升求职能力并达到初级数据分析挖掘岗位对SQL的能力要求。

本书的适合什么样的读者?

  • 数据分析与数据开发求职者和从业者
  • 计算机科学与技术、统计学、数学、大数据、人工智能、数据科学相关专业的师生
  • 对数据分析和SQL感兴趣人群
  • 转行做数据分析与数据开发的人员

大咖推荐

宣传彩页

另外编辑还为本书制作了几张宣传彩页,是对整本书的一个宣传介绍,大家可以看下:


有不想靠抽,想自己买的同学可以参考下面的链接!

5 折速抢:

《SQL数据分析:从基础破冰到面试题解》- 京东图书


📢 注意:

🏆 想要跟着我一起打卡的朋友,可以 添加微信Lucifer-4622 一起打卡,我保证能让你学习之余收获奖品🏅!

新的一周,活动奖励升级,增加抽奖池,绝对丰厚!详情戳:https://bbs.csdn.net/topics/603632186

社区每日打卡地址(日更)https://docs.qq.com/doc/DRWJIV2VGdktPS3NE

以上是关于SQL数据分析:从基础入门到进阶,提升SQL能力的主要内容,如果未能解决你的问题,请参考以下文章

跟着大伟学SQL:从基础到进阶,从刷题到面试

SQL Server AlwaysON从入门到进阶——何为AlwaysON?

SQL Server 扩展事件(Extented Events)从入门到进阶——扩展事件引擎——基本概念

Mybatis入门到入坟 一站式基础及进阶——囊括面试点与初学基础框架分析——从0到1 不会私我 我手把手教你

《ClickHouse企业级应用:入门进阶与实战》6 ClickHouse SQL基础

《ClickHouse企业级应用:入门进阶与实战》6 ClickHouse SQL基础