[MySQL] 常用SQL的优化--18.4

Posted 2020-08-11

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了[MySQL] 常用SQL的优化--18.4相关的知识，希望对你有一定的参考价值。

　　这里介绍下，Insert、Group By等SQL语句的优化方法：

1、大批量数据插入

当load命令导入数据的时候，可以进行适当的设置提高导入速度。

1.1 对于MyISAM表，可以先禁用非唯一索引更新，再导入数据来快速导入大量的数据。

　　alter table table_name disable keys;

　　load date infile ‘xxx.txt‘ into table_name;

　　alter table table_name enable keys;

1.2 对于InnoDB表：

1）因为InnoDB表必须有主键，表是按照主键的顺序保存的，所以将要导入的数据按照主键排序，

可以有效地提高导入数据的效率。

2）如果表中存在唯一性约束，则在导入数据前执行关闭唯一性校验，可以提高导入效率。

　　set unique_checks=0;

　　loading the data;

　　set unique_checks=1;

3) 如果应用使用自动提交的方式，建议在导入前执行set autocommit=0,关闭自动提交。

这样不用每次insert都去磁盘写日志，节省I/O。

　　set auto_commit=0;

　　loading the data;

　　set auto_commit=1;

2、优化Insert语句

1）如果是同一客户插入很多行，应尽量使用多个值表的Insert语句。（节省连接，关闭等消耗）

　　insert into test values(1,2),(1,3),(1,4);

2）如果从不通客户端出入多行，可以使用Insert Delayed语句得到更高的速度。Delayed含义是让

Insert 语句马上执行，不用等到其他用户对表的读写完成后才进行插入。LOW_PRIORITY刚好相反。

3）将数据文件和索引文件分别存在不同的磁盘上，加快访问速度（建表时可以指定，或者my.cnf里）。

4）如果是对MyISAM表进行批量插入，可以通过增加bulk_insert_buffer_size变量值的方法来提速。

5）当从一个文本文件装载一格表时，使用load data infile，比大量insert语句快20倍。

3、优化ORDER BY语句

3.1 mysql的两种排序

　　第一种是有序索引通过顺序扫描直接返回有序数据，这种方式在使用explain分析查询的时候显示

为Using Index,不需要额外的排序，操作效率高，例如：

技术分享

　　第二种是通过对返回数据进行排序，也就是通常说的Filesort排序，所有不是通过索引直接返回排序结果的排序

都叫做Filesort排序。Filesort并不代表通过磁盘文件进行排序，而只是说明进行了一个排序操作，至于排序操作是

否使用了磁盘文件或者临时表等，则取决于MySQL服务器对排序参数的设置和需要排序的数据的大小。例如：

技术分享

　　又如,对组合索引进行访问，并在索引idx_storeid_email上发生了一次操作排序，所以执行计划中仍然有Using Filesort。

技术分享

　　

　　Filesort是通过相应的排序算法，将取得的数据在sort_buffer_size系统变量设置的内存排序区中进行排序，如果内存

装载不下，他就会将磁盘上的数据进行分块，再对各个数据块进行排序，然后将各个快合并成有序的结果集。sort_buffer_size

设置的排序区是每个线程独占的，所以可以有多个sort buffer存在。

　　MySQL优化目标：尽量减少额外的排序，通过索引直接返回有序数据。

　　Where条件和order by使用相同的索引，并且order by的顺序和索引的顺序相同，并且order by的字段都是升序或者

都是降序。如果不满足，则肯定需要额外的排序操作，这样就会出现Filesort。

　　总结，下列SQL可以使用索引（符合组合索引的最左原则）：

技术分享

　　但是在以下几种情况下则不能使用索引：

技术分享

3.2 Filesort的优化

　　通过创建合适的索引就能减少Filesort的出现，但是某些情况下，不能避免，就要加快Filesort的操作。

在MySQL中，Filesort有两种排序算法：

两次扫描算法：先根据条件取出排序字段和行指针信息，之后在排序区中排序。再之后，通过排序后的
行指针信息回表读取数据。
一次扫描算法：一次性取出满足条件的行的所有字段，然后在排序区sort buffer中排序后直接输出结果集。
排序时内存开销比较大，但是排序效率比两次扫描算法高。

4. 优化group by 语句

　　默认情况下，MySQL对所有group by col1，col2，...的字段进行排序。与order by col1,col2...类似，如果

group by后显示的包括一个包含相同列的order by 子句，则对实际执行性能没什么影响。

　　如果查询包含group by但用户想要避免排序结果的消耗，则可以指定order by null禁止排序，如下面例子：

技术分享

5.优化嵌套查询

　　使用子查询可以一次性完成很多逻辑上需要多个步骤才能完成的SQL操作，写起来容易。但是，有些情况下需要

用更有效率的连接（join）来替代。

技术分享

　　使用连接（join）来替代子查询（in）

技术分享

6. MySQL优化or条件

　　对于含有OR的查询子句，如果要利用索引，则OR之间的每个条件列都必须用到索引；

如果没有索引，要考虑增加索引。

　　例如：有三个索引，id,year,(company_id,moneys);show index from table_name;查看索引

技术分享

　　由上看出，正确的使用了索引，并从执行计划中获得，MySQL处理含有OR字句的查询时，实际上是对OR的各个字段

分别查询后的结果进行了UNION操作。

　　但是当在组合索引的列company_id和moneys上面做OR操作时，却不能用到索引。

技术分享

7.优化分页查询

　　一般分页查询时，通过创建覆盖索引能比较好的提高性能。一个常见又非常头疼的分页场景是“limit 1000，20”，

此时MySQL排序出前1020条记录后仅需要返回第1001到1020条记录，前1000条记录都被抛弃，查询和排序的代价非常高。

1）第一种优化思路：（使用子查询查出索引id limit m,n后联表查询）

　　在索引上完成排序分页的操作，最后根据主键关联取回原表查询所需要的其他列内容。

例如：处理效率不高的语句：

技术分享

　　按照索引分页后回表方式改写SQL后：

技术分享

2）第二种优化思路（将limit m,n 转变成limit n,过滤前m行后开始查询）

explain select film_id ,description from film where film_id >50 order by film_id asc limit 5\G

技术分享

　　注意,这样把limit m,n转换成 limit n的查询，只适合在排序字段不会出现重复值的特定环境（唯一键或者

主键），能够减轻分页翻页的压力。如果排序字段出现大量重复值，则不适合这样优化方式。

以上是关于[MySQL] 常用SQL的优化--18.4的主要内容，如果未能解决你的问题，请参考以下文章