MYSQL监控调优

Posted chenqi520

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MYSQL监控调优相关的知识,希望对你有一定的参考价值。

mysql监控调优

一、Mysql性能介绍

1、什么是Mysql?它有什么优点?

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,目前属于Oracle公司。MySQL是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。

  • Mysql是开源的,所以你不需要支付额外的费用。
  • Mysql支持大型的数据库。可以处理拥有上千万条记录的大型数据库。
  • MySQL使用标准的SQL数据语言形式。
  • Mysql可以允许于多个系统上,并且支持多种语言。这些编程语言包括C、C++、Python、Java、Perl、php、Eiffel、Ruby和Tcl等。
  • Mysql对PHP有很好的支持,PHP是目前最流行的Web开发语言。
  • MySQL支持大型数据库,支持5000万条记录的数据仓库,32位系统表文件最大可支持4GB,64位系统支持最大的表文件为8TB。
  • Mysql是可以定制的,采用了GPL协议,可以修改源码来开发自己的Mysql系统。

影响Mysql性能的原因总结一下 主要在下面这几点

  • 服务器硬件
  • 网卡流量
  • 磁盘IO
  • SQL查询速度

服务器硬件

 

 

 

2、Mysql的查询过程

   1 先查询缓存,检查Query语句是否完全匹配,接着再检查是否具有权限,都成功则直接取数据返回
  2 上一步有失败则转交给‘命令解析器’,经过词法分析,语法分析后生成解析树
  3 接下来是预处理阶段,处理解析器无法解决的语义,检查权限等,生成新的解析树
  4 再转交给对应的模块处理
  5 如果是SELECT查询还会经由‘查询优化器’做大量的优化,生成执行计划
  6 模块收到请求后,通过‘访问控制模块’检查所连接的用户是否有访问目标表和目标字段的权限
  7 有则调用‘表管理模块’,先是查看table cache中是否存在,有则直接对应的表和获取锁,否则重新打开表文件
  8 根据表的meta数据,获取表的存储引擎类型等信息,通过接口调用对应的存储引擎处理
  9 上述过程中产生数据变化的时候,若打开日志功能,则会记录到相应二进制日志文件中
 技术分享图片

3、Mysql架构

技术分享图片

DDL (Data Definition Language 数据定义语言)

 

 

DML (Data Manipulation Language 数据操作语言)

 

 

4、Mysql连接数

MYSQL数据库默认最大连接数是100,然而对于流量稍微大一点的论坛或网站这个连接数是远远不够的,当并发数过大的时候会出现连接数不够用,使得很多线程在等待其他连接释放,会直接导致导致数据库连接超时或者响应时间过长,所以需要调整最大连接数。

 

5、Mysql缓存

数据库属于 IO 密集型的应用程序,其主要职责就是数据的管理及存储工作。而我们知道,从内存中读取一个数据库的时间是微秒级别,而从一块普通硬盘上读取一个IO是在毫秒级别,二者相差3个数量级。所以,要优化数据库,首先第一步需要优化的就是 IO,尽可能将磁盘IO转化为内存IO。

缓存分为两个维度,查询缓存Query cache和存储引擎InnoDB_Buffer_Pool

  • 查询缓存Query cache

查询缓存会缓存完整的SELECT查询结果,当查询命中缓存时MySQL会将结果立刻返回,直接跳过了解析、优化和执行阶段。

当然,Query Cache 也有一个致命的缺陷,那就是当某个表的数据有任何任何变化,都会导致所有引用了该表的select语句在Query Cache 中的缓存数据失效。所以,当我们的数据变化非常频繁的情况下,使用Query Cache 可能会得不偿失。

因此,应用程序不需要关心MySQL是通过缓存查询出的结果还是实际执行过SQL语句返回的结果,因为这两种结果是完全相同的。

从前面的数据库执行过程图中可以看到,执行一条SQL查询语句会先查询该语句是否存在于缓存中,需要注意的是当语句中的字符大小写或注释只要有一点点的不同,查询缓存就会被认为是不同的查询,导致无法命中查询缓存。另外,对于不确定的函数,如:now()、current_date()等这种查询都不会被缓存。

既然查询缓存的有可以改善性能的优点,自然也有自己的缺点,主要体现在当开启了查询缓存时对于读写操作都增加了额外的开销。相对于读,再查询开始前需要先检查缓存,而对于写,则是当写入数据后需要更新缓存。

  • Query cache的参数:

查询缓存参数,在mysql配置文件中添加,linux下为my.cnf,windows下为my.ini:

 

 

修改完配置后,让我们再来监控Qcache的使用情况。

 

 

  • 存储引擎层-innodb buffer pool

 buffer pool是innodb存储引擎带的一个缓存池,查询数据的时候,它首先会从内存中查询,如果内存中存在的话,直接返回,从而提高查询响应时间。

innodb buffer pool和qcache的区别是:qcacche缓存的是sql语句对应的结果集,buffer pool中缓存的是表中的数据。Buffer pool是设置的越大越好,一般设置为服务器物理内存的70%。

 

 

  • 查看Innodb_buffer_pool状态

 

 

  • 监控Innodb_buffer_pool使用情况

 

 

6、事务和锁

事务就是一组原子性的SQL查询,或者也可以说一个独立的工作单元。如果数据库引擎可以成功的对数据库应用该组查询的全部语句,那么就执行该组查询。如果其中任意一条语句因为某种原因无法执行,那么其他的语句都不会执行。也就是说,事务内的语句要么全部都执行,要么全部执行失败。

  • 表级锁和行级锁

行级锁又分共享锁和排他锁。

共享锁:共享锁又叫做读锁,所有的事务只能对其进行读操作不能写操作,加上共享锁后在事务结束之前其他事务只能再加共享锁,除此之外其他任何类型的锁都不能再加了。

 

 

排他锁:若某个事物对某一行加上了排他锁,只能这个事务对其进行读写,在此事务结束之前,其他事务不能对其进行加任何锁,其他进程可以读取,不能进行写操作,需等待其释放。for update仅适用于InnoDB,且必须在事务块(BEGIN/COMMIT)中才能生效。在进行事务操作时,通过“for update”语句,MySQL会对查询结果集中每行数据都添加排他锁,其他线程对该记录的更新与删除操作都会阻塞。

 

 

表级锁是MySQL中锁定粒度最大的一种锁,表示对当前操作的整张表加锁,它实现简单,资源消耗较少,被大部分MySQL引擎支持。最常使用的MYISAM与INNODB都支持表级锁定。表级锁定分为表共享读锁(共享锁)表独占写锁(排他锁)

特点

开销小,加锁快;不会出现死锁;锁定粒度大,发出锁冲突的概率最高,并发度最低。

  • 死锁

我们在测试中经常会遇到数据库死锁的情况,那么什么是死锁呢? 死锁是指两个或者多个事务在同一资源上互相占用,并且请求锁定对方占用的资源,从而导致恶性循环的现象。

 

 

当两个事务同时执行,每个事务都执行了第一条update语句,更新了一行数据的同时也会锁定该行数据,接下来每个事务会尝试去执行第二条update语句,在这时会发现要修改的这条数据已经被锁定了,然后两个事务都在互相等待对方释放锁,同时又都持有对方所需要的锁,在这样的情况下就陷入了死循环。也就是死锁了,对于出现死锁的情况下,只有通过外部因素来介入来解除死锁。

当然既然存在有死锁的情况,自然也就有一些解决问题的方法,数据库系统实现了各种死锁检测和死锁超时机制。比如InnoDB存储引擎,就能检测到死锁的循环依赖,并且立即会返回一个错误。

锁的行为和顺序是和存储引擎相关的,以同样的顺序去执行语句时,有些存储引擎会出现死锁,有些就不会。因此死锁的产生有双重原因,有些是因为真正的数据冲突,有些则是因为存储引擎的实现方式导致。

如何查看死锁呢?

 

 

  • 多线程并发才有可能死锁
  • 避免交叉加锁
  • 减少涉及的表,表联接会大大增加锁范围
  • 避免全表更新,控制更新行数

二、Mysql慢查询

开启慢查询日志,可以让MySQL记录下查询超过指定时间的语句,通过定位分析性能的瓶颈,才能更好的优化数据库系统的性能。顾名思义,慢查询日志中记录的是执行时间较长的query,也就是我们常说的slowquery,通过设–log-slow-queries[=file_name]来打开该功能并设置记录位置和文件名。

慢查询日志采用的是简单的文本格式,可以通过各种文本编辑器查看其中的内容。其中记录了语句执行的时刻,执行所消耗的时间,执行用户,连接主机等相关信息。MySQL 还提供了专门用来分析满查询日志的工具程序mysqlslowdump,用来帮助数据库管理人员解决可能存在的性能问题。

  • 查看慢查询相关参数

 

 

  • 配置Mysql慢查询(通过配置文件)

 

 

  • 使用命令启动MySQL慢查询

 

 

  • Mysqldumpslow命令

 

 

  • explain

前面分析出了具体是哪一条SQL导致的查询速度过慢,那么我们该如何针对这些占用资源严重的SQL来进一步的分析呢??答案就是使用explain

 

Explain :该命令是查看查询优化器如何决定执行查询的主要方法,这个功能有局限性,只是一个近似结果,有时它是一个很好的近似,有时可能相差甚远。但它的输出是可以获取的最准确信息,值得仔细学习。使用方法如下:

 

 

explain的列:

我们先完成一个建表

 

 

1. id:

包含一组数字,表示查询中执行select子句或操作表的顺序(id相同,执行顺序由上至下),如果是子查询,id值越大优先级越高,越先被执行

 

 

如果ID相同,则按照顺序从上向下

 

 

 

2. select_type

示查询中每个select子句的类型(简单OR复杂)

  1.  SIMPLE:查询中不包含子查询或者UNION
  2.  查询中若包含任何复杂的子部分,最外层查询则被标记为:PRIMARY
  3. 在SELECT或WHERE列表中包含了子查询,该子查询被标记为:SUBQUERY
  4. 在FROM列表中包含的子查询被标记为:DERIVED(衍生)用来表示包含在from子句中的子查询的selectmysql会递归执行并将结果放到一个临时表中。服务器内部称为”派生表”,因为该临时表是从子查询中派生出来的
  5. 若第二个SELECT出现在UNION之后,则被标记为UNION;若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED
  6.  从UNION表获取结果的SELECT被标记为:UNION RESULT

SUBQUERY和UNION还可以被标记为DEPENDENT和UNCACHEABLE。
DEPENDENT意味着select依赖于外层查询中发现的数据。
UNCACHEABLE意味着select中的某些 特性阻止结果被缓存于一个item_cache中。

 

 

3. type

表示MySQL在表中找到所需行的方式,又称“访问类型”,常见类型如下:

ALL, index, range, ref, eq_ref, const, system, NULL

从左到右,性能从最差到最好

ALL:Full Table Scan, MySQL将遍历全表以找到匹配的行

 

 

 index:Full Index Scan,index与ALL区别为index类型只遍历索引树

 

 

range:索引范围扫描,对索引的扫描开始于某一点,返回匹配值域的行。索引范围扫描是带有between或者where子句里带有<, >查询。当mysql使用索引去查找一系列值时,例如IN()和OR列表,也会显示range(范围扫描),当然性能上面是有差异的。

 

 

ref:使用非唯一索引扫描或者唯一索引的前缀扫描,返回匹配某个单独值的记录行

 

 

eq_ref类似ref,区别就在使用的索引是唯一索引,对于每个索引键值,表中只有一条记录匹配,简单来说,就是多表连接中使用primary key或者 unique key作为关联条件

 

 

const,system,当MySQL对查询某部分进行优化,并转换为一个常量时,使用这些类型访问。如将主键置于where列表中,MySQL就能将该查询转换为一个常量。

 

 

NULL,MySQL在优化过程中分解语句,执行时甚至不用访问表或索引,例如从一个索引列里选取最小值可以通过单独索引查找完成。

 

 

4. possible_keys
指出MySQL能使用哪个索引在表中找到记录,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询使用

5. key
显示MySQL在查询中实际使用的索引,若没有使用索引,显示为NULL

6. key_len
表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度(key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的)

7. ref
表示上述表的连接匹配条件,即哪些列或常量被用于查找索引列上的值

8. rows
表示MySQL根据表统计信息及索引选用情况,估算的找到所需的记录所需要读取的行数

9. Extra
包含不适合在其他列中显示但十分重要的额外信息
a. Using index
该值表示相应的select操作中使用了覆盖索引(Covering Index)

 

 

b. Using where
表示mysql服务器将在存储引擎检索行后再进行过滤。许多where条件里涉及索引中的列,当(并且如果)它读取索引时,就能被存储引擎检验,因此不是所有带where字句的查询都会显示”Using where”。有时”Using where”的出现就是一个暗示:查询可受益与不同的索引。

 

 

c. Using temporary
表示MySQL需要使用临时表来存储结果集,常见于排序和分组查询

这个值表示使用了内部临时(基于内存的)表。一个查询可能用到多个临时表。有很多原因都会导致MySQL在执行查询期间创建临时表。两个常见的原因是在来自不同表的上使用了DISTINCT,或者使用了不同的ORDER BY和GROUP BY列。可以强制指定一个临时表使用基于磁盘的MyISAM存储引擎。这样做的原因主要有两个:
1)内部临时表占用的空间超过min(tmp_table_size,max_heap_table_size)系统变量的限制
2)使用了TEXT/BLOB 列

 

 

d. Using filesort
MySQL中无法利用索引完成的排序操作称为“文件排序”

 

 

e. Using join buffer
改值强调了在获取连接条件时没有使用索引,并且需要连接缓冲区来存储中间结果。如果出现了这个值,那应该注意,根据查询的具体情况可能需要添加索引来改进能。

 

 

f. Impossible where
这个值强调了where语句会导致没有符合条件的行。

 

 

h. Select tables optimized away
这个值意味着仅通过使用索引,优化器可能仅从聚合函数结果中返回一行.

 

 

I. Index merges
当MySQL 决定要在一个给定的表上使用超过一个索引的时候,就会出现以下格式中的一个,详细说明使用的索引以及合并的类型。
Using sort_union(…)
Using union(…)
Using intersect(…)

四、查询性能优化

首先,让我们来看一下SQL语句执行的过程,下面这个是我们平时写的SQL语句。

 

 

然而当数据库接收到查询请求以后会先对数据进行解析,解析后查询顺序就变成了下面这样

 

 

了解了真实的MySQL查询顺序后,我们再来看一看SQL的优化目标。

  • 减少IO次数

IO永远是数据库最容易瓶颈的地方,这是由数据库的职责所决定的,大部分数据库操作中超过90%的时间都是 IO 操作所占用的,减少 IO 次数是 SQL 优化中需要第一优先考虑,当然,也是收效最明显的优化手段。

  • 降低 CPU 计算

除了 IO 瓶颈之外,SQL优化中需要考虑的就是 CPU 运算量的优化了。order by, group by,distinct … 都是消耗 CPU 的大户(这些操作基本上都是 CPU 处理内存中的数据比较运算)。当我们的 IO 优化做到一定阶段之后,降低 CPU 计算也就成为了我们 SQL 优化的重要目标。

基于这个目标我们来看下优化的基本原则

  • MySQL优化基本原则

1、选取最适用的字段类型,尽量避免浪费

MySQL可以很好的支持大数据量的存取,但是一般说来,数据库中的表越小,在它上面执行的查询也就会越快。因此,在创建表的时候,为了获得更好的性能,我们可以将表中字段的宽度设得尽可能小。

例如,在定义邮政编码这个字段时,如果将其设置为CHAR(255),显然给数据库增加了不必要的空间,甚至使用VARCHAR这种类型也是多余的,因为CHAR(6)就可以很好的完成任务了。同样的,如果可以的话,我们应该使用MEDIUMINT而不是BIGIN来定义整型字段。尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型,这会降低查询和连接的性能,并会增加存储开销。这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符,而对于数字型而言只需要比较一次就够了。

另外一个提高效率的方法是在可能的情况下,应该尽量把字段设置为NOTNULL,这样在将来执行查询的时候,数据库不用去比较NULL值。

2、使用连接(JOIN)来代替子查询(Sub-Queries)

虽然Join 性能并不佳,但是和 MySQL 的子查询比起来还是有非常大的性能优势。MySQL 的子查询执行计划一直存在较大的问题,虽然这个问题已经存在多年,但是到目前已经发布的所有稳定版本中都普遍存在,一直没有太大改善。虽然官方也在很早就承认这一问题,并且承诺尽快解决,但是至少到目前为止我们还没有看到哪一个版本较好的解决了这一问题。 在MySQL5.6或者更新的版本或者是MariaDB可以忽略关于子查询方面的建议

3、使用联合(UNION)来代替手动创建的临时表

union查询,它可以把需要使用临时表的两条或更多的select查询合并的一个查询中。在客户端的查询会话结束的时候,临时表会被自动删除,从而保证数据库整齐、高效。使用union来创建查询的时候,我们只需要用UNION作为关键字把多个select语句连接起来就可以了,要注意的是所有select语句中的字段数目要想同。

4、减少排序,为经常需要排序、分组和联合查询操作的字段建立索引

排序操作会消耗较多的 CPU 资源,所以减少排序可以在缓存命中率高等 IO 能力足够的场景下会较大影响 SQL 的响应时间。 对于MySQL来说,减少排序有多种办法,比如:

  • 通过利用索引来排序的方式进行优化
  • 减少参与排序的记录条数
  • 非必要不对数据进行排序

5、禁用外键

6、避免大sql

  • 一个SQL只能在一个cpu上运行
  • 高并发环境中,大SQL容易影响性能问题
  • 可能一个大SQL把数据库搞死 拆分SQL

7、保持事物的短小精悍

  • 即开即用,用完即关
  • 无关操作踢出事务,减少资源占用
  • 保持一致性的前提下,拆分事务

8、避免大批量更新

  • 避开高峰
  • 白天限制速度
  • 加sleep

9、避免取过量数据,灵活使用limit

当系统需要进行分页操作的时候,尽量使用limit加上偏移量的方法来实现,同时配合order by的子句

10、避免在SQL 语句中进行数学运算、函数计算、逻辑判断等操作

尤其需要注意,不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算,否则系统将可能无法正确使用索引。

11、避免OR

同一字段,推荐in 不同字段,推荐union

 

 

当然是用in 或者 not in的时候也需要谨慎一些

 

 

对于连续的数值,能用 between 就不要用 in 了:

 

 

12、优先优化高并发的 SQL,而不是执行频率低某些“大”SQL

13、尽可能对每一条运行在数据库中的SQL进行explain。

14、任何地方都不要使用 select * from t ,用具体的字段列表代替“*”,不要返回用不到的任何字段。

五、mysql索引

MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高MySQL的检索速度。索引分单列索引和组合索引。单列索引,即一个索引只包含单个列,一个表可以有多个单列索引,但这不是组合索引。组合索引,即一个索引包含多个列。创建索引时,你需要确保该索引是应用在 SQL 查询语句的条件(一般作为 WHERE 子句的条件)。

索引也会有它的缺点:虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行INSERT、UPDATE和DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件。

索引在设定的时候,会自动对数据进行排序,当一个表的数据超过800W+行以上的时候,索引的功能效果便不再明显,建立索引会占用磁盘空间的索引文件,一般会选择列值较短的,尽量使用列值唯一的。

索引的种类:

种类:B+树索引

分类:主键、唯一、普通索引

1、普通索引

最普通的索引,所有列都可以加

 

 

2、主键索引

建表的时候加的主键

 

 

3、组合索引

 

 

4、唯一索引

它与前面的普通索引类似,不同的就是:索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。它有以下几种创建方式:

 

 

那么我怎么样知道我当前的表是否添加了索引呢?

 

 

六、优化MySQL服务设置

  • 系统配置

系统配置一个指的是操作系统的配置,有一些操作系统的配置会影响mysql的性能,现在咱们大多数服务器都是用的linux服务器,linux上面一切东西都是基于文件的,mysql数据里面的表、数据等等都是文件存在磁盘上的。

linux系统有一个系统配置是文件打开的数量,默认是1024,也就是最多只能打开1024个文件,那在数据库里面表比较多、并发大的情况下,这1024就不够用了,要想获取数据就得打开文件,但是打开文件的数量最多就1024个,就会导致有一些数据获取不到,就得等待别的文件关闭之后,才能打开。那就要修改系统的配置,在/etc/security/limits.conf文件里面可以修改最大打开文件的数量。

 

 

还有一些mysql配置参数会影响mysql的性能。

sleep超时时间

mysql的连接数是提前配置好的,如果程序里面代码写的不好,有一些数据库操作没有及时关闭数据库,那这个链接就不会释放会一直占用链接,这样子并发大的情况下,就会导致数据库连接数不够用了,就连接不上数据库了。mysql默认8小时不操作数据库才会自动关闭链接,所以这个sleep的超时时间会影响mysql的性能。

 

 

 

mysql5.6.6之前默认是共享的表空间,mysql5.6.6之后默认是开启了独立表空间的。
那什么是共享表空间呢?
就是说这个空间是所有的表都共享的,所有的表的数据都存在一个地方的。
你想一下,所有的货架都存在一个仓库里面的话,快递员去拿货的时候,人一多,可能进出都要排队,拿货的时候就比较慢了。
所以说共享表空间如果在数据量和并发量比较大的情况下,对IO的消耗是比较大的,影响性能。
共享表空间还有一个缺点就是不能自动收缩,自动收缩是什么意思呢,刚建表的时候,表里面数据很少,就1条数据,可能占用空间就几kb,到后来数据多了,占用了10个G的空间,然后发现有一些数据都是垃圾数据,删了5个G,那这个时候表空间就不会自动减小了,它还是10个G,浪费空间。
而独立表空间就是每个表的表空间都是独享的,用仓库这个例子就是每个货架都单独在一个房间里头,这样的话快递员去拿哪个东西,直接去那个房间里就好了,不用都挤在一个仓库里了。
而使用了独立的表空间,每个表都有自己的表空间,删了数据也会自动收缩,就不会有上面的问题了。

 

 

读/写进程数配置

在mysql5.5之后读、写的进程数是可以配置的。默认读和写的进程数都是4个。

当然我们都知道,人多好干活嘛。进程多就是干活的人多,具体配置根据cpu的核数和业务逻辑来配置这两个值。

假如cpu是32核的,那么就是同时可以有32个进程在运行,就可以把这两个值给调大。

假如说是系统是一个内容类的网站,大多数操作都是读操作,那么就可以把读的进程数设置大一点,写的进程数设置的小一点。

怎么修改呢,找到mysql的配置文件,在[mysqld]节点下加入下面参数的即可

 

 

七、监控mysql

Spotlight on mysql客户端工具,有漂亮的ui界面,可以监控到mysql的io、qcache、连接数、buffer pool等等,还有预警的功能

Lepus,一个开源的国产监控平台,可以监控到mysql的慢查询、 qcache、连接数、buffer pool等等,可以同时监控多台,配置多个实例即可

Zabbix,也是一个开源的监控平台,和lepus类似,配置比较复杂






























以上是关于MYSQL监控调优的主要内容,如果未能解决你的问题,请参考以下文章

MySQL写压力性能监控与调优

MySQL监控调优

MySQL管理之道:性能调优高可用与监控 PDF扫描版[61MB] 完整版下载

Mysql监控调优

MySQL基础普及《MySQL管理之道:性能调优高可用与监控》

MySQL 监控性能调优及三范式理解