REDIS01_单线程的概述多线程的引入概述IO多路复用如何开启多线程

Posted 所得皆惊喜

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了REDIS01_单线程的概述多线程的引入概述IO多路复用如何开启多线程相关的知识,希望对你有一定的参考价值。

文章目录

①. Redis为什么选择单线程?

  • ①. 这种问法其实并不严谨,为啥这么说呢?
    Redis的版本很多3.x、4.x、6.x,版本不同架构也是不同的,不限定版本问是否单线程也不太严谨
  1. 版本3.x ,最早版本,也就是大家口口相传的redis是单线程
  2. 版本4.x,严格意义来说也不是单线程,而是负责处理客户端请求的线程是单线程,但是开始加了点多线程的东西(异步删除)
  3. 最新版本的6.0.x后,告别了大家印象中的单线程,用一种全新的多线程来解决问题。—实锤
  • ②. 有几个里程碑式的重要版本
    (5.0版本是直接升级到6.0版本,对于这个激进的升级,Redis之父antirez表现得很有信心和兴奋,所以第一时间发文来阐述6.0的一些重大功能"Redis 6.0.0 GA is out!")

  • ③. Redis3.x单线程时代但性能依旧很快的主要原因

  1. 基于内存操作:Redis 的所有数据都存在内存中,因此所有的运算都是内存级别的,所以他的性能比较高
  2. 数据结构简单:Redis 的数据结构是专门设计的,而这些简单的数据结构的查找和操作的时间大部分复杂度都是 O(1),因此性能比较高
  3. 多路复用和非阻塞 I/O:Redis使用 I/O多路复用功能来监听多个 socket连接客户端,这样就可以使用一个线程连接来处理多个请求,减少线程切换带来的开销,同时也避免了 I/O 阻塞操作
  4. 避免上下文切换:因为是单线程模型,因此就避免了不必要的上下文切换和多线程竞争,这就省去了多线程切换带来的时间和性能上的消耗,而且单线程不会导致死锁问题的发生
  • ④. 我们所说的Redis是单线程究竟何意?
  1. 主要是指Redis的网络IO和键值对读写是由一个线程来完成的,Redis在处理客户端的请求时包括获取 (socket 读)、解析、执行、内容返回 (socket 写) 等都由一个顺序串行的主线程处理,这就是所谓的“单线程”。这也是Redis对外提供键值存储服务的主要流程
  2. 但Redis的其他功能,比如持久化、异步删除、集群数据同步等等,其实是由额外的线程执行的。Redis工作线程是单线程的,但是,整个Redis来说,是多线程的

  • ⑤. Redis 4.0之前一直采用单线程的主要原因有以下三个
  1. https://redis.io/topics/faq
  2. 使用单线程模型是 Redis 的开发和维护更简单,因为单线程模型方便开发和调试;
  3. 即使使用单线程模型也并发的处理多客户端的请求,主要使用的是多路复用和非阻塞 IO
  4. 对于Redis系统来说,主要的性能瓶颈是内存或者网络带宽而并非CPU

②. 既然单线程这么好,为什么逐渐又加入了多线程特性?

  • ①. 单线程也有单线程的苦恼(举个例子)
  1. 正常情况下使用del指令可以很快的删除数据,而当被删除的key是一个非常大的对象时,例如时包含了成千上万个元素的hash集合时,那么del指令就会造成Redis主线程卡顿
  2. 这就是redis3.x单线程时代最经典的故障,大key删除的头疼问题
  3. 由于redis是单线程的,del bigKey…(等待很久这个线程才会释放,类似加了一个synchronized锁,你可以想象高并发下,程序堵成什么样子?)
  • ②. 如何解决:使用惰性删除可以有效的避免Redis卡顿的问题

  • ③. 案列:

  1. 比如当我(Redis)需要删除一个很大的数据时,因为是单线程同步操作,这就会导致Redis服务卡顿
  2. 于是在Redis 4.0 中就新增了多线程的模块,当然此版本中的多线程主要是为了解决删除数据效率比较低的问题的
  3. 因为Redis是单个主线程处理,redis之父antirez一直强调"Lazy Redis is better Redis",而lazy free的本质就是把某些cost(主要时间复制度,占用主线程cpu时间片)较高删除操作,从redis主线程剥离让bio子线程来处理,极大地减少主线阻塞时间。从而减少删除导致性能和稳定性问题

  • ④. 在Redis 4.0就引入了多个线程来实现数据的异步惰性删除等功能,但是其处理读写请求的仍然只有一个线程,所以仍然算是狭义上的单线程。

③. redis6的多线程和IO多路复用入门篇

  • ①. 对于Redis主要的性能瓶颈是内存或者网络带宽而并非CPU

  • ②. 最后Redis的瓶颈可以初步定为:网络IO(redis6,真正多线程登场)

  • ③. Unix网络编程中的五种IO模型

  1. Blocking IO - 阻塞IO
  2. NoneBlocking IO - 非阻塞IO
  3. IO multiplexing - IO多路复用
  4. signal driven IO - 信号驱动IO
  5. asynchronous IO - 异步IO
  • ④. IO multiplexing - IO多路复用
  1. 这是IO模型的一种,即经典的Reactor设计模式,
  2. I/O 多路复用,简单来说就是通过监测文件的读写事件再通知线程执行相关操作,保证 Redis 的非阻塞 I/O 能够顺利执行完成的机制
  3. 多路指的是多个socket连接,复用指的是复用一个线程。多路复用主要有三种技术:select,poll,epoll
  4. epoll是最新的也是目前最好的多路复用技术。采用多路 I/O 复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络IO的时间消耗),且Redis在内存中操作数据的速度非常快(内存内的操作不会成为这里的性能瓶颈),主要以上两点造就了Redis具有很高的吞吐量
  • ⑤. Redis工作线程是单线程的,但是整个Redis来说,是多线程的;

  • ⑥. I/O 的读和写本身是堵塞的,比如当 socket 中有数据时,Redis 会通过调用先将数据从内核态空间拷贝到用户态空间,再交给 Redis 调用,而这个拷贝的过程就是阻塞的,当数据量越大时拷贝所需要的时间就越多,而这些操作都是基于单线程完成的

  • ⑦. 在 Redis 6.0 中新增了多线程的功能来提高 I/O 的读写性能,他的主要实现思路是将主线程的 IO 读写任务拆分给一组独立的线程去执行,这样就可以使多个 socket 的读写可以并行化了,采用多路 I/O 复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络IO的时间消耗),将最耗时的Socket的读取、请求解析、写入单独外包出去,剩下的命令执行仍然由主线程串行执行并和内存的数据交互
    (结合上图可知,网络IO操作就变成多线程化了,其他核心部分仍然是线程安全的,是个不错的折中办法)

  • ⑧. Redis 6.0 将网络数据读写、请求协议解析通过多个IO线程的来处理 ,对于真正的命令执行来说,仍然使用主线程操作

④. Redis6.0默认是否开启了多线程?

  • ①. Redis将所有数据放在内存中,内存的响应时长大约为100纳秒,对于小数据包,Redis服务器可以处理8W到10W的QPS,这也是Redis处理的极限了,对于80%的公司来说,单线程的Redis已经足够使用了

  • ②. 在Redis6.0中,多线程机制默认是关闭的,如果需要使用多线程功能,需要在redis.conf中完成两个设置

  1. 设置io-thread-do-reads配置项为yes,表示启动多线程。
  2. 设置线程个数。关于线程数的设置,官方的建议是如果为4核的 CPU,建议线程数设置为2或3,如果为8核CPU 建议线程数设置为 6,线程数一定要小于机器核数,线程数并不是越大越好

⑤. REDIS多线程引入总结

  • ①. Redis自身出道就是优秀,基于内存操作、数据结构简单、多路复用和非阻塞 I/O、避免了不必要的线程上下文切换等特性,在单线程的环境下依然很快

  • ②. 但对于大数据的key删除还是卡顿厉害,因此在 Redis 4.0 引入了多线程unlink key/flushall async 等命令,主要用于Redis数据的异步删除

  • ③. Redis 6.0 将网络数据读写、请求协议解析通过多个IO线程的来处理,而命令的执行依旧是由主线程串行执行的,因此在多线程下操作Redis不会出现线程安全的问题

  • ④. Redis无论是当初的单线程设计,还是如今与当初设计相背的多线程,目的只有一个:让 Redis 变得越来越快

以上是关于REDIS01_单线程的概述多线程的引入概述IO多路复用如何开启多线程的主要内容,如果未能解决你的问题,请参考以下文章

2023-05-30:Redis6.0为什么要引入多线程呢?

Redis单线程还是多线程?IO多路复用原理

详述 Redis 选择单线程模型的原因以及 I/O 多路复用

Redis 安装

Redis 6.0引入的多线程机制简介

python 线程和进程概述