2023-06-01:讲一讲Redis常见数据结构以及使用场景。

Posted 福大大架构师每日一题

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2023-06-01:讲一讲Redis常见数据结构以及使用场景。相关的知识,希望对你有一定的参考价值。

2023-06-01:讲一讲Redis常见数据结构以及使用场景。

答案2023-06-01:

字符串(String)

适合场景

缓存功能

Redis 作为缓存层,MySQL 作为存储层,在大部分请求中,数据的读取通常是从 Redis 中获取。由于 Redis 具有支持高并发的特性,因此缓存层通常能够加速读写操作,并减轻后端服务的压力。采用 Redis 缓存层通常可以提高系统性能和稳定性,同时更好地保护 MySQL 数据库。

计数

使用 Redis 作为计数的基础工具,可以实现快速计数和查询缓存的功能。Redis 的高并发读写特性使其非常适合作为计数器,能够快速、可靠地处理大量的计数请求。此外,Redis 还支持数据的异步落地到其他数据源,例如 MySQL 数据库等,从而保证数据的安全和可靠性。

共享Session

当一个分布式 Web 服务将用户的 Session 信息(例如用户登录信息)保存在各自服务器中时,出于负载均衡的考虑,分布式服务会将用户的访问均衡到不同服务器上。这可能会产生一个问题,即用户可能需要重新登录,因为他们的 Session 信息没有被持续地存储和共享。这个问题对于用户来说是无法容忍的。

为了解决这个问题,可以使用 Redis 将用户的 Session 进行集中管理。在这种模式下,只需要保证 Redis 具备高可用性和扩展性,并且每次用户更新或查询登录信息都直接从 Redis 中获取即可。

通过使用 Redis,可以实现分布式 Web 服务中 Session 信息的共享和管理。Redis 具有出色的高并发读写能力和快速响应速度,能够有效地维护大量的 Session 数据。此外,Redis 的数据持久化和备份机制也能够确保数据的安全性和可靠性。

限速

许多应用为了保证安全性,在每次用户登录时会要求输入手机验证码以验证用户身份。但是,为避免短信接口被频繁访问,通常会限制用户获取验证码的频率,例如一分钟不能超过5次。此外,一些网站也会限制同一 IP 地址在一秒钟之内的访问次数,以保护系统的安全。通过限速机制,可以有效地控制用户的访问频率,从而保护系统的稳定性和安全性。

哈希(Hash)

在 Java 中,提供了 HashMap 数据结构来实现哈希算法。而在 Redis 中,也有类似的数据结构,称之为哈希类型。需要注意的是,在哈希类型中,映射关系被称作 field-value,其中 value 指的是与 field 对应的值,而不是键所对应的值。

适合场景

使用 Redis 的哈希类型可以更好地管理对象型数据,并且在合理使用的情况下可以减少内存消耗。因此,在实际开发中,我们应该根据业务需求和实际情况选择合适的数据结构来进行存储和管理。

我们可以比较下,如果数据库中表记录user为:

id name age
1 lijin 18
2 msb 20

1、使用String类型

需要一条条去插入获取。

set user:1:name lijin;

set user:1:age  18;

set user:2:name msb;

set user:2:age  20;

优点:简单直观,每个键对应一个值.

缺点:键数过多,占用内存多,用户信息过于分散,不适合在生产环境中使用。

2、使用hash类型

hmset user:1 name lijin age 18

hmset user:2 name msb age 20

优点:简单直观,使用合理可减少内存空间消耗。

列表(list)

Redis 的列表(list)类型是一种用于存储多个有序字符串的数据结构。一个列表由多个元素按照从左到右的顺序组成,每个元素都可以是一个字符串。例如,a、b、c、c、b 四个字符串可以组成一个有序的列表。

列表中的每个字符串称为元素(element),一个列表最多可以存储 (2^32-1)个元素(4294967295)。在 Redis 中,可以使用列表类型来实现队列、栈等数据结构,同时还能够支持插入、删除等操作,具有出色的灵活性和可扩展性。

适合场景

当每个用户都有自己的文章列表并需要进行分页展示时,可以考虑使用 Redis 的列表类型。因为列表不仅是有序的,而且支持按照索引范围获取元素,非常适合用于实现分页等功能。

在 Redis 中,可以将每个用户的文章列表存储为一个列表,并通过 lrange 命令来获取指定范围内的元素。例如,可以使用以下命令来获取第 2 页的文章列表:

lrange user:1:article_list 20 39

消息队列,Redis 提供了消息队列的支持,可以使用 lpush+brpop 命令组合来实现阻塞队列。生产者客户端通过 lpush 命令将消息从列表的左侧插入队列中,而多个消费者客户端则通过 brpop 命令在列表的尾部等待阻塞式地抢占队列中的元素。多个客户端之间的合作能够保证消费的负载均衡和高可用性。

使用 Redis 的消息队列可以有效地解决异步任务处理、流量限制、延迟任务调度等问题,具有出色的灵活性和扩展性。因此,在实际开发中,Redis 的消息队列是一种非常重要且常用的技术,需要注意其使用方式和实现原理,并根据实际需求进行合理的配置和管理。

集合(set)

集合( set)类型也是用来保存多个的字符串元素,但和列表类型不一样的是,集合中不允许有重复元素,并且集合中的元素是无序的,不能通过索引下标获取元素。

适合场景

Redis 的集合类型在标签(tag)的存储和管理方面应用广泛。例如,一个用户可能对娱乐、体育比较感兴趣,另一个用户可能对历史、新闻比较感兴趣,这些兴趣点就是标签。

使用 Redis 的集合类型,可以轻松地实现对用户兴趣标签的存储和管理,并根据用户的标签相似度来实现个性化推荐。例如,电子商务网站针对不同标签的用户做出不同类型的推荐,比如对数码产品感兴趣的人,推荐最新的数码产品,这将有助于增加网站的利润和用户黏度。

除了标签管理外,集合还可以通过生成随机数进行比如抽奖活动等其他功能。此外,Redis 的集合类型还支持交、并、差等操作,以及集合和有序集合之间的转换功能,能够快速高效地进行数据处理和管理。

有序集合(ZSET)

Redis 的有序集合类型相对于哈希、列表、集合来说可能会比较陌生,但是它和普通的集合类型有一些共同的特点,例如保留了不能有重复成员的特性。不同之处在于,有序集合中的元素具有可排序的特性。

有序集合通过给每个元素设置一个分数(score)来实现排序,而不像列表使用索引下标作为排序依据。

Redis 的有序集合类型中的元素不能重复,但是一个元素的分数在集合中可以存在多个相同的值,类似于班里的学生学号不能重复,但考试成绩可以相同。

Redis 的有序集合类型提供了一些非常实用的功能,例如基于分数范围的查询和统计操作,以及成员排名等。适当地利用有序集合类型,可以帮助我们在实际开发中更好地解决各种问题。

Redis 的有序集合类型非常适合用于实现排行榜系统,例如在视频网站中对用户上传的视频按照播放数量、点赞数等多个维度进行排行。

通过使用有序集合,可以轻松地将每个视频以及对应的播放量、点赞数等信息存储到 Redis 中,并根据这些信息计算出每个视频的排名。例如,可以使用以下命令向有序集合中添加新的元素:

zadd videos:views 1000 "video1"
zadd videos:views 2000 "video2"
zadd videos:likes 500 "video1"
zadd videos:likes 800 "video2"

其中,videos:views 和 videos:likes 分别表示按照播放量和点赞数排列的有序集合名称,"video1" 和 "video2" 则是视频的名称,1000、2000、500、800 则表示对应的播放量和点赞数。使用 zrange 或 zrevrange 命令即可按照指定分数范围获取元素,或者使用 zrank 和 zrevrank 命令获取指定元素的排名和反向排名等。

经典面试题|讲一讲JVM的组成

JVM(Java 虚拟机)算是面试必问的问题的了,而但凡问 JVM 一定会问的第一个问题就是:讲一讲 JVM 的组成?那本文就注重讲一下 JVM 的组成。

首先来说 JVM 的组成分为,整体组成部分和运行时数据区组成部分,一般开发者关注的和面试官问的都是后者,但本文会详细讲解以上两个组成部分。

一、JVM 整体组成

JVM 整体组成可分为以下四个部分:

  1. 类加载器(ClassLoader)

  2. 运行时数据区(Runtime Data Area)

  3. 执行引擎(Execution Engine)

  4. 本地库接口(Native Interface)

各个组成部分的用途:

程序在执行之前先要把java代码转换成字节码(class文件),jvm首先需要把字节码通过一定的方式 类加载器(ClassLoader) 把文件加载到内存中 运行时数据区(Runtime Data Area) ,而字节码文件是jvm的一套指令集规范,并不能直接交个底层操作系统去执行,因此需要特定的命令解析器 执行引擎(Execution Engine) 将字节码翻译成底层系统指令再交由CPU去执行,而这个过程中需要调用其他语言的接口 本地库接口(Native Interface)来实现整个程序的功能,这就是这4个主要组成部分的职责与功能。

而我们通常所说的jvm组成指的是运行时数据区(Runtime Data Area),因为通常需要程序员调试分析的区域就是“运行时数据区”,或者更具体的来说就是“运行时数据区”里面的Heap(堆)模块,那接下来我们来看运行时数据区(Runtime Data Area)是由哪些模块组成的。

二、运行时数据区组成

jvm的运行时数据区,不同虚拟机实现可能略微有所不同,但都会遵从Java虚拟机规范,Java 8 虚拟机规范规定,Java虚拟机所管理的内存将会包括以下几个运行时数据区域:

  1. 程序计数器(Program Counter Register)

  2. Java虚拟机栈(Java Virtual Machine Stacks)

  3. 本地方法栈(Native Method Stack)

  4. Java堆(Java Heap)

  5. 方法区(Methed Area)

接下来我们分别介绍每个区域的用途。

①、Java程序计数器

程序计数器(Program Counter Register)是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里,字节码解析器的工作是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。

特性:内存私有

由于jvm的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,也就是任何时刻,一个处理器(或者说一个内核)都只会执行一条线程中的指令。因此为了线程切换后能恢复到正确的执行位置,每个线程都有独立的程序计数器。

异常规定:无

如果线程正在执行Java中的方法,程序计数器记录的就是正在执行虚拟机字节码指令的地址,如果是Native方法,这个计数器就为空(undefined),因此该内存区域是唯一一个在Java虚拟机规范中没有规定OutOfMemoryError的区域。

②、Java虚拟机栈

Java虚拟机栈(Java Virtual Machine Stacks)描述的是Java方法执行的内存模型,每个方法在执行的同时都会创建一个线帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息,每个方法从调用直至执行完成的过程,都对应着一个线帧在虚拟机栈中入栈到出栈的过程。

特性:内存私有,它的生命周期和线程相同。

异常规定:StackOverflowError、OutOfMemoryError

1、如果线程请求的栈深度大于虚拟机所允许的栈深度就会抛出StackOverflowError异常。

2、如果虚拟机是可以动态扩展的,如果扩展时无法申请到足够的内存就会抛出OutOfMemoryError异常。

③、本地方法栈

本地方法栈(Native Method Stack)与虚拟机栈的作用是一样的,只不过虚拟机栈是服务Java方法的,而本地方法栈是为虚拟机调用Native方法服务的。

在Java虚拟机规范中对于本地方法栈没有特殊的要求,虚拟机可以自由的实现它,因此在Sun HotSpot虚拟机直接把本地方法栈和虚拟机栈合二为一了。

特性和异常: 同虚拟机栈,请参考上面知识点。

④、Java堆

Java堆(Java Heap)是Java虚拟机中内存最大的一块,是被所有线程共享的,在虚拟机启动时候创建,Java堆唯一的目的就是存放对象实例,几乎所有的对象实例都在这里分配内存,随着JIT编译器的发展和逃逸分析技术的逐渐成熟,栈上分配、标量替换优化的技术将会导致一些微妙的变化,所有的对象都分配在堆上渐渐变得不那么“绝对”了。

特性:内存共享

异常规定:OutOfMemoryError

如果在堆中没有内存完成实例分配,并且堆不可以再扩展时,将会抛出OutOfMemoryError。

Java虚拟机规范规定,Java堆可以处在物理上不连续的内存空间中,只要逻辑上连续即可,就像我们的磁盘空间一样。在实现上也可以是固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是可扩展的,通过-Xmx和-Xms控制。

⑤、方法区

方法区(Methed Area)用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译后的代码等数据。

误区:方法区不等于永生代

很多人原因把方法区称作“永久代”(Permanent Generation),本质上两者并不等价,只是HotSpot虚拟机垃圾回收器团队把GC分代收集扩展到了方法区,或者说是用来永久代来实现方法区而已,这样能省去专门为方法区编写内存管理的代码,但是在Jdk8也移除了“永久代”,使用Native Memory来实现方法区。

特性:内存共享

异常规定:OutOfMemoryError

当方法无法满足内存分配需求时会抛出OutOfMemoryError异常。

三、扩展知识

本节将扩展一些和内存分配有关的知识。

运行时常量池

运行时常量池是方法区的一部分,Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table)用于存放编译期生成的各种字面量和符号引用,这部分在类加载后进入方法区的运行是常量池中,如String类的intern()方法。

直接内存

直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,但这部分内存也会被频繁的使用,而且可能导致OutOfMemoryError。在JDK 1.4中新加入了NIO类,引入了一种基于Channel与缓冲区Buffer的IO方式,它通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用操作,它因此更高效,它避免了Java堆和Native堆来回交换数据的时间。

注意 :直接内存分配不会受到Java堆大小的限制,但是受到本机总内存大小限制,在设置虚拟机参数的时候,不能忽略直接内存,把实际内存设置为-Xmx,使得内存区域的总和大于物理内存的限制,从而导致动态扩展时出现OutOfMemoryError异常。

四、总结

本文讲了jvm的主要组成部分,以及组成部分中最重要的运行时数据区(Runtime Data Area)的构成,其中程序计数器、虚拟机栈和本地方法为私有内存,会随着线程而生,随着线程而灭,而Java堆作为最大的内存区域将是开发人员重点关注的内存区域,还有方法区以及运行时常量区与永生代的关系,最后讲了直接内存的实现过程已经使用时需要主要的点,希望能够帮助大家更好的理解jvm。

五、参考资料

《深入理解Java虚拟机》

【End】

以上是关于2023-06-01:讲一讲Redis常见数据结构以及使用场景。的主要内容,如果未能解决你的问题,请参考以下文章

经典面试题|讲一讲JVM的组成

经典面试题|讲一讲JVM的组成

经典面试题 | 讲一讲JVM的组成

讲一讲什么叫阻塞非阻塞同步异步

讲一讲MySQL如何防止“老鼠屎”类型的SQL语句

面试官:讲一讲你对数据结构——数组链表栈队列的理解