阿里大厂面试:2亿条数据需要缓存,如何设计这个存储方案?

Posted 互联网老辛

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了阿里大厂面试:2亿条数据需要缓存,如何设计这个存储方案?相关的知识,希望对你有一定的参考价值。

对于2亿条数据需要缓存,使用单机肯定是不可能了,至少是分布式存储。

而分布式存储我们可以选择的选项有很多,今天我们单独来讨论下redis的解决方案。

使用redis如何落地。

在阿里p7工程案例和场景设计中,这一类的确是必问题,我们一般有三种解决方案:

第一种: 哈希取余算法


2亿条记录假设2亿个k,v,我们单机不行必须要分布式多机,假设有3台机器构成一个集群,用户每次读写操作都是根据公式:

hash(key) % N个机器台数,计算出哈希值,用来决定数据映射到哪一个节点上。

比如0,就是最左的,1是中间的,2是最右边的。

这种方案是最常用的,也是最通用的

优点:
简单粗暴,直接有效,只需要预估好数据规划好节点,例如3台、8台、10台,就能保证一段时间的数据支撑。使用Hash算法让固定的一部分请求落到同一台服务器上,这样每台服务器固定处理一部分请求(并维护这些请求的信息),起到负载均衡+分而治之的作用。

缺点:
原来规划好的节点,进行扩容或者缩容就比较麻烦了,不管扩缩,每次数据变动导致节点有变动&#

以上是关于阿里大厂面试:2亿条数据需要缓存,如何设计这个存储方案?的主要内容,如果未能解决你的问题,请参考以下文章

2Docker下安装Redis集群:cluster(集群)模式-docker版,哈希槽分区进行亿级数据存储

中高级Java大厂高频面试题,Spring注解驱动开发

阿里面试官:MySQL如何设计索引更高效?

面试必问的缓存使用:如何保证数据一致性缓存设计模式

阿里字节腾讯等大厂Java岗MySQL面试高频面试题整理

java程序设计与实践教程第二版课后答案,成功入职阿里