redis入门到精通系列:redis高级数据类型详解(BitMaps,HyperLogLog,GEO)

Posted edda

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了redis入门到精通系列:redis高级数据类型详解(BitMaps,HyperLogLog,GEO)相关的知识,希望对你有一定的参考价值。

高级数据类型和五种基本数据类型不同,并非新的数据结构。高级数据类型往往是用来解决一些业务场景。

(一)BitMaps

(1.1) BitMaps概述

在应用场景中,有一些数据只有两个属性,比如是否是学生,是否是党员等等,对于这些数据,最节约内存的方式就是用bit去记录,以是否是学生为例,1代表是学生,0代表不是学生。那么1000110就代表7个人中3个是学生,这就是BitMaps的存储需求。

Bitmaps是一个可以对位进行操作的字符串,我们可以把Bitmaps想象成是一串二进制数字,每个位置只存储0和1。下标是Bitmaps的偏移量(offset)

(1.2) BitMaps操作

获取指定key对应的偏移量上的bit值

getbit key offset

设置指定key对应偏移量上的bit值,value只能是1或0

setbit key offset value

技术图片 

对指定key按位进行交、并、非、异或操作,并把结果保存到destKey中

  1. bitop and destKey key1 key2.... //交
  2. bitop or destKey key1 key2.... //并
  3. bitop not destKey key1 key2.... //非
  4. bitop xor destKey key1 key2.... //异或

统计指定key中1的数量

bitcount key start end

(1.3) BitMaps应用场景

我们假设一家公司要统计他们所有注册会员的每日/每周/每年登陆网站的情况,就可以使用BitMaps。其中每日登陆会员数量的统计方法如下:建立一个key值为当前日期的BitMaps,当id为5的会员登陆时,设置偏移量为4(下标从0开始),将BitMaps偏移量为4的数设置为1,以此类推。统计每日登陆的会员数就用bitcount命令统计即可。

统计每周登陆会员数量的方法如下:对于统计每周登陆会员数,只需要将一周7天的数据使用并(or)操作计算即可。一个会员只要有一天的值等于1,那么并操作之后他的值就等于1,说明这一周他登陆了。再用bitcount统计即可。

(二)HyperLogLog

HyperLogLog是用来做基数统计的,所谓基数统计,就是指一串数字中不重复的数字个数,如{1,2,1,2,3}的基数就是3。

添加数据:

pfadd key element1 element2...

统计数据

pfcount key1 key2...

合并数据

pfmerge destkey sourcekey1 sourcekey2...

技术图片 

HyperLogLog使用问题:

首先HyperLogLog只能记录数据。

由于核心的基数估计算法,在数量很大时有0.81%的误差

占用空间很小,每个hyperLogLog只占用12k的内存。

pfadd命令不是一次性分配12k的数据,会随着基数的增加内存逐渐增大。

pfmerge命令合并后占用的存储空间为12k,无论之前的数据量为多少。

(三)GEO

GEO是redis中关于地理位置计算的高级数据类型,比如微信中的附近好友会展示好友离你的距离,这就是GEO的一个应用。

添加坐标点:

geoadd key longitude latitude member [longitude latitude member...]

获取坐标点

geopos key member

计算坐标距离

geodist key member1 member2 [unit] unit表示单位,默认m,可以设置 km, ft, mi

为了简单起见我把横纵坐标用简单的数字表示

技术图片 

根据坐标求范围内的数据(withcoord显示坐标,withdist显示距离,withhash显示hash值,count count用来取范围)

georadius key longitude latitude radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]

根据点求范围内数据

georadiusbymember key member radius m|km|ft|mi  [withcoord] [withdist] [withhash] [count count]

获取指定点对应的坐标hash值

geohash key member1 member2...

以上是关于redis入门到精通系列:redis高级数据类型详解(BitMaps,HyperLogLog,GEO)的主要内容,如果未能解决你的问题,请参考以下文章

redis入门到精通系列:redis操作的两个实践案例

redis入门到精通系列:redis操作的两个实践案例

redis入门到精通系列:redis的事务详解

redis入门到精通系列:redis的事务详解

Redis从入门到精通:初级篇

redis入门到精通系列:redis的持久化操作(RDBAOF)