Redis(开发与运维):13---哈希/散列对象

Posted 2022-04-11 董哥的黑板报

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Redis(开发与运维):13---哈希/散列对象相关的知识，希望对你有一定的参考价值。

一、哈希对象简介

几乎所有的编程语言都提供了哈希（hash）类型，它们的叫法可能是哈希、字典、关联数组
哈希又称散列
在Redis中，哈希类型是指键值本身又是一个键值对结构，形如value=field1，value1，...fieldN，valueN，Redis键值对和哈希类型二者的关系可以下图表示

Redis(开发与运维):13---哈希/散列对象_redis

一些特点：

存储多个键值对之间的映射，并且键值对不允许重复
在某一个固定的key中，其对应value中的field也不允许重复
散列存储的值既可以是字符串也可以是数字值
用户同样可以对散列存储的数字值执行自增操作或自减操作
散列在很多方面是一个微缩版的Redis，不少字符串命令都有相应的散列版本
熟悉文档数据库的读者可以将散列看作是文档数据库里面的文档，而熟悉关系数据库的读者可以将散列看作是关系数据库里面的行。因为“文档、行、散列”这三者都允许用户同时访问或修改一个或多个域

注意：哈希类型中的映射关系叫作field-value，注意这里的value是指field对应的值，不是键对应的值，请注意value在不同上下文的作用
关于哈希的设计与实现还可以参阅：Redis(设计与实现):10---对象之哈希对象（hash）_董哥的黑板报的博客

二、命令

常用命令
hset：设置值。如果设置成功会返回1，反之会返回0
hset key field value
hsetnx：它们的关系就像set和setnx命令一样，只不过作用域由键变为field
hget：获取值。如果键或field不存在，返回nil
hget key field
hdel：删除field
hdel会删除一个或多个field，返回结果为成功删除field的个数
直到某一个key对应的field全部删除完全之后，该哈希对象才会被删除
hdel key field [field ...]
hlen：计算fileld个数
hlen key
hmget、hmset：批量获取/设置field-value
hmget key field [field ...]
hmset key field value [field value ...]
hstrlen：计算value的字符串长度（需要Redis3.2以上）
hstrlen key field
其他命令
hincrby、hincrbyfloat：hincrby和hincrbyfloat，就像incrby和incrbyfloat命令一样，但是它们的作用域是filed
hexists：判断field是否存在。field存在返回1，不包含返回0
hkeys：获取所有field
hkeys key
hvals：获取所有值
hvals key
hgetall：获取所有的field-value
hgetall key
提示：在使用hgetall时，如果哈希元素个数比较多，会存在阻塞Redis的可能。如果开发人员只需要获取部分field，可以使用hmget，如果一定要获取全部 field-value，可以使用hscan命令，该命令会渐进式遍历哈希类型，hscan可以参阅

下图给出了哈希类型命令的时间复杂度：

Redis(开发与运维):13---哈希/散列对象_用户信息_13

三、内部编码

哈希类型的内部编码有两种：

ziplist（压缩列表）：当哈希类型元素个数小于hash-max-ziplist-entries 配置（默认512个）、同时所有值都小于hash-max-ziplist-value配置（默认64 字节）时，Redis会使用ziplist作为哈希的内部实现，ziplist使用更加紧凑的结构实现多个元素的连续存储，所以在节省内存方面比hashtable更加优秀
hashtable（哈希表）：当哈希类型无法满足ziplist的条件时，Redis会使用hashtable作为哈希的内部实现，因为此时ziplist的读写效率会下降，而 hashtable的读写时间复杂度为O（1）

演示说明
当field个数比较少且没有大的value时，内部编码为ziplist：
当有value大于64字节，内部编码会由ziplist变为hashtable：
当field个数超过512，内部编码也会由ziplist变为hashtable

四、字符串和散列的比较与选择

散列的优点
散列的最大优势，只需要在数据库里面创建一个键，就可以把任意多的字段和值存储到散列里面
字符串的优点
虽然散列键命令和字符串键命令在部分功能上有重合的地方，但是字符串键命令提供的操作比散列键命令更为丰富。比如，字符串能够使用 SETRANGE 命令和 GETRANGE 命令设置或者读取字符串值的其中一部分，或者使用 APPEND 命令将新内容追加到字符串值的末尾，而散列键并不支持这些操作
再比如我们要设置键过期时间，键过期时间是针对整个键的，用户无法为散列中的不同字段设置不同的过期时间，所以当一个散列键过期的时候，他包含的所有字段和值都会被删除。与此相反，如果用户使用字符串键存储信息项，就不会遇到这样的问题——用户可以为每个字符串键分别设置不同的过期时间，让它们根据实际的需要自动被删除

字符串和散列的选择
使用场景对比：
如果程序需要为单个数据项单独设置过期的时间，那么使用字符串键。
如果程序需要对数据项执行诸如 SETRANGE、GETRANGE 或者 APPEND 等操作，那么优先考虑使用字符串键。当然，用户也可以选择把数据存储在散列中，然后将类似 SETRANG E、GETRANGE 这样的操作交给客户端执行
如果程序需要存储的数据项比较多，并且你希望尽可能地减少存储数据所需的内存，就应该优先考虑使用散列键
如果多个数据项在逻辑上属于同一组或者同一类，那么应该优先考虑使用散列键

五、使用场景

短网址生成程序
此时我们可以根据该短链接查询到具体的源网址，并记录点击次数

存储信息
下图为关系型数据表记录的两条用户信息，用户的属性作为表的列，每条用户信息作为行
如果将其用哈希类型存储，如下图所示：
相比于使用字符串序列化缓存用户信息，哈希类型变得更加直观，并且在更新操作上会更加便捷。可以将每个用户的id定义为键后缀，多对fieldvalue对应每个用户的属性，类似如下伪代码：
UserInfo getUserInfo(long id)
    // 用户id作为key后缀
    userRedisKey = "user:info:" + id;
    // 使用hgetall获取所有用户信息映射关系
    userInfoMap = redis.hgetAll(userRedisKey);
    UserInfo userInfo;
    if (userInfoMap != null) 
        // 将映射关系转换为UserInfo
        userInfo = transferMapToUserInfo(userInfoMap);
     else 
        // 从mysql中获取用户信息
        userInfo = mysql.get(id);
        // 将userInfo变为映射关系使用hmset保存到Redis中
        redis.hmset(userRedisKey, transferUserInfoToMap(userInfo));
        // 添加过期时间
        redis.expire(userRedisKey, 3600);
    
    return userInfo;
但是需要注意的是哈希类型和关系型数据库有两点不同之处：
哈希类型是稀疏的，而关系型数据库是完全结构化的，例如哈希类型每个键可以有不同的field，而关系型数据库一旦添加新的列，所有行都要为其设置值（即使为NULL），如下图所示
关系型数据库可以做复杂的关系查询，而Redis去模拟关系型复杂查询开发困难，维护成本高
三种方案
开发人员需要将两者的特点搞清楚，才能在适合的场景使用适合的技术。到目前为止，我们已经能够用三种方法缓存用户信息，下面给出三种方案的实现方法和优缺点分析
①原生字符串类型：每个属性一个键
优点：简单直观，每个属性都支持更新操作
缺点：占用过多的键，内存占用量较大，同时用户信息内聚性比较差，所以此种方案一般不会在生产环境使用
set user:1:name tom
set user:1:age 23
set user:1:city beijin
②序列化字符串类型：将用户信息序列化后用一个键保存。
优点：简化编程，如果合理的使用序列化可以提高内存的使用效率
缺点：序列化和反序列化有一定的开销，同时每次更新属性都需要把全部数据取出进行反序列化，更新后再序列化到Redis中
set user:1 serialize(userInfo)
③哈希类型：每个用户属性使用一对field-value，但是只用一个键保存
优点：简单直观，如果使用合理可以减少内存空间的使用
缺点：要控制哈希在ziplist和hashtable两种内部编码的转换，hashtable会消耗更多内存
hmset user:1 name tomage 23 city beijing

以上是关于Redis(开发与运维):13---哈希/散列对象的主要内容，如果未能解决你的问题，请参考以下文章