Redis实战之附近商户用户签到UV 统计

Posted 爱上口袋的天空

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Redis实战之附近商户用户签到UV 统计相关的知识,希望对你有一定的参考价值。

目录

一、附近商户

1、GEO 数据结构的基本用法

 2、 附近商户 - 导入店铺数据到 GEO

2.1、具体场景说明:

 3、附近商户 - 实现附近商户功能

二、用户签到

1、BitMap 功能演示

2、实现签到功能

2.1、需求:实现签到接口,将当前用户当天签到信息保存到 Redis 中

 3、签到统计

3.1、需求:实现下面接口,统计当前用户截止当前时间在本月的连续签到天数

三、UV 统计

1、UV 统计 - HyperLogLog

 2、UV 统计 - 测试百万数据的统计


一、附近商户

1、GEO 数据结构的基本用法

        GEO 就是 Geolocation 的简写形式,代表地理坐标。Redis 在 3.2 版本中加入了对 GEO 的支持,允许存储地理坐标信息,帮助我们根据经纬度来检索数据。常见的命令有:

  • GEOADD:添加一个地理空间信息,包含:经度(longitude)、纬度(latitude)、值(member)
  • GEODIST:计算指定的两个点之间的距离并返回
  • GEOHASH:将指定 member 的坐标转为 hash 字符串形式并返回
  • GEOPOS:返回指定 member 的坐标
  • GEORADIUS:指定圆心、半径,找到该圆内包含的所有 member,并按照与圆心之间的距离排序后返回。6. 以后已废弃
  • GEOSEARCH:在指定范围内搜索 member,并按照与指定点之间的距离排序后返回。范围可以是圆形或矩形。6.2. 新功能
  • GEOSEARCHSTORE:与 GEOSEARCH 功能一致,不过可以把结果存储到一个指定的 key。 6.2. 新功能

 2、 附近商户 - 导入店铺数据到 GEO

2.1、具体场景说明:

        当我们点击美食之后,会出现一系列的商家,商家中可以按照多种排序方式,我们此时关注的是距离,这个地方就需要使用到我们的 GEO,向后台传入当前 app 收集的地址 (我们此处是写死的) ,以当前坐标作为圆心,同时绑定相同的店家类型 type,以及分页信息,把这几个条件传入后台,后台查询出对应的数据再返回。

        我们要做的事情是:将数据库表中的数据导入到 redis 中去,redis 中的 GEO,GEO 在 redis 中就一个 member 和一个经纬度,我们把 x 和 y 轴传入到 redis 做的经纬度位置去,但我们不能把所有的数据都放入到 menber 中去,毕竟作为 redis 是一个内存级数据库,如果存海量数据,redis 还是力不从心,所以我们在这个地方存储他的 id 即可。

        但是这个时候还有一个问题,就是在 redis 中并没有存储 type,所以我们无法根据 type 来对数据进行筛选,所以我们可以按照商户类型做分组,类型相同的商户作为同一组,以 typeId 为 key 存入同一个 GEO 集合中即可

代码

HmDianPingApplicationTests

@Test
void loadShopData() 
    // 1.查询店铺信息
    List<Shop> list = shopService.list();
    // 2.把店铺分组,按照typeId分组,typeId一致的放到一个集合
    Map<Long, List<Shop>> map = list.stream().collect(Collectors.groupingBy(Shop::getTypeId));
    // 3.分批完成写入Redis
    for (Map.Entry<Long, List<Shop>> entry : map.entrySet()) 
        // 3.1.获取类型id
        Long typeId = entry.getKey();
        String key = SHOP_GEO_KEY + typeId;
        // 3.2.获取同类型的店铺的集合
        List<Shop> value = entry.getValue();
        List<RedisGeoCommands.GeoLocation<String>> locations = new ArrayList<>(value.size());
        // 3.3.写入redis GEOADD key 经度 纬度 member
        for (Shop shop : value) 
            // stringRedisTemplate.opsForGeo().add(key, new Point(shop.getX(), shop.getY()), shop.getId().toString());
            locations.add(new RedisGeoCommands.GeoLocation<>(
                    shop.getId().toString(),
                    new Point(shop.getX(), shop.getY())
            ));
        
        stringRedisTemplate.opsForGeo().add(key, locations);
    

 3、附近商户 - 实现附近商户功能

SpringDataRedis 的 2.3.9 版本并不支持 Redis 6.2 提供的 GEOSEARCH 命令,因此我们需要提示其版本,修改自己的 POM

第一步:导入 pom

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-data-redis</artifactId>
    <exclusions>
        <exclusion>
            <artifactId>spring-data-redis</artifactId>
            <groupId>org.springframework.data</groupId>
        </exclusion>
        <exclusion>
            <artifactId>lettuce-core</artifactId>
            <groupId>io.lettuce</groupId>
        </exclusion>
    </exclusions>
</dependency>
<dependency>
    <groupId>org.springframework.data</groupId>
    <artifactId>spring-data-redis</artifactId>
    <version>2.6.2</version>
</dependency>
<dependency>
    <groupId>io.lettuce</groupId>
    <artifactId>lettuce-core</artifactId>
    <version>6.1.6.RELEASE</version>
</dependency>

第二步:

ShopController

@GetMapping("/of/type")
public Result queryShopByType(
        @RequestParam("typeId") Integer typeId,
        @RequestParam(value = "current", defaultValue = "1") Integer current,
        @RequestParam(value = "x", required = false) Double x,
        @RequestParam(value = "y", required = false) Double y
) 
   return shopService.queryShopByType(typeId, current, x, y);

 ShopServiceImpl

@Override
    public Result queryShopByType(Integer typeId, Integer current, Double x, Double y) 
        // 1.判断是否需要根据坐标查询
        if (x == null || y == null) 
            // 不需要坐标查询,按数据库查询
            Page<Shop> page = query()
                    .eq("type_id", typeId)
                    .page(new Page<>(current, SystemConstants.DEFAULT_PAGE_SIZE));
            // 返回数据
            return Result.ok(page.getRecords());
        

        // 2.计算分页参数
        int from = (current - 1) * SystemConstants.DEFAULT_PAGE_SIZE;
        int end = current * SystemConstants.DEFAULT_PAGE_SIZE;

        // 3.查询redis、按照距离排序、分页。结果:shopId、distance
        String key = SHOP_GEO_KEY + typeId;
        GeoResults<RedisGeoCommands.GeoLocation<String>> results = stringRedisTemplate.opsForGeo() // GEOSEARCH key BYLONLAT x y BYRADIUS 10 WITHDISTANCE
                .search(
                        key,
                        GeoReference.fromCoordinate(x, y),
                        new Distance(5000),
                        RedisGeoCommands.GeoSearchCommandArgs.newGeoSearchArgs().includeDistance().limit(end)
                );
        // 4.解析出id
        if (results == null) 
            return Result.ok(Collections.emptyList());
        
        List<GeoResult<RedisGeoCommands.GeoLocation<String>>> list = results.getContent();
        if (list.size() <= from) 
            // 没有下一页了,结束
            return Result.ok(Collections.emptyList());
        
        // 4.1.截取 from ~ end的部分
        List<Long> ids = new ArrayList<>(list.size());
        Map<String, Distance> distanceMap = new HashMap<>(list.size());
        list.stream().skip(from).forEach(result -> 
            // 4.2.获取店铺id
            String shopIdStr = result.getContent().getName();
            ids.add(Long.valueOf(shopIdStr));
            // 4.3.获取距离
            Distance distance = result.getDistance();
            distanceMap.put(shopIdStr, distance);
        );
        // 5.根据id查询Shop
        String idStr = StrUtil.join(",", ids);
        List<Shop> shops = query().in("id", ids).last("ORDER BY FIELD(id," + idStr + ")").list();
        for (Shop shop : shops) 
            shop.setDistance(distanceMap.get(shop.getId().toString()).getValue());
        
        // 6.返回
        return Result.ok(shops);
    

 


二、用户签到

1、BitMap 功能演示

我们针对签到功能完全可以通过 mysql 来完成,比如说以下这张表

  • 用户一次签到,就是一条记录,假如有 1000 万用户,平均每人每年签到次数为 10 次,则这张表一年的数据量为 1 亿条
  • 每签到一次需要使用(8 + 8 + 1 + 1 + 3 + 1)共 22 字节的内存,一个月则最多需要 600 多字节
  • 我们如何能够简化一点呢?其实可以考虑小时候一个挺常见的方案,就是小时候,咱们准备一张小小的卡片,你只要签到就打上一个勾,我最后判断你是否签到,其实只需要到小卡片上看一看就知道了
  • 我们可以采用类似这样的方案来实现我们的签到需求。
  • 我们按月来统计用户签到信息,签到记录为 1,未签到则记录为 0.
  • 把每一个 bit 位对应当月的每一天,形成了映射关系。用 0 和 1 标示业务状态,这种思路就称为位图(BitMap)。这样我们就用极小的空间,来实现了大量数据的表示
  • Redis 中是利用 string 类型数据结构实现 BitMap,因此最大上限是 512M,转换为 bit 则是 2^32 个 bit 位。

 BitMap 的操作命令有:

  • SETBIT:向指定位置(offset)存入一个 0 或 1
  • GETBIT :获取指定位置(offset)的 bit 值
  • BITCOUNT :统计 BitMap 中值为 1 的 bit 位的数量
  • BITFIELD :操作(查询、修改、自增)BitMap 中 bit 数组中的指定位置(offset)的值
  • BITFIELD_RO :获取 BitMap 中 bit 数组,并以十进制形式返回
  • BITOP :将多个 BitMap 的结果做位运算(与 、或、异或)
  • BITPOS :查找 bit 数组中指定范围内第一个 0 或 1 出现的位置

2、实现签到功能

2.1、需求:实现签到接口,将当前用户当天签到信息保存到 Redis 中

思路:我们可以把年和月作为 bitMap 的 key,然后保存到一个 bitMap 中,每次签到就到对应的位上把数字从 0 变成 1,只要对应是 1,就表明说明这一天已经签到了,反之则没有签到。

我们通过接口文档发现,此接口并没有传递任何的参数,没有参数怎么确实是哪一天签到呢?这个很容易,可以通过后台代码直接获取即可,然后到对应的地址上去修改 bitMap。

代码

UserController

@PostMapping("/sign")
public Result sign()
   return userService.sign();

 UserServiceImpl

@Override
public Result sign() 
    // 1.获取当前登录用户
    Long userId = UserHolder.getUser().getId();
    // 2.获取日期
    LocalDateTime now = LocalDateTime.now();
    // 3.拼接key
    String keySuffix = now.format(DateTimeFormatter.ofPattern(":yyyyMM"));
    String key = USER_SIGN_KEY + userId + keySuffix;
    // 4.获取今天是本月的第几天
    int dayOfMonth = now.getDayOfMonth();
    // 5.写入Redis SETBIT key offset 1
    stringRedisTemplate.opsForValue().setBit(key, dayOfMonth - 1, true);
    return Result.ok();

 3、签到统计

问题 1:什么叫做连续签到天数?
从最后一次签到开始向前统计,直到遇到第一次未签到为止,计算总的签到次数,就是连续签到天数。

 

        Java 逻辑代码:获得当前这个月的最后一次签到数据,定义一个计数器,然后不停的向前统计,直到获得第一个非 0 的数字即可,每得到一个非 0 的数字计数器 + 1,直到遍历完所有的数据,就可以获得当前月的签到总天数了

问题 2:如何得到本月到今天为止的所有签到数据?

BITFIELD key GET u[dayOfMonth] 0

        假设今天是 10 号,那么我们就可以从当前月的第一天开始,获得到当前这一天的位数,是 10 号,那么就是 10 位,去拿这段时间的数据,就能拿到所有的数据了,那么这 10 天里边签到了多少次呢?统计有多少个 1 即可。

问题 3:如何从后向前遍历每个 bit 位?

        注意:bitMap 返回的数据是 10 进制,哪假如说返回一个数字 8,那么我哪儿知道到底哪些是 0,哪些是 1 呢?我们只需要让得到的 10 进制数字和 1 做与运算就可以了,因为 1 只有遇见 1 才是 1,其他数字都是 0 ,我们把签到结果和 1 进行与操作,每与一次,就把签到结果向右移动一位,依次内推,我们就能完成逐个遍历的效果了。

3.1、需求:实现下面接口,统计当前用户截止当前时间在本月的连续签到天数

有用户有时间我们就可以组织出对应的 key,此时就能找到这个用户截止这天的所有签到记录,再根据这套算法,就能统计出来他连续签到的次数了

代码

UserController

@GetMapping("/sign/count")
public Result signCount()
    return userService.signCount();

 UserServiceImpl

@Override
public Result signCount() 
    // 1.获取当前登录用户
    Long userId = UserHolder.getUser().getId();
    // 2.获取日期
    LocalDateTime now = LocalDateTime.now();
    // 3.拼接key
    String keySuffix = now.format(DateTimeFormatter.ofPattern(":yyyyMM"));
    String key = USER_SIGN_KEY + userId + keySuffix;
    // 4.获取今天是本月的第几天
    int dayOfMonth = now.getDayOfMonth();
    // 5.获取本月截止今天为止的所有的签到记录,返回的是一个十进制的数字 BITFIELD sign:5:202203 GET u14 0
    List<Long> result = stringRedisTemplate.opsForValue().bitField(
            key,
            BitFieldSubCommands.create()
                    .get(BitFieldSubCommands.BitFieldType.unsigned(dayOfMonth)).valueAt(0)
    );
    if (result == null || result.isEmpty()) 
        // 没有任何签到结果
        return Result.ok(0);
    
    Long num = result.get(0);
    if (num == null || num == 0) 
        return Result.ok(0);
    
    // 6.循环遍历
    int count = 0;
    while (true) 
        // 6.1.让这个数字与1做与运算,得到数字的最后一个bit位  // 判断这个bit位是否为0
        if ((num & 1) == 0) 
            // 如果为0,说明未签到,结束
            break;
        else 
            // 如果不为0,说明已签到,计数器+1
            count++;
        
        // 把数字右移一位,抛弃最后一个bit位,继续下一个bit位
        num >>>= 1;
    
    return Result.ok(count);

 


三、UV 统计

1、UV 统计 - HyperLogLog

首先我们搞懂两个概念:

  • UV:全称 Unique Visitor,也叫独立访客量,是指通过互联网访问、浏览这个网页的自然人。1 天内同一个用户多次访问该网站,只记录 1 次。
  • PV:全称 Page View,也叫页面访问量或点击量,用户每访问网站的一个页面,记录 1 次 PV,用户多次打开页面,则记录多次 PV。往往用来衡量网站的流量。

UV 统计在服务端做会比较麻烦,因为要判断该用户是否已经统计过了,需要将统计过的用户信息保存。但是如果每个访问的用户都保存到 Redis 中,数据量会非常恐怖,那怎么处理呢?

Hyperloglog (HLL) 是从 Loglog 算法派生的概率算法,用于确定非常大的集合的基数,而不需要存储其所有值。相关算法原理大家可以参考:https://juejin.cn/post/6844903785744056333#heading-0
Redis 中的 HLL 是基于 string 结构实现的,单个 HLL 的内存永远小于 16kb, 内存占用低的令人发指!作为代价,其测量结果是概率性的,有小于 0.81%的误差。不过对于 UV 统计来说,这完全可以忽略。

 2、UV 统计 - 测试百万数据的统计

测试思路:我们直接利用单元测试,向 HyperLogLog 中添加 100 万条数据,看看内存占用和统计效果如何

 经过测试:我们会发生他的误差是在允许范围内,并且内存占用极小

以上是关于Redis实战之附近商户用户签到UV 统计的主要内容,如果未能解决你的问题,请参考以下文章

Redis进阶学习05---Feed流,GEO地理坐标的应用,bitmap的应用,HyperLogLog实现UV统计

Redis使用BitMap用户签到统计BitMap解决缓存击穿方案 及 UV(HyperLogLog) 统计页面访问量 与 独立访问量

Redis核心知识点

Redis 实战篇:巧用Bitmap 实现亿级海量数据统计

微服务 SpringBoot 整合 Redis GEO 实现附近商户功能

REDIS05_HyperLogLog的概述基本命令UVPVDAUMAU首页UV如何进行统计处理