漫画:什么是Bitmap算法?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了漫画:什么是Bitmap算法?相关的知识,希望对你有一定的参考价值。

漫画:什么是Bitmap算法?

技术图片
技术图片

技术图片

技术图片

两个月之前——

技术图片
技术图片
技术图片
技术图片

技术图片

为满足用户标签的统计需求,小灰利用mysql设计了如下的表结构,每一个维度的标签都对应着Mysql表的一列:
技术图片

要想统计所有90后的程序员该怎么做呢?

用一条求交集的SQL语句即可:

Select count(distinct Name) as 用户数 from table whare age = ‘90后‘ and Occupation = ‘程序员‘ ;

要想统计所有使用苹果手机或者00后的用户总合该怎么做?

用一条求并集的SQL语句即可:

Select count(distinct Name) as 用户数 from table whare Phone = ‘苹果‘ or age = ‘00后‘ ;

技术图片

两个月之后——
技术图片

技术图片

技术图片
技术图片

———————————————

技术图片
技术图片

技术图片

技术图片
技术图片

  1. 给定长度是10的bitmap,每一个bit位分别对应着从0到9的10个整型数。此时bitmap的所有位都是0。
    技术图片

  2. 把整型数4存入bitmap,对应存储的位置就是下标为4的位置,将此bit置为1。
    技术图片

  3. 把整型数2存入bitmap,对应存储的位置就是下标为2的位置,将此bit置为1。
    技术图片

  4. 把整型数1存入bitmap,对应存储的位置就是下标为1的位置,将此bit置为1。
    技术图片

  5. 把整型数3存入bitmap,对应存储的位置就是下标为3的位置,将此bit置为1。
    技术图片

要问此时bitmap里存储了哪些元素?显然是4,3,2,1,一目了然。

Bitmap不仅方便查询,还可以去除掉重复的整型数。
技术图片

技术图片

技术图片
技术图片
技术图片

技术图片

  1. 建立用户名和用户ID的映射:

技术图片

  1. 让每一个标签存储包含此标签的所有用户ID,每一个标签都是一个独立的Bitmap。
    技术图片

  2. 这样,实现用户的去重和查询统计,就变得一目了然:
    技术图片

技术图片
技术图片
技术图片

技术图片

  1. 如何查找使用苹果手机的程序员用户?

技术图片

  1. 如何查找所有男性或者00后的用户?

技术图片

技术图片

技术图片
技术图片
技术图片

技术图片

技术图片
技术图片
技术图片

几点说明:

  1. 本文的灵感来源于京东金融数据部张洪雨同学的项目经历,感谢这位大神的技术分享。

  2. 该项目最初的技术选型并非Mysql,而是内存数据库hana。本文为了便于理解,把最初的存储方案写成了Mysq数据库。

—————END—————

喜欢本文的朋友们,欢迎长按下图关注订阅号梦见,收看更多精彩内容

技术图片

以上是关于漫画:什么是Bitmap算法?的主要内容,如果未能解决你的问题,请参考以下文章

《漫画算法》源码整理-7

Bitmap算法

漫画:什么是红黑树?

漫画:什么是KMP算法?

漫画:什么是SnowFlake算法?

漫画:什么是加密算法?