基于Quick BI的用户分布分析
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于Quick BI的用户分布分析相关的知识,希望对你有一定的参考价值。
Quick BI的气泡地图功能能非常直观得体现全国各区域的数据情况。这里从网上搜了一份某社交网站的用户数据,数据量就五六万条,而且只包含这些用户的公开信息(省的自己还要去爬)。
数据预处理
数据包含的字段为uid、location、gender、followersnum、friendsnum,分别是用户id、所在区域、性别、关注人数、好友人数。里面的location这个字段是中文的,看到为“浙江”这样的就写了省的,也有是“浙江 杭州”这样到省、市的,而且中间用空格分割。另外还有一些写的是“海外”或“其他”。
先用个SQL对数据进行处理,整理出一个所在省的字段
create table wbuser2 AS
select b.*
from(
select a.uid, a.`location`, a.`gender`, a.`followersnum`, a.`friendsnum`, a.`location` as province_name
from `wbuser` a
where instr(a.location, ‘ ‘)= 0
union all
select a.uid, a.`location`, a.`gender`, a.`followersnum`, a.`friendsnum`, substr(a.location, 1, instr(a.location, ‘ ‘)) as province_name
from `wbuser` a
where instr(a.location, ‘ ‘)> 0) b
工作表
数据处理好了后,我们配置数据源,并根据这张表创建一张工作表,刚生成的工作表如图:
然后我们需要对数据进行一些设置:
仪表盘
本来所有的工作都已经完成了,但是看一下followersnum,发现台湾的数据怎么特别大,导致其他地区全是蓝点了。
于是我们查一下数据,看看是怎么样的
select a.`province_name`,
avg(a.`followersnum`) as followersnum
from `wbuser2` a
group by a.`province_name`
order by followersnum desc;
看到台湾的数据特别大,除了台湾外,香港和北京也比较大。
所以我们修改了图标的值域
最后结果如下
通过数据可视化,我们能更容易地发现数据中的一些异常和规律(比如台湾的followersnum特别大)至此大功告成!
以上是关于基于Quick BI的用户分布分析的主要内容,如果未能解决你的问题,请参考以下文章