OpenFEA数据分析之爱户外运动的土豪在哪里?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了OpenFEA数据分析之爱户外运动的土豪在哪里?相关的知识,希望对你有一定的参考价值。
世界上的问题很多,小伙伴们都想知道是什么吗?NOW,告诉你们,只要给我数据,我用OpenFEA分析分析,就能给您一个比较靠谱的答案。
昨天家里有个小朋友看了一个户外运动的广告,她感觉蛮好玩的,然后就问爸爸:“爸爸,为什么你天天要加班,而不带我一起去做户外运动?”
爸爸回答:“小朋友,爸爸身上有房贷,要挣钱养家,爸爸现在又不是土豪!“
小朋友又问:”爸爸,那土豪是什么意思,土豪在哪里?“
对呀,土豪在哪里?爱户外运动的土豪又在哪里?
别急,我慢慢算给你听!
一、分析思路
土豪标志就是买!买!买!爱户外运动的土豪的标志就是买!买!买!
骑个车,登个山,跑个步,游个泳有必要买个万把块的户外运动手表吗?这不就是土豪行为嘛!
(一)数据准备
上某东,抓数据!怎么抓?来找我,我当面告诉你!
1、佳明手表购买评论记录及手表价格
2、颂拓手表购买评论记录及手表价格
(二)分析过程
1、把数据上传到OpenFEA,如下图:
2、加载数据到内存DF表
3、数据分析与统计
(1)表联合
(2)分组与统计
(3)重命名字段
(4)结果排序
(5)绘图
从图中得出结论:喜欢户外运动的人士主要分布在北京、广州、上海。但是,这些人士并不完全是土豪,还需要剔除购买低价位户外运动手表的人士。
(6)剔除购买低价位户外运动手表的记录,然后再统计分析
最终得出结论:喜欢户外运动的土豪人士主要分布在北京、广州、上海。
二、分析脚本
#加载数据
jmsb = load csv by xhzjmsb.csv
stsb = load csv by xhzstsb.csv
jmprice = load csv by jmprice.csv
stprice = load csv by stprice.csv
#表链接
sbun = union (jmsb,stsb)
#表分组
gt = group sbun by (省份)
#表统计
result = agg gt by (省份:count)
#重命名字段
rename result as (u"省份":u"人数")
#排序
result = order result by (人数) with desc
#绘图
plot result by 04
priceun = union (jmprice,stprice)
#表关连查型
sbun1 = join (sbun,priceun) by (型号,型号)
#表过滤
sbun2 = filter sbun1 by (price>4000)
gt2 = group sbun2 by (省份)
result2 = agg gt2 by (省份:count)
rename result2 as (u"省份":u"人数")
result2 = order result2 by (人数) withdesc
plot result2 by 04
以上是关于OpenFEA数据分析之爱户外运动的土豪在哪里?的主要内容,如果未能解决你的问题,请参考以下文章