OpenFEA数据分析之爱户外运动的土豪在哪里?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了OpenFEA数据分析之爱户外运动的土豪在哪里?相关的知识,希望对你有一定的参考价值。

世界上的问题很多,小伙伴们都想知道是什么吗?NOW,告诉你们,只要给我数据,我用OpenFEA分析分析,就能给您一个比较靠谱的答案。

昨天家里有个小朋友看了一个户外运动的广告,她感觉蛮好玩的,然后就问爸爸:爸爸,为什么你天天要加班,而不带我一起去做户外运动?

爸爸回答:小朋友,爸爸身上有房贷,要挣钱养家,爸爸现在又不是土豪!

小朋友又问:爸爸,那土豪是什么意思,土豪在哪里?

对呀,土豪在哪里?爱户外运动的土豪又在哪里?

别急,我慢慢算给你听!

一、分析思路

土豪标志就是买!买!买!爱户外运动的土豪的标志就是买!买!买!

骑个车,登个山,跑个步,游个泳有必要买个万把块的户外运动手表吗?这不就是土豪行为嘛!

(一)数据准备

上某东,抓数据!怎么抓?来找我,我当面告诉你!

1、佳明手表购买评论记录及手表价格

技术分享


2、颂拓手表购买评论记录及手表价格


技术分享


(二)分析过程

1、把数据上传到OpenFEA,如下图:

技术分享


 

2、加载数据到内存DF

技术分享

 

3、数据分析与统计

(1)表联合

技术分享

 

(2)分组与统计

技术分享

 

(3)重命名字段

技术分享

 

(4)结果排序

技术分享

 

(5)绘图

技术分享

 

从图中得出结论:喜欢户外运动的人士主要分布在北京、广州、上海。但是,这些人士并不完全是土豪,还需要剔除购买低价位户外运动手表的人士。

(6)剔除购买低价位户外运动手表的记录,然后再统计分析

技术分享

最终得出结论:喜欢户外运动的土豪人士主要分布在北京、广州、上海。

二、分析脚本

#加载数据

jmsb = load csv by xhzjmsb.csv

stsb = load csv by xhzstsb.csv

jmprice = load csv by jmprice.csv

stprice = load csv by stprice.csv

#表链接

sbun = union (jmsb,stsb)

#表分组

gt = group sbun by (省份)

#表统计

result = agg gt by (省份:count) 

#重命名字段

rename result as (u"省份":u"人数")

#排序

result = order result by (人数) with desc

#绘图

plot result by 04

priceun = union (jmprice,stprice)

#表关连查型

sbun1 = join (sbun,priceun) by (型号,型号)

#表过滤

sbun2 = filter sbun1 by (price>4000)

gt2 = group sbun2 by (省份)

result2 = agg gt2 by (省份:count) 

rename result2 as (u"省份":u"人数")

result2 = order result2 by (人数) withdesc

plot result2 by 04

 

 


以上是关于OpenFEA数据分析之爱户外运动的土豪在哪里?的主要内容,如果未能解决你的问题,请参考以下文章

OpenFEA产品特色

OpenFEA应用案例

OpenFEA应用案例

OpenFEA=AI+BI

OpenFEA=AI+BI

思想篇之爱左看右