趣味分析系列 | 文胸品牌知多少

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了趣味分析系列 | 文胸品牌知多少相关的知识,希望对你有一定的参考价值。

一年一度的圣诞节马上就快到了,各位男神是不是又在劳神费力地给女神们准备圣诞节礼物?今年送啥呢?

送脑白金怎么样?NO,NO,NO!脑白金是送给大妈的!!!

直接给MONEY? NO,NO,NO!太俗气!!!

送鲜花与巧克力?NO,NO,NO!不实在!!!

按我说,直接送个文胸套装,有情调又贴心!!!说不定你的女神会给你个惊喜呢!

但是问题又来了,挑选哪个品牌的文胸好呢,总不能送一个层次太LOW的吧。因此,你需要对文胸的品牌有个大概的了解。简单讲,首先你得了解女生文胸品牌有多少?品牌的排名度是怎样的?为了减少各位男神上网的搜索时间,看我下面仔细分析给你看!

 一、数据准备

 打开浏览器上某东,祭出我们的F12神器,然后把如下网页代码复制下来(还不会?来找我,我当面告诉你,教到你会为止!)。

 

技术分享

 源码稍作处理如下:

技术分享

 二、分析过程

 1、把数据上传到OpenFEA(请访问www.openfea.cn的下载专区,可以在互联网上搭建的在线试用环境中跟我一起分析),如下图:

技术分享

 2、加载数据到内存DF表

 技术分享

 3、数据分析与处理

(1)数据行列转换

 技术分享

(2)字段重命名与数据打标签

 技术分享

(3)数据过滤

 技术分享

(4)数据提取

技术分享

(5)数据合并

 技术分享

(6)存储结果数据

 技术分享

(7)结论

女生文胸品牌总共有1240个,各位男神慢慢了解吧,我只能帮你到这了。

 三、分析脚本

 #加载数据

df1 = load csv byjd_goods.txt with (encoding="gbk",sep="=",header=-1)

#行列互换

df2 = @udf df1 byudf0.df_T

rename df2 as(0:"content")

#数据打标签

df2.flag1 = strcontent by (contains("brand-"))

df2.flag2 = strcontent by (contains(u‘品牌‘))

df3 = filter df2 by(flag1==True)

df4 = filter df2 by(flag2==True)

#数据分析与提取

df3.brandno =strcontent by (findall("(\d+)"))

df3.brand_code=strbrandno by (get(0))

df4.brands = strcontent by (split("::"))

df4.brands_1=strbrands by (get(1))

df4.brand_name =str brands_1 by ([0:-8])

#数据合并

df3 = add idx1 by(range(df3.index.size))

df4 = add idx2 by(range(df4.index.size))

df5 = join(df3,df4) by (idx1,idx2)

df6 = loc df5 by(brand_name,brand_code)

#存储数据

store df6 to csv byjd_goods.csv

注:原创文章,转载请注明来自微信公众号“OpenFEA”

<烦请关注,下期内容更精彩!>

趣味分析系列  |  文胸纬度分析360度(罩杯、颜色......)(二)

趣味分析系列  |  女神在哪里(三)

更多文章,敬请期待......


以上是关于趣味分析系列 | 文胸品牌知多少的主要内容,如果未能解决你的问题,请参考以下文章

Nginx知多少系列之工作原理

Nginx知多少系列之配置文件详解

WEEX系列活动——Weex框架知多少

数据库知多少系列-二进制安装mysql

Nginx知多少系列之介绍

科普系列交换机知识知多少