妈妈群文本挖掘
Posted 佳猪的兴趣公园
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了妈妈群文本挖掘相关的知识,希望对你有一定的参考价值。
因为博士的身份加了一个妈妈群做科普(请不要揭穿我专业跟育儿没任何关系₍ᐢ•ﻌ•ᐢ₎*),四个月产生了14万条聊天记录,最近对数据挖掘比较感兴趣,尝试对聊天记录做文本挖掘。
首先想办法把记录导出来。用了一个同步助手软件。跟某在微信的同学说了后他说要举报゜・(PД`q。)・。
主要做了两个方面的挖掘,高频词,热议时间统计
高频词统计了后去掉无意义及人名词,最高频率词为照片(23),代购(19),正品(19),母婴(19)。最高频率词四分之三都跟购物有关,足见妈妈们旺盛的购物欲( ̄y▽ ̄)~*
我认为宝宝小时候一天一个样,及时记录是对妈妈们很重要的事情。变现相关应考虑存储空间(推送云盘广告,或者APP提供成长记录),以及线下摄影服务。
代购是因为做妈妈后对商品的品质要求更高了,因此产生了很多购买国外物品的需求。由于对线上不信任很多人选择了代购,从正品这一关键词也可看出对品质的要求。电商们可要加强信誉建设啦(。・`ω´・)
时间维度分析发现妈妈群很重要一个特点是,24小时都有人讲话。分析是隔不了多久就得给宝宝喂奶。针对妈妈的推送可以选择在深夜,这时候信息接收量较少(微博刷不出,陪聊的人也睡了),推送可以获得更大关注度以及冲动购买欲。
本来还想做一个根据月龄的文本挖掘,因为群中的妈妈宝宝都是同月龄的,那么可以根据不同时间妈妈关心什么做相应推送。但是数据太少做出来也没什么意义。
以上是关于妈妈群文本挖掘的主要内容,如果未能解决你的问题,请参考以下文章