google play store的app数据分析

Posted daisyxxx

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了google play store的app数据分析相关的知识,希望对你有一定的参考价值。

1.分析目的:通过google play store的app数据分析进行业务方向指导

 

2.数据

导入框架

技术图片

导入数据

这次只分析‘App‘ ,‘Category‘ ,‘Rating‘ ,‘Reviews‘ ,‘Size‘ ,‘Installs‘ ,‘Type‘

技术图片

简单浏览下数据

技术图片

技术图片

查看行列数量

技术图片

查看各个列的非空数据量技术图片

有很多缺失值,需要清洗

 

3.数据清洗

App处理

查看有没有重复值

技术图片

有重复值,先不着急删除重复值,为了不把其他列的异常值留下,先处理数值异常的列

Category处理

技术图片

有一条异常值

技术图片

删除

技术图片

Rating处理

技术图片

用平均值填充

技术图片

技术图片

有一条值是19的异常记录,和Category的异常是同一条记录

Reviews清洗

技术图片

用value_counts看数据分布挺广,看起来都是数据

技术图片

技术图片

Size清洗

技术图片转换成浮点型

技术图片

技术图片

将Size为0的填充为平均数技术图片

Installs清洗

技术图片

分布比较少,直接替换

技术图片

转换

技术图片

Type处理

df.info() 查看到有na值,这里需要dropna参数

技术图片

技术图片

 删除这条数据

技术图片

数据清洗完毕,开始分析数据

 

4.数据处理和分析

分Category的数据

分类的个数

技术图片

每个分类的App数量,排序,可以得出哪些分类的app最受开发者欢迎

技术图片

分类的安装量排序:娱乐社交类最被用户需要

分类的评论数据:社交游戏评论多

技术图片

分类的打分数据,和其他数据不太一致,需要进一步分析

技术图片

分Type数据

技术图片

免费占比大,付费占比小,免费仍然是主流

Category和Type一起分析

技术图片

评论安装比

相关性:评论数和安装数强相关,其他的连0.1都不到,可以认为是不相关的(0.5以上可以认为是相关的,0.3以上可以认为是弱相关)

技术图片

 

以上是关于google play store的app数据分析的主要内容,如果未能解决你的问题,请参考以下文章

增加 App Store 徽章的边距以匹配 Google Play 商店徽章的大小

google play store 警告:App Bundle 包含原生代码,建议上传去混淆文件

从 App Store 和 google Play Store 禁用 iOS 和 Android 应用程序,并向用户发送自定义消息

我们可以在不更改 APP 版本的情况下更新 Google Play Store 上的 APK

您的 Android App Bundle 使用错误的密钥进行签名。 (首次在 google play store 上传应用时)

Google Play Store App 的 Apache-Cordova 更新到 4.1.1 或更高版本,但它的