人人都能看得懂的数据分析书

Posted 人邮异步社区

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了人人都能看得懂的数据分析书相关的知识,希望对你有一定的参考价值。

如何在内卷时代脱颖而出?看书似乎都明白,一到实际工作中就不知道怎么办?为什么别人不大明白我的分析结果?零基础的人想学数据分析要看哪一本书?没学过Python适合于看哪一本书?如何培养数据分析思维?

快来看这本书,给你答案!

数据分析咖哥十话 从思维到实践促进运营增长

本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。

本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需求的人士阅读,也适合相关专业的师生阅读。

立足实际

零基础也可以学得会的数据分析

培养你的数据分析思维

《数据分析咖哥十话》特色

1、理论联系实际,解决实际运营中的问题。

2、有趣不枯燥,让学习更轻松

3、培养数据分析的思维和能力,不止是学会使用一个工具

实拍

目录

引子 小雪求职记

基础篇 数据分析师的锦囊

一、欲善其事先利器:数据分析技能进阶图谱

二、深入业务寻价值:价值源于深度理解场景

三、积跬步以察千里:数据的采集与治理

四、沥尽狂沙方见金:数据的清洗与可视化

五、营运之道无定法:数据分析的核心方法

六、增长践行成于思:数据分析的关键思维

实践篇 数据运营分析十话

卷一 获客

第一话 横看成岭侧成峰:用户画像揭示秘密

1.1 问题:这款推广海报好不好

1.2 概念:用户画像

1.3 工具: Python 数据分析编程基础

1.3.1 Python 的极简说明

1.3.2 Python 中的序列数据类型

1.3.3 数学计算工具包 NumPy

1.3.4 数据处理工具包 Pandas

1.3.5 数据可视化工具包 Matplotlib和Seaborn

1.4 实战:哪一类人才是真正的买家

1.4.1 数据读入及简单分析

1.4.2 用户整体画像

1.4.3 购买眼影盘用户的画像

1.5 结论

第二话 远近高低各不同:聚类实现RFM细分

2.1 问题:如何通过细分用户指导运营

2.2 概念:用户细分

2.2.1 用户画像是了解用户的第一步

2.2.2 用用户行为数据指导精细化运营

2.2.3 进行同期群分析揭示获客时的秘密

2.2.4 根据特征和价值进行用户分组

2.3 工具:RFM分析和聚类算法

2.3.1 RFM 分析

2.3.2 聚类算法

2.4 实战:基于RFM模型的用户细分

2.4.1 整体思路

2.4.2 数据读入和可视化

2.4.3 根据R值为用户新近度分层

2.4.4 根据F值为用户消费频率分层

2.4.5 根据M值为用户消费金额分层

2.4.6 汇总 3 个维度,确定用户价值分层

2.5 结论

2.6 彩蛋:看看谁是最有价值的用户

第三话 获客成本何其高:回归预测用户LTV

3.1 问题:我能从用户身上赚多少钱

3.2 概念:用户生命周期价值

3.3 工具:回归分析

3.3.1 机器学习中的回归分析

3.3.2 训练集、验证集和测试集

3.3.3 如何将预测的损失最小化

3.4 实战:预测电商用户的生命周期价值

3.4.1 整体思路

3.4.2 数据读入和数据清洗

3.4.3 构建机器学习数据集

3.4.4 预测未来一年的LTV

3.5 结论

3.6 彩蛋:还有哪些机器学习算法

卷二 激活

第四话 百川争流终归海:动态归因优化渠道

4.1 问题:哪个渠道最给力

4.2 概念:渠道分析和归因模型

4.2.1 渠道和渠道分析

4.2.2 归因和归因模型

4.3 工具:马尔可夫链归因模型

4.3.1 记录推广路径

4.3.2 显示用户旅程

4.3.3 统计状态间的转换概率

4.3.4 计算整体激活率

4.3.5 计算移除效应系数

4.4 实战:通过马尔可夫链模型来计算渠道价值

4.4.1 整体思路

4.4.2 构建每一个用户的旅程

4.4.3 根据状态构建通道字典

4.4.4 计算状态间的转换概率

4.4.5 计算渠道移除效应系数

4.5 结论

4.6 彩蛋 :夏普利值归因

第五话 营销贵在激活时:漏斗模型聚焦转化

5.1 问题:促销活动中的哪个环节需优化

5.2 概念:漏斗和转化率

5.3 工具:Plotly 包中的漏斗图

5.4 实战:通过漏斗分析看促销效果

5.4.1 整体思路

5.4.2 数据导入

5.4.3 基本漏斗图

5.4.4 细分漏斗图

5.5 结论

卷三 留存

第六话 温故知新惜旧客:通过行为分析提升留存

6.1 问题:如何留住江里捞的老用户

6.2 概念:留存与流失

6.2.1 老用户的留存至关重要

6.2.2 流失率的定义与流失原因

6.2.3 数据驱动下的用户管理

6.3 工具:生存分析工具包和逻辑回归算法

6.3.1 用生命线库进行留存分析

6.3.2 用逻辑回归算法预测用户流失

6.4 实战:分析用户的留存和流失

6.4.1 整体思路

6.4.2 数据导入和数据清洗

6.4.3 使用Kaplan-Meier 生存模型输出留存曲线

6.4.4 通过留存曲线比较各因子对流失率的影响

6.4.5 使用 Cox 危害系数模型分析流失影响因子

6.4.6 通过机器学习方法预测用户流失率

6.5 结论

第七话 千呼万唤求爆款:从内容分析发现价值

7.1 问题:什么样的视频会成为爆款

7.2 概念:产品分析

7.2.1 产品分析和拼多多的案例

7.2.2 产品热度的时间序列曲线

7.2.3 产品销售的总量和增速矩阵

7.2.4 与内容相关的典型流量指标

7.3 工具:自然语言处理

7.3.1 自然语言处理中的基本概念

7.3.2 自然语言工具包NLTK

7.4 实战:某网站视频流量、热度和情感属性分析

7.4.1 整体思路

7.4.2 导入数据

7.4.3 浏览量高的视频类型

7.4.4 热度持续趋势分析

7.4.5 视频情感属性分析

7.5 结论

7.6 彩蛋:深度学习和循环神经网络RNN

卷四 变现

第八话 劝君更尽一杯酒:通过推荐系统找到好物

8.1 问题:如何从零搭建推荐系统

8.2 概念:相关性与推荐系统

8.2.1 关联规则

8.2.2 相关性的度量指标:相关系数

8.2.3 推荐系统及其所解决的问题

8.3 工具:协同过滤算法

8.3.1 基于用户的协同过滤算法

8.3.2 基于商品的协同过滤算法

8.3.3 构建共现矩阵

8.3.4 相似性的确定

8.4 实战:简单的游戏推荐系统实现

8.4.1 整体思路

8.4.2 导入数据

8.4.3 构建用户/游戏相关矩阵

8.4.4 基于玩家相似度的协同过滤系统

8.4.5 构建相似度矩阵

8.4.6 找到推荐列表

8.4.7 基于游戏相似度的协同过滤系统

8.5 结论

第九话 君向潇湘我向秦:用A/B测试助力促销

9.1 问题:两个页面,哪个更好

9.2 概念:A/B测试

9.2.1 确认实验目标

9.2.2 设计实验

9.2.3 实验上线与监控

9.2.4 结果复盘

9.3 工具:统计学知识

9.3.1 对照实验

9.3.2 假设检验

9.3.3 样本的数量

9.4 实战:通过A/B测试找到最佳页面

9.4.1 整体思路

9.4.2 数据导入与数据可视化

9.4.3 查看转化率的增量

9.4.4 检验测试结果的统计学意义

9.4.5 细分样本后重新检验

9.5 结论

卷五 自传播循环

第十话 一二三生千万物:裂变驱动增长循环

10.1 问题:哪种裂变方案更有效

10.2 概念:增长黑客和裂变

10.2.1 增长黑客的本质

10.2.2 各种各样的裂变

10.3 工具:增长模型

10.4 实战:用增长实验确定最佳折扣方案

10.4.1 整体思路

10.4.2 数据导入及数据可视化

10.4.3 比较两种裂变方案带来的转化率增量

10.4.4 用XGBoost判断特定用户的分类概率

10.4.5 比较两种裂变带来的转化增量

10.5 结论

以上是关于人人都能看得懂的数据分析书的主要内容,如果未能解决你的问题,请参考以下文章

小白都能看得懂的教程 一本教你如何在前端实现富文本编辑器

小白都能看得懂的教程 一本教你如何在前端实现markdown编辑器

小白都能看得懂的java虚拟机内存模型

外行人都能看得懂的机器学习,错过了血亏!

外行人都能看得懂的机器学习,错过了血亏!

《游戏系统设计十》从零复刻王者荣耀活动系统,策划都能看得懂的活动系统,源码奉送