人人都能看得懂的数据分析书

Posted 2022-11-03 人邮异步社区

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了人人都能看得懂的数据分析书相关的知识，希望对你有一定的参考价值。

如何在内卷时代脱颖而出？看书似乎都明白，一到实际工作中就不知道怎么办？为什么别人不大明白我的分析结果？零基础的人想学数据分析要看哪一本书？没学过Python适合于看哪一本书？如何培养数据分析思维？

快来看这本书，给你答案！

数据分析咖哥十话从思维到实践促进运营增长

本书以案例的形式，介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素，在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时，以问题为导向，解读运营与增长的关键性业务内容，在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。

本书提供案例相关数据集与源码包，适合数据分析、产品运营、市场营销等行业有数据分析具体业务需求的人士阅读，也适合相关专业的师生阅读。

立足实际

零基础也可以学得会的数据分析

培养你的数据分析思维

《数据分析咖哥十话》特色

1、理论联系实际，解决实际运营中的问题。

2、有趣不枯燥，让学习更轻松

3、培养数据分析的思维和能力，不止是学会使用一个工具

实拍

目录

引子小雪求职记

基础篇数据分析师的锦囊

一、欲善其事先利器：数据分析技能进阶图谱

二、深入业务寻价值：价值源于深度理解场景

三、积跬步以察千里：数据的采集与治理

四、沥尽狂沙方见金：数据的清洗与可视化

五、营运之道无定法：数据分析的核心方法

六、增长践行成于思：数据分析的关键思维

实践篇数据运营分析十话

卷一获客

第一话横看成岭侧成峰：用户画像揭示秘密

1.1 问题：这款推广海报好不好

1.2 概念：用户画像

1.3 工具： Python 数据分析编程基础

1.3.1 Python 的极简说明

1.3.2 Python 中的序列数据类型

1.3.3 数学计算工具包 NumPy

1.3.4 数据处理工具包 Pandas

1.3.5 数据可视化工具包 Matplotlib和Seaborn

1.4 实战：哪一类人才是真正的买家

1.4.1 数据读入及简单分析

1.4.2 用户整体画像

1.4.3 购买眼影盘用户的画像

1.5 结论

第二话远近高低各不同：聚类实现RFM细分

2.1 问题：如何通过细分用户指导运营

2.2 概念：用户细分

2.2.1 用户画像是了解用户的第一步

2.2.2 用用户行为数据指导精细化运营

2.2.3 进行同期群分析揭示获客时的秘密

2.2.4 根据特征和价值进行用户分组

2.3 工具：RFM分析和聚类算法

2.3.1 RFM 分析

2.3.2 聚类算法

2.4 实战：基于RFM模型的用户细分

2.4.1 整体思路

2.4.2 数据读入和可视化

2.4.3 根据R值为用户新近度分层

2.4.4 根据F值为用户消费频率分层

2.4.5 根据M值为用户消费金额分层

2.4.6 汇总 3 个维度，确定用户价值分层

2.5 结论

2.6 彩蛋：看看谁是最有价值的用户

第三话获客成本何其高：回归预测用户LTV

3.1 问题：我能从用户身上赚多少钱

3.2 概念：用户生命周期价值

3.3 工具：回归分析

3.3.1 机器学习中的回归分析

3.3.2 训练集、验证集和测试集

3.3.3 如何将预测的损失最小化

3.4 实战：预测电商用户的生命周期价值

3.4.1 整体思路

3.4.2 数据读入和数据清洗

3.4.3 构建机器学习数据集

3.4.4 预测未来一年的LTV

3.5 结论

3.6 彩蛋：还有哪些机器学习算法

卷二激活

第四话百川争流终归海：动态归因优化渠道

4.1 问题：哪个渠道最给力

4.2 概念：渠道分析和归因模型

4.2.1 渠道和渠道分析

4.2.2 归因和归因模型

4.3 工具：马尔可夫链归因模型

4.3.1 记录推广路径

4.3.2 显示用户旅程

4.3.3 统计状态间的转换概率

4.3.4 计算整体激活率

4.3.5 计算移除效应系数

4.4 实战：通过马尔可夫链模型来计算渠道价值

4.4.1 整体思路

4.4.2 构建每一个用户的旅程

4.4.3 根据状态构建通道字典

4.4.4 计算状态间的转换概率

4.4.5 计算渠道移除效应系数

4.5 结论

4.6 彩蛋：夏普利值归因

第五话营销贵在激活时：漏斗模型聚焦转化

5.1 问题：促销活动中的哪个环节需优化

5.2 概念：漏斗和转化率

5.3 工具：Plotly 包中的漏斗图

5.4 实战：通过漏斗分析看促销效果

5.4.1 整体思路

5.4.2 数据导入

5.4.3 基本漏斗图

5.4.4 细分漏斗图

5.5 结论

卷三留存

第六话温故知新惜旧客：通过行为分析提升留存

6.1 问题：如何留住江里捞的老用户

6.2 概念：留存与流失

6.2.1 老用户的留存至关重要

6.2.2 流失率的定义与流失原因

6.2.3 数据驱动下的用户管理

6.3 工具：生存分析工具包和逻辑回归算法

6.3.1 用生命线库进行留存分析

6.3.2 用逻辑回归算法预测用户流失

6.4 实战：分析用户的留存和流失

6.4.1 整体思路

6.4.2 数据导入和数据清洗

6.4.3 使用Kaplan-Meier 生存模型输出留存曲线

6.4.4 通过留存曲线比较各因子对流失率的影响

6.4.5 使用 Cox 危害系数模型分析流失影响因子

6.4.6 通过机器学习方法预测用户流失率

6.5 结论

第七话千呼万唤求爆款：从内容分析发现价值

7.1 问题：什么样的视频会成为爆款

7.2 概念：产品分析

7.2.1 产品分析和拼多多的案例

7.2.2 产品热度的时间序列曲线

7.2.3 产品销售的总量和增速矩阵

7.2.4 与内容相关的典型流量指标

7.3 工具：自然语言处理

7.3.1 自然语言处理中的基本概念

7.3.2 自然语言工具包NLTK

7.4 实战：某网站视频流量、热度和情感属性分析

7.4.1 整体思路

7.4.2 导入数据

7.4.3 浏览量高的视频类型

7.4.4 热度持续趋势分析

7.4.5 视频情感属性分析

7.5 结论

7.6 彩蛋：深度学习和循环神经网络RNN

卷四变现

第八话劝君更尽一杯酒：通过推荐系统找到好物

8.1 问题：如何从零搭建推荐系统

8.2 概念：相关性与推荐系统

8.2.1 关联规则

8.2.2 相关性的度量指标：相关系数

8.2.3 推荐系统及其所解决的问题

8.3 工具：协同过滤算法

8.3.1 基于用户的协同过滤算法

8.3.2 基于商品的协同过滤算法

8.3.3 构建共现矩阵

8.3.4 相似性的确定

8.4 实战：简单的游戏推荐系统实现

8.4.1 整体思路

8.4.2 导入数据

8.4.3 构建用户/游戏相关矩阵

8.4.4 基于玩家相似度的协同过滤系统

8.4.5 构建相似度矩阵

8.4.6 找到推荐列表

8.4.7 基于游戏相似度的协同过滤系统

8.5 结论

第九话君向潇湘我向秦：用A/B测试助力促销

9.1 问题：两个页面，哪个更好

9.2 概念：A/B测试

9.2.1 确认实验目标

9.2.2 设计实验

9.2.3 实验上线与监控

9.2.4 结果复盘

9.3 工具：统计学知识

9.3.1 对照实验

9.3.2 假设检验

9.3.3 样本的数量

9.4 实战：通过A/B测试找到最佳页面

9.4.1 整体思路

9.4.2 数据导入与数据可视化

9.4.3 查看转化率的增量

9.4.4 检验测试结果的统计学意义

9.4.5 细分样本后重新检验

9.5 结论

卷五自传播循环

第十话一二三生千万物：裂变驱动增长循环

10.1 问题：哪种裂变方案更有效

10.2 概念：增长黑客和裂变

10.2.1 增长黑客的本质

10.2.2 各种各样的裂变

10.3 工具：增长模型

10.4 实战：用增长实验确定最佳折扣方案

10.4.1 整体思路

10.4.2 数据导入及数据可视化

10.4.3 比较两种裂变方案带来的转化率增量

10.4.4 用XGBoost判断特定用户的分类概率

10.4.5 比较两种裂变带来的转化增量

10.5 结论

以上是关于人人都能看得懂的数据分析书的主要内容，如果未能解决你的问题，请参考以下文章