人人都能看得懂的数据分析书
Posted 人邮异步社区
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了人人都能看得懂的数据分析书相关的知识,希望对你有一定的参考价值。
如何在内卷时代脱颖而出?看书似乎都明白,一到实际工作中就不知道怎么办?为什么别人不大明白我的分析结果?零基础的人想学数据分析要看哪一本书?没学过Python适合于看哪一本书?如何培养数据分析思维?
快来看这本书,给你答案!
数据分析咖哥十话 从思维到实践促进运营增长
本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。
本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需求的人士阅读,也适合相关专业的师生阅读。
立足实际
零基础也可以学得会的数据分析
培养你的数据分析思维
《数据分析咖哥十话》特色
1、理论联系实际,解决实际运营中的问题。
2、有趣不枯燥,让学习更轻松
3、培养数据分析的思维和能力,不止是学会使用一个工具
实拍
目录
引子 小雪求职记
基础篇 数据分析师的锦囊
一、欲善其事先利器:数据分析技能进阶图谱
二、深入业务寻价值:价值源于深度理解场景
三、积跬步以察千里:数据的采集与治理
四、沥尽狂沙方见金:数据的清洗与可视化
五、营运之道无定法:数据分析的核心方法
六、增长践行成于思:数据分析的关键思维
实践篇 数据运营分析十话
卷一 获客
第一话 横看成岭侧成峰:用户画像揭示秘密
1.1 问题:这款推广海报好不好
1.2 概念:用户画像
1.3 工具: Python 数据分析编程基础
1.3.1 Python 的极简说明
1.3.2 Python 中的序列数据类型
1.3.3 数学计算工具包 NumPy
1.3.4 数据处理工具包 Pandas
1.3.5 数据可视化工具包 Matplotlib和Seaborn
1.4 实战:哪一类人才是真正的买家
1.4.1 数据读入及简单分析
1.4.2 用户整体画像
1.4.3 购买眼影盘用户的画像
1.5 结论
第二话 远近高低各不同:聚类实现RFM细分
2.1 问题:如何通过细分用户指导运营
2.2 概念:用户细分
2.2.1 用户画像是了解用户的第一步
2.2.2 用用户行为数据指导精细化运营
2.2.3 进行同期群分析揭示获客时的秘密
2.2.4 根据特征和价值进行用户分组
2.3 工具:RFM分析和聚类算法
2.3.1 RFM 分析
2.3.2 聚类算法
2.4 实战:基于RFM模型的用户细分
2.4.1 整体思路
2.4.2 数据读入和可视化
2.4.3 根据R值为用户新近度分层
2.4.4 根据F值为用户消费频率分层
2.4.5 根据M值为用户消费金额分层
2.4.6 汇总 3 个维度,确定用户价值分层
2.5 结论
2.6 彩蛋:看看谁是最有价值的用户
第三话 获客成本何其高:回归预测用户LTV
3.1 问题:我能从用户身上赚多少钱
3.2 概念:用户生命周期价值
3.3 工具:回归分析
3.3.1 机器学习中的回归分析
3.3.2 训练集、验证集和测试集
3.3.3 如何将预测的损失最小化
3.4 实战:预测电商用户的生命周期价值
3.4.1 整体思路
3.4.2 数据读入和数据清洗
3.4.3 构建机器学习数据集
3.4.4 预测未来一年的LTV
3.5 结论
3.6 彩蛋:还有哪些机器学习算法
卷二 激活
第四话 百川争流终归海:动态归因优化渠道
4.1 问题:哪个渠道最给力
4.2 概念:渠道分析和归因模型
4.2.1 渠道和渠道分析
4.2.2 归因和归因模型
4.3 工具:马尔可夫链归因模型
4.3.1 记录推广路径
4.3.2 显示用户旅程
4.3.3 统计状态间的转换概率
4.3.4 计算整体激活率
4.3.5 计算移除效应系数
4.4 实战:通过马尔可夫链模型来计算渠道价值
4.4.1 整体思路
4.4.2 构建每一个用户的旅程
4.4.3 根据状态构建通道字典
4.4.4 计算状态间的转换概率
4.4.5 计算渠道移除效应系数
4.5 结论
4.6 彩蛋 :夏普利值归因
第五话 营销贵在激活时:漏斗模型聚焦转化
5.1 问题:促销活动中的哪个环节需优化
5.2 概念:漏斗和转化率
5.3 工具:Plotly 包中的漏斗图
5.4 实战:通过漏斗分析看促销效果
5.4.1 整体思路
5.4.2 数据导入
5.4.3 基本漏斗图
5.4.4 细分漏斗图
5.5 结论
卷三 留存
第六话 温故知新惜旧客:通过行为分析提升留存
6.1 问题:如何留住江里捞的老用户
6.2 概念:留存与流失
6.2.1 老用户的留存至关重要
6.2.2 流失率的定义与流失原因
6.2.3 数据驱动下的用户管理
6.3 工具:生存分析工具包和逻辑回归算法
6.3.1 用生命线库进行留存分析
6.3.2 用逻辑回归算法预测用户流失
6.4 实战:分析用户的留存和流失
6.4.1 整体思路
6.4.2 数据导入和数据清洗
6.4.3 使用Kaplan-Meier 生存模型输出留存曲线
6.4.4 通过留存曲线比较各因子对流失率的影响
6.4.5 使用 Cox 危害系数模型分析流失影响因子
6.4.6 通过机器学习方法预测用户流失率
6.5 结论
第七话 千呼万唤求爆款:从内容分析发现价值
7.1 问题:什么样的视频会成为爆款
7.2 概念:产品分析
7.2.1 产品分析和拼多多的案例
7.2.2 产品热度的时间序列曲线
7.2.3 产品销售的总量和增速矩阵
7.2.4 与内容相关的典型流量指标
7.3 工具:自然语言处理
7.3.1 自然语言处理中的基本概念
7.3.2 自然语言工具包NLTK
7.4 实战:某网站视频流量、热度和情感属性分析
7.4.1 整体思路
7.4.2 导入数据
7.4.3 浏览量高的视频类型
7.4.4 热度持续趋势分析
7.4.5 视频情感属性分析
7.5 结论
7.6 彩蛋:深度学习和循环神经网络RNN
卷四 变现
第八话 劝君更尽一杯酒:通过推荐系统找到好物
8.1 问题:如何从零搭建推荐系统
8.2 概念:相关性与推荐系统
8.2.1 关联规则
8.2.2 相关性的度量指标:相关系数
8.2.3 推荐系统及其所解决的问题
8.3 工具:协同过滤算法
8.3.1 基于用户的协同过滤算法
8.3.2 基于商品的协同过滤算法
8.3.3 构建共现矩阵
8.3.4 相似性的确定
8.4 实战:简单的游戏推荐系统实现
8.4.1 整体思路
8.4.2 导入数据
8.4.3 构建用户/游戏相关矩阵
8.4.4 基于玩家相似度的协同过滤系统
8.4.5 构建相似度矩阵
8.4.6 找到推荐列表
8.4.7 基于游戏相似度的协同过滤系统
8.5 结论
第九话 君向潇湘我向秦:用A/B测试助力促销
9.1 问题:两个页面,哪个更好
9.2 概念:A/B测试
9.2.1 确认实验目标
9.2.2 设计实验
9.2.3 实验上线与监控
9.2.4 结果复盘
9.3 工具:统计学知识
9.3.1 对照实验
9.3.2 假设检验
9.3.3 样本的数量
9.4 实战:通过A/B测试找到最佳页面
9.4.1 整体思路
9.4.2 数据导入与数据可视化
9.4.3 查看转化率的增量
9.4.4 检验测试结果的统计学意义
9.4.5 细分样本后重新检验
9.5 结论
卷五 自传播循环
第十话 一二三生千万物:裂变驱动增长循环
10.1 问题:哪种裂变方案更有效
10.2 概念:增长黑客和裂变
10.2.1 增长黑客的本质
10.2.2 各种各样的裂变
10.3 工具:增长模型
10.4 实战:用增长实验确定最佳折扣方案
10.4.1 整体思路
10.4.2 数据导入及数据可视化
10.4.3 比较两种裂变方案带来的转化率增量
10.4.4 用XGBoost判断特定用户的分类概率
10.4.5 比较两种裂变带来的转化增量
10.5 结论
以上是关于人人都能看得懂的数据分析书的主要内容,如果未能解决你的问题,请参考以下文章