利用数据可视化分析“双十一淘宝订单数据”
Posted 大数据分析和人工智能
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用数据可视化分析“双十一淘宝订单数据”相关的知识,希望对你有一定的参考价值。
“数据可视化”
是一种使用技术手段表达数据分析师想法的艺术方式
大部分初学者理解的数据可视化≈画图表,这是十分“奶义务”的想法:
数据可视化是一个需要理解数据、数据结构、数据交互原理、数据表达逻辑的复杂工作。
在数据可视化之前,我们需要对原始数据进行大量的整理及精细化处理工作,这一步的技术平台首选数据库SQL。
除了一般图表,数据可视化有两个方向很值得去尝试:商业智能BI与复杂交互式图表。
所以在这儿我推荐一个数据可视化的技能路线:
接下去将以“双十一美妆数据价值挖掘”为案例,分点来介绍SQL、Tableau、Echart。
为什么很多数据类岗位都要求求职者具备SQL技能?
互联网公司每天都需要处理大量数据,这些数据不可能都存储在某个人的PC上。在这种情况下,方便协同工作的数据库SQL成为通用的数据管理平台。
比如我们来看一个例子 :
“双十一美妆数据价值挖掘”
在数据可视化之前,我们需要对数据进行大量的处理工作,以“双十一淘宝订单数据”为例。
其数据量为27000+,包括7个原始字段:
下图演示的是使用最强大的开源数据库PostgreSQL处理数据的流程(演示是在Sublime中书写SQL语句,在psql中执行代码):
创建数据库并导入csv数据
查看并删除相关缺失值
列明修改及计算双十一商品打折折扣力度
以上数据整理工作也可以在excel中完成,步骤将会包括数据筛选、数据透视、Vlookup连接数据等,期间你面临着灰屏、死机、程序跳出未保存等各种风险。总结来说,在企业级的数据量处理中,excel是不行的。
对于SQL,处理几万条乃至更大体量的数据,效率都是非常高,并且代码不长,易于理解。
回到可视化,SQL作为数据可视化工作的第一步,完成了数据管理及清洗工作。
接下来我们来看看另外两条路:用商业智能BI做数据商业价值挖掘 or 用交互式图表表达数据内容。
Tableau —— 最好用的商业智能工具平台!
如果你是一名市场数据分析师:需要分析产品销量、地区排名、供需关系
或者是一名用户研究分析师:需要了解客户画像、用户组成、用户习惯
亦或是一名产品运营分析师:关注在线人数、用户日活、活动反馈
你都经常需要做一件事——向你的同事、老板、甲方表达你的研究成果。
这个时候商业智能BI是你最好的选择。
商业智能BI是目前各大公司常用的数据工作和数据可视化平台。它可以将数据进行快速准确的整合,并提供出结果图表及决策依据,辅助决策。
而对于BI,目前最主流的工具平台就是Tableau,其部署速度快,支持R/Python/JS等,目前也有免费开源版本Tableau Public,且均支持win和os系统。
接着上面的“淘宝双十一数据案例”,该数据在清洗后,一共有19个品牌3196个商品,那么如果想了解不同品牌在双十一的营销手段(如“最大打折力度”、“销售相关KPI指数”),可以通过Tableau来创建以下仪表盘:
核心指标及KPI框架设计
相关图表制作
仪表盘设计及结果呈现
BI可以解决大部分可视化业务的需求,但它始终是既定好的图表,只能优化组合,无法自由创作。数据可视化作为一种表达艺术,自然有更自由的工具和更有趣的表达方式,比如用Echarts制作复杂交互图表!
Echarts —— 用一张图来讲故事
复杂交互图表是一种蕴含更大体量数据及更复杂数据结构的可视化,可以使读者和可视化图表之间有更好的互动。其形式包括地理空间可视化、层次关系网络可视化、基于时间的多图表可视化等等。
使用Echarts的工作流可以简单概括为:使用SQL将数据处理成合适的格式(这个格式称为JSON),再读懂echarts图表中的JavaScript参数,修改对应参数并加载JSON数据,实现可视化效果。
还是以"双十的数据"为例,我们通过修改现有案例的参数来绘制一个交互式图表:
寻找模板及参数查阅
SQL处理数据
代码配置及可视化图表呈现
最终的图表内容中,横坐标是双十一前后10天的日期节点,我们选择了三个品牌来展示不同商品的价格变化趋势,通过图表互动,也可以看到三个品牌在双十一期的打折率、价格和营销策略的区别:
打折思路:双十一当天最低价,之后涨价但少于双十一前价格
妮维雅产品价格区间主要在100-200元之间;相宜本草产品价格区80-400之间;自然堂产品价格区间较分散
看到这儿,可能很多小伙伴儿会有疑问,上述的所有技能能够从零学起吗?
答案肯定是的!学习上述技能只需从一次“要动手、有目标、有答疑”的7天免费课程开始!
用一周免费体验 SQL+Tableau+Echarts
《数据可视化微转业体验课》
城市数据团联合网易云课堂微专业共同推出《数据可视化》微专业。《数据可视化》微专业面向所有业务人员及数据工作者,从头开始指导大家强化数据管理技能,掌握商业智能技术,实现多维数据可视化表达,用3个月时间进阶成为顶尖数据人才!
以下为免费体验课的详细介绍:
更多福利等你来!!
除了免费体验课外,我们还为大家准备了两大福利,包括:
1. 关于“数据可视化职业规划”的免费直播课
直播主题:数据领域最万金油的技能:数据可视化
直播大纲:
第一步,用SQL代替Excel
以商业智能为主的数据挖掘方法论
交互图表的优势在哪里?
SQL+Tableau+Echarts技能体系详解
2.【4G】数据可视化学习大礼包
3篇可视化技能学习资源合集
20+本可视化设计学习资料
1000+种图表可视化图表样式
国内外公开课合集推荐
海量练习数据
请扫码加群免费获取上述所有资料
群号:834311803
以上是关于利用数据可视化分析“双十一淘宝订单数据”的主要内容,如果未能解决你的问题,请参考以下文章
手把手教你利用Pyecharts库对IP代理数据进行数据可视化分析