怎么做数据分析图?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎么做数据分析图?相关的知识,希望对你有一定的参考价值。
请问怎么做数据分析图?
以常用的大数据分析图工具Excel为例,首先要新建一个空白表格。然后要在新建好的空白表格中键入相应的数据,再通过鼠标右键设定单元格格式,把需要分析的数据填好在报表中。然后应用shift+鼠标左键选定你想要分析的区域,根据分析需求选择相应的函数和图表类型,即可做出想要的大数据分析图。能绘制数据分析图的专用工具多了,比如用PPT,Echarts,FineReport,全是能够完成的。其实与其花许多时间在找专用工具,做图表,调颜色上,不如多思索该如何分析,如何将自己表达的内容说清楚。所以最好用方便的数据分析图工具——FineReport。只需拖拽即可生成你想要的图表,大大节省了时间。
比如,目前主流的软件——finereport,它小到填报、查询、部署、集成,大到可视化大屏、dashboard驾驶舱,应有尽有,功能很强大。最重要的是,因为这个工具,整个公司的数据架构都可以变得规范,下一步就是构建企业的大数据平台了。而且它是java编写的,支持二次开发,类Excel的设计器,无论是IT还是业务,上手都很简单:编辑sql优化、数据集复用简直都是小case,大大降低了报表开发的门槛。在企业中被关注最多的数据安全方面,FineReport支持多人同时开发同一套报表,并通过模板加锁功能防止编辑冲突;通过数据分析权限控制,保障数据安全。 参考技术A
一 选择工具
可选择的数据分析工具有很多,常见的图表类利用excel即可完成,如果想炫酷一点可利用HubSpot、Xplenty等数据可视化工具完成
二 如何使用
以excel为例,可以生成柱状图、饼状图、折线图、散点图,数据分析图表等,
常见的6种数据分析图表及应用方式:
柱状图:用于做比较
柱状图是最基础的一种图表,通过柱子来表现数据的高度,进而比较不同数据之间的差异,一眼可以看到数据量的大小对比,一般来说,柱状图的横轴是时间轴,纵轴是数据轴。但柱状图并不是万能的,需要基于某一个主题比较数据量的变化,比如不同月份的新增用户,不同渠道的新增用户,但如果将活跃用户、留存用户、新增用户这三个维度放在一张柱状图里比较,就没有太大意义。
2.折线图:看数据变化的趋势
折线图一般基于时间维度看数据量的变化趋势,发现整体走向和单体突出数据,比如通过折线图可以看出全年的新增用户变化情况,找出数据变化的高点和低点,而柱状图则用来对比不同高点之间的变化,进而找原因。折线图可以将不同纬度的数据放在一起比较,比如新增用户、活跃用户、流失用户三条用户变化曲线放在一起,就可以观察三者之间的彼此影响,例如新增用户量大时有没有对活跃用户带来提升,流失情况是否严重,进而得出活动效果的综合评价。
3.饼状图:用来看各部分的占比
饼状图和柱状图在应用上有一定的重合,例如不同渠道带来的新增用户量,饼状图和柱状图都可以表现,但饼状图看的是单一渠道转化用户的占比,柱状图更容易发现不同渠道转化用户的差距。饼状图的应用重点在于发现单体因素在整体因素中的占比,例如活跃用户在整体用户中的占比,但如果用多个单体因素做饼状图,可能导致数据特征不明显。
4.散点图:用于2维数据的比较
散点图可以用于3维数据的表现,同时可以进行2维数据的比较。例如将不同活动带来的新增用户和留存用户进行比较时,横轴为留存用户,纵轴为新增用户,而点则表示不同的活动主题。
从而可以看出不同活动主题的用户转化和留存情况,一般我们将数据大的维度作为纵轴,更有利于屏幕的展示。
5.气泡图:用户3维数据的比较
气泡图是对散点图的升级,通过散点图中点的大小来表现第三维数据,例如将上文案例中,横轴为留存用户,纵轴为新增用户,点为活动主题,而点的大小为活跃用户数量,活跃用户越高的活动点越大,可以看出不同活动在新增、留存和活跃3个维度的数据差异。
6.雷达图:思维以上数据的对比
雷达图可以应用于多维度数据对比,比如在分析不同用户的行为特征时,我们可以从启动次数、使用时长、购物次数、浏览商品数量、下单金额等多个维度进行分析,那么反映到图表上就可以看出不同用户群组特征在不同维度的差异。
雷达图一方面可以发现不同群组用户的特征对比,另一方面可以总结不同用户的特征,例如还是以上几个维度,我们可以以1个指标为关键指标,如下单金额指标,观察出下单金额高的用户在浏览商品数量、使用时长等方面的表现,进而找到提升下单金额的方法,如提高用户的商品浏览数量。
数据分析 —— 数据挖掘是什么能干嘛怎么做
数据分析
数据挖掘
-
什么是数据挖掘
数据挖掘:用于寻找数据中隐含的知识,并用于产生商业价值的一种手段
-
为什么要做数据挖掘
技术和商业就像一对双生子,在互相促进中不断演进发展。随之而来的就是个大公司的业务的突飞猛进,也涌现出很多的新模式,使得数据量激增。面对数以千万甚至上亿以及不同形式的数据。很难再用纯人工、纯统计的方法从成千上万的变量中,找到其隐含的价值。所以我们需要一种规范的解决方案,能够利用并且充分利用这些数据中每一个部分,通过一些自动化的机器学习算法,从数据中自动提取价值。
数据挖掘提供了一系列的框架、工具和方法可以处理不同类型的大量数据,并且使用复杂的算法部署,去探索数据中的模式
-
数据挖掘的产生动因
- 海量数据
- 维度众多
- 问题复杂
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8Od48RVS-1649587377085)(D:\\Typora\\img\\MyBatis-Plus\\image-20220410174702234.png)]
-
数据挖掘的用处
-
分类问题 —— 对已知类别的数据进行学习,为新的内容标注一个类别
新浪导航栏图 -
聚类问题 —— 聚类的类别预先是不清楚的比较适合一些不确定的类别场景
-
回归问题
回归问题的最大特点 ―— 生成的结果是连续的使用回归的方法预测北京某个房子的总价 (y)
假设总价只跟房子的面积 (x) 有关,那么构建的方程式就是 ax+b=y
回归方法 ―― 通过构建一个模型去拟合已知的数据(自变量),然后预测因变量结果
-
关联问题
关联问题最常见的一个场景 —— 推荐
京东组合购买推荐图
-
-
数据挖掘怎么做
数据挖掘是有方法论的
数据挖掘经过了数十年的发展和无数专家学者的研究,有很多人提出了完整的流程框架
应用最多的方法论︰CRISP-DM (Cross-industry Standard Process for Data Mining,跨行业数据挖掘标准流程)
CRISP-DM 流程
-
业务理解(Business Understanding)
比如:训练一个模型来预测明年公司的利润
业务理解 ―― 理解你的数据挖掘要解决什么业务问题
必须从商业或者从业务的角度去了解项目的要求和最终的目的,去分析整个问题涉及的资源、局限、设想,甚至是风险、意外等情况
也就是 从业务出发,到业务中去
-
数据理解(Data Understanding)
数据理解阶段始的重点:在业务理解的基础上,对掌握的数据要有一个清晰、明确的认识
注意:数据理解和业务理解是相辅相成的
-
数据准备(Data Preparation)
数据准备是基于原始数据,去构建数据挖掘模型所需的数据集的所有工作。包括数据收集、数据清洗、数据补全、数据整合、数据转换、特征提取等―系列动作
-
构建模型(Modeling)
构建模型也叫作训练模型,重点解决技术方面的问题
选用各种各样的算法模型来处理数据,让模型学习数据的规律,并产出模型
如果有多重技术要使用,在这一任务中,对于每一个要使用的技术要分别对待比如SVM算法只能输入数值型的数据
-
评估模型(Evaluation)
模型的效果如何,能否满足业务需求
需要使用各种评估手段、评估指标甚至是让业务人员一起参与进来,彻底地评估模型
在评估之后会有两种情况:
- 评估通过,进入到上线部署阶段
- 评估不通过,要反过来再进行迭代更新
-
模型部署(Deployment)
解决一些实际的问题,比如
长期运行的模型是否有足够的机器来支撑,数据量以及并发程度会不会造成部署的服务出现问题部署是一个挖掘项目的结束,也是一个数据挖掘项目的开始
以上是关于怎么做数据分析图?的主要内容,如果未能解决你的问题,请参考以下文章