数据分析的数据源从这个地方来
Posted 产品刘
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析的数据源从这个地方来相关的知识,希望对你有一定的参考价值。
数据仓库,简称为DW(Data Warehouse的缩写),是一个很大的数据存储集合,通过对多样的业务数据进行筛选与整合,产出企业的分析性报告和各类报表,为企业的决策提供支持。
数据库大家都知道,是按照是按照数据结构来组织、存储和管理数据的仓库,常用的数据库有mysql、Oracle、Mongodb等
但我们实际的项目中往往有不同的数据来源,并不只来源于数据库,有些数据储存在Mysql里,有些是用户的操作日志数据,甚至还有一些第三方的数据,有的时候需要把这些数据整合在一起进行数据分析,数据仓库就在这样的情况下应运而生。
数据仓库的输入方是各种各样的数据源,最终的输出用于企业的数据分析、数据挖掘、数据报表等方向。
数据仓库特点:
1、主题性
不同于传统的数据库是应用于某个项目,数据仓库则是围绕一个主题进行获取数据和分析数据,以此来满足数据分析的需求。
比如p2p平台一个月内发生了多少交易额,分析那个时间段内现金的流入和流出最高,
2、集成性
我们上面说了,数据仓库的数据来源有数据库的数据、操作日志的数据、运营后台导入的数据、一些第三方接口的数据,原始数据来源不同,存储方式也各不相同,如果要整合成最终的数据集合,需要对数据进行抽取、清洗、转换的过程。
3、稳定性
数据仓库不允许对数据进行修改,只能进行查询和分析。
4、及时性
数据仓库一定要获取最新的数据,这样数据分析出来的结果才是有效的。
数据仓库如何集成不同的数据源?
上面说了数据仓库要将不同的数据源集合起来,那如何集合呢?这里就要介绍ETL的概念,ETL的是 Extract-Transform-Load 的缩写,主要描了数据从来源迁移到目标的几个过程:
1、Extract(抽取)
首先是读取数据源。
2、Transform(转换)
把数据转换成需要的纬度和格式,同时包含数据清洗,清洗掉一些噪音数据。
3、Load(加载)
把数据加载到目标仓库以供分析使用。
现在国内最常用的是一款基于Hadoop的开源数据仓库,名叫【Hive】,可以对存储在HDFS上的文件数据集进行查询和分析处理。
产品经理在实际工作中不能自认为把功能做完了就完了,需要对后续的数据表现进行跟踪分析,知道数据仓库以后,在和工程师的沟通中可以更精准的描述自己的需求,今天这篇数据仓库分享给大家,希望能帮助到不懂技术的小伙伴们。
欢迎小伙伴加我的私人微信yw5201a1交流。
第二期产品经理培训告一段落,很多小伙伴找到了工作,成功转行产品经理。
很多小伙伴可能会有疑问,为什么我的产品分为1.0、2.0、3.0,其实我一直在一线互联网公司做产品经理,不是专职做培训的,随着我自己的不断成长,我会有很多新的感悟分享给大家,而且以前1.0、2.0的老学员上3.0课程都是不涨价的,也就是说早报名早划算。
而且我知道很多找我的主要是一些0-2岁的产品经理,他们现在最大的需求是找到一份产品经理的工作,并且能够安全度过试用期的干下去,所以我的课程不是给你上过一些理论就让你自己去找工作,我会利用自己的行业人脉资源,以及我自身的能力帮你包装简历,并成功找到一份工作,找到工作后可能开始阶段你还无法适应新的工作,没关系,我会陪你一起度过这个阶段,很多人都说转行产品经理,但怎样才算转行成功,那就是你找到一份产品经理的相关工作。
之前我的想法是直接带领大家做一款产品得了,这样大家就知道产品经理是做啥的,但是我发现没有基础的人如果上来就做产品的话,没有扎实的理论知识,没有和各相关业务部门的相处技巧,做出来的东西完全就是漂浮在空中,做产品经理包含写原型、画文档,但绝不仅仅包含写原型、画文档。
那是不是就不实践,当然不是,理论和实际相结合才是最好的教学方式,很幸运的是我现在也接了一些从0到1的项目,等保密期过后,我会拿出来和大家分享,包含前后端的原型以及文档。
我对产品的知识做了一个梳理,这样你对产品需要学习的技能就有个大概的了解,你学习到的所有碎片化知识都可以往里面丢,这也是我们的课表,如下图(看不清可以点击放大查看,相比2.0做了更新,区块链现在比较火,而且我们公司有区块链研究院,我也参加了,我会把学习到的知识分享给大家):
报名的童鞋在工作中有啥问题可随时咨询!
如果担心讲的质量,可以加我微信(yw5201a1)索要试听课程。
担心没时间听的小伙伴放心,我们会有录屏供你反复学习。
提供的特色服务:
1、我会带领大家以实战的形式进行竞品分析、原型设计、PRD的制作等.
2、大家都知道大公司分工比较细,就像古代御膳房的厨子一样,可能这个厨子就是个切菜的,你让他出来教你做厨师不是扯淡么!所以在我的课程 中我会邀请不同行业的产品经理教大家不同的知识,比如我会邀请专门做后台的产品经理教大家一些后台做产品的方式方法,这些产品经理有来自腾讯、央行、链家等。
3、我们不仅是培训,更是一个分享的社群,不会上完课给你发个没有卵用的毕业证书,只要我还在互联网行业混,就会不断的把我的经验分享出来给大家。
4、之前也有一些同学专门花钱咨询我产品经理面试的问题,两个小时300元,现在这些服务都免费赠送给私密学员,不论你是转行的,还是刚毕业,亦或是想进阶,只要是找工作遇到问题,都可咨询。
5、我会把我做的一些项目给大家说,同时大家在做产品过程中的一些问题可以随时咨询。
开讲时间:每周天早上10:30
总课时:终身制(只要我还在互联网行业混,就会不断的把我的经验分享出来给大家)
主讲人:刘大大
主讲人介绍:
我是刘大大,人人都是产品经理专栏作家,产品100年度优秀作者,现任某世界500强公司产品经理,曾在麦子金服,中赢金融、国金宝等理财平台担任产品经理,曾发表过热门文章《产品经理面试习题大汇总》,《产品经理如何写好MRD文档》等,从来说的都是干货!
报名方式:本期课程报名费是2999,前10名2499,现在还有3个名额,想要报名的抓紧欧。
如果没有抢到前10名的小伙伴也不要气馁,届时两人报名2900;三人报名:2800;四人报名,2700;5人报名:2600。
往期精彩文章
点击“阅读原文”
即可进行系统学习。
以上是关于数据分析的数据源从这个地方来的主要内容,如果未能解决你的问题,请参考以下文章