第一篇:数据领域重点概念澄清
Posted 数据文字工作者
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第一篇:数据领域重点概念澄清相关的知识,希望对你有一定的参考价值。
前言
“数据治理”简简单单四个字却涉及组织、制度、机制、技术、标准等非常多的内容,是一门复杂综合性学科,而且是很多数据类项目的基础性、前置性工作,很多项目或多或少都会涉及到数据治理相关工作,本系列文章主要基于个人学习与实践经验,跟大家系统的聊聊“数据治理”这件事儿!
欢迎大家催更、鼓励,大家的关注将是我持续的动力!
——金子,十年数据领域探索者
第一篇:数据领域重点概念澄清
本篇主要对数据平台、数据治理、数据仓库、数据中台几个我们在数据类项目中经常混淆的概念做一个澄清。
数据平台
数据平台,主要是指一套涵盖数据存储计算、数据处理、数据治理与资产管理、数据服务管理的平台工具。
其中,数据存储计算类工具包括:开源Apache Hadoop生态体系、CDP(Cloudera CDH和Hortonworks HDP整合而来)、星环科技TDH(Transwarp Data Hub)、阿里云MaxComputer(原ODPS)、GreenPlum、TiDB、ClickHouse以及传统关系型数据库等各种数据存储计算类平台工具,在具体使用时可根据不同产品特性和业务需求选择合适工具(后续将专题介绍不同平台工具特性,为大家技术选型提供支撑);
数据处理、数据治理与资产管理、数据服务管理类工具国内主要由目前数据中台类厂商提供的商业套件,包括:阿里云DataWorks、阿里云DataWorks、华为云DGC(原DAYU平台)、数澜科技·数栖平台、百分点BD-OS等,目前市场已逐渐趋向成熟。当然,也可以基于开源组件自己搭建。
数据平台可以作为支撑数据治理、数据仓库、数据中台建设的平台工具,但也仅仅是技术工具,远不能称作数据中台!
数据治理VS数据仓库
数据治理与数据仓库,既相互包含,但实施过程中又各有侧重。其中,数据治理更侧重对整个数据治理体系的建设,包括组织、制度、机制的建设,以及对数据标准、数据质量、数据安全的管控,以为企业提供可信、易用的数据资产;而数据仓库则更侧重数据的分层与数据模型建设,为数据分析提供数据支撑。但是,数据仓库建设有没有包含ETL等数据治理工作,当然有;数据治理包不包含数据分层和数据建模,当然也包含!
数据中台
最后,我们再来看看数据中台。一般我们把数据中台定义为一种持续让数据用起来的机制,而不仅仅一套平台工具,它更强调数据的资产化与资产的服务化,构建一套能持续不断的把数据变成资产并服务于业务的能力,数据服务是标配。
以上观点纯属个人理解,不足之处欢迎大家交流、指正!
以上是关于第一篇:数据领域重点概念澄清的主要内容,如果未能解决你的问题,请参考以下文章