讨论帖:主数据管理和数据仓库等在实际使用中的区别

Posted 中车信息公司

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了讨论帖:主数据管理和数据仓库等在实际使用中的区别相关的知识,希望对你有一定的参考价值。



 

 

导 读


数据作为信息时代的重要战略资源,被称为“新时代的石油”,而企业的数据治理就是如何开采和使用这种资源的手段。数据治理是一个范围很大的概念,本文主要是针对数据治理中最基础的一环主数据管理,并结合实际的经验,做下简要分析。


问:主数据管理和数据仓库的区别。
主数据管理(Master Data Management,MDM)指系统间共享数据 (例如,客户、供应商、账户和组织部门相关数据)。与记录业务活动,波动较大的交易数据相比,主数据(也称基准数据)变化缓慢(百度百科)。就营销相关系统而言,客户、产品、销售商、协议、交易日历、企业组织架构等都属于主数据,这些数据对于企业来讲只可能有唯一的数据视图。有的人会有疑问,同样作为消除数据冗余和不一致,打破信息孤岛的技术手段,主数据管理和数据仓库(Data Warehouse,DW)看起来是有重复的。要解答这一问题,大家先看下面这幅企业总体应用架构图:

讨论帖:主数据管理和数据仓库等在实际使用中的区别

企业总体应用架构图

从图中可以看出,各业务系统都会对MDM发出变动申请,经处理后再统一分发给各应用系统。这就说明MDM是实时变化的,放在DW中显然不合适。DW是OLAP的范畴,主要职责是对大量历史数据的多维分析,提升业务洞察力的系统。而MDM是OLTP的范畴,由于数据量相对较小提供24小时读写服务也不算难事。在信息系统建设中,最难的是区分好每个系统的职责,某系统提供了职责之外的服务,短期来看可能问题不大,但随着业务的发展,运维人员便会疲于奔命,效果也不好。

但DW和MDM又有着紧密的联系,DW的分析汇总结果可以作为衍生信息回写到MDM中,比如客户的历史最大份额、客户等级、直代销客户、产品偏好等特征,这样可以更好的为CRM服务。同时MDM又是DW做多维分析的基础。


还有一个容易和MDM混淆的概念就是操作数据存储(Operational Data Store,ODS),ODS是DW的一部分,是各应用系统间需要共享的交易流水数据。而MDW则只是包含主数据及其之间的关系,并不包含交易数据。比如客户数据是MDW管理的,而TA的交易、份额、净值、收益等则通过ODS共享,不同的共享方式也实现了读写分离。



问:主数据的架构模式。

答:MDM按实现复杂度从小到大分为合并、注册、共存和集中四种模式。


  1. 合并。主数据维护仍在各源系统中,只是将结果通过ETL清洗成一致的数据视图给BI系统使用,数据流是单向的。实施简单,但数据不实时且ETL维护成本高。

  2. 注册。MDM只是记录主数据和各源系统的对应关系 ,数据仍存储在各源系统。MDM记录源系统数据库以及表的位置,每次提供服务时实时查询各系统并按照规则合并在一起。这种模式实施简单,数据实时但对源系统很敏感,不易维护。

  3. 共存。允许MDM和源系统同时存储主数据并进行读写。MDM通过ETL对各源系统清洗合并成权威数据再分发到各系统。对现有系统改变小,但不实时且不能根除数据不一致情况。

  4. 集中。MDM是主数据唯一读写入口,MDM从各源系统提取主数据并统一分发到其他系统。效果最好但投入大、对现有环境改造大。


从上面描述可以看到,对于现有系统,一般采用共存模式,对于新建系统,则尽量采用集中模式。
问:主数据管理有哪些主要功能模块

答:一个完整的MDM应该具有下图中的几部分功能:


MDM对一个企业的重要性不言而喻。没有MDM,可能各个系统维护一套产品信息、产品分类、交易日历等等。有变化时都要手工维护不说,还经常会相互之间对不上;领导要查看某部门的绩效报告,不同系统出的结果又是对不上。并不是流水数据错了,经常是主数据出了问题。


— THE END —




以上是关于讨论帖:主数据管理和数据仓库等在实际使用中的区别的主要内容,如果未能解决你的问题,请参考以下文章

主数据和维度数据有啥区别

PCA(主成分分析)和特征选择之间的区别

可以在数据仓库维度表上存储事务主键以在事实暗淡之间关联吗?

数据仓库系列3-键

数据库中的主键、关键字、索引

主成分分析和因子分析区别与联系