讨论帖:主数据管理和数据仓库等在实际使用中的区别
Posted 中车信息公司
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了讨论帖:主数据管理和数据仓库等在实际使用中的区别相关的知识,希望对你有一定的参考价值。
导 读
数据作为信息时代的重要战略资源,被称为“新时代的石油”,而企业的数据治理就是如何开采和使用这种资源的手段。数据治理是一个范围很大的概念,本文主要是针对数据治理中最基础的一环主数据管理,并结合实际的经验,做下简要分析。
企业总体应用架构图
从图中可以看出,各业务系统都会对MDM发出变动申请,经处理后再统一分发给各应用系统。这就说明MDM是实时变化的,放在DW中显然不合适。DW是OLAP的范畴,主要职责是对大量历史数据的多维分析,提升业务洞察力的系统。而MDM是OLTP的范畴,由于数据量相对较小提供24小时读写服务也不算难事。在信息系统建设中,最难的是区分好每个系统的职责,某系统提供了职责之外的服务,短期来看可能问题不大,但随着业务的发展,运维人员便会疲于奔命,效果也不好。
但DW和MDM又有着紧密的联系,DW的分析汇总结果可以作为衍生信息回写到MDM中,比如客户的历史最大份额、客户等级、直代销客户、产品偏好等特征,这样可以更好的为CRM服务。同时MDM又是DW做多维分析的基础。
还有一个容易和MDM混淆的概念就是操作数据存储(Operational Data Store,ODS),ODS是DW的一部分,是各应用系统间需要共享的交易流水数据。而MDW则只是包含主数据及其之间的关系,并不包含交易数据。比如客户数据是MDW管理的,而TA的交易、份额、净值、收益等则通过ODS共享,不同的共享方式也实现了读写分离。
答:MDM按实现复杂度从小到大分为合并、注册、共存和集中四种模式。
合并。主数据维护仍在各源系统中,只是将结果通过ETL清洗成一致的数据视图给BI系统使用,数据流是单向的。实施简单,但数据不实时且ETL维护成本高。
注册。MDM只是记录主数据和各源系统的对应关系 ,数据仍存储在各源系统。MDM记录源系统数据库以及表的位置,每次提供服务时实时查询各系统并按照规则合并在一起。这种模式实施简单,数据实时但对源系统很敏感,不易维护。
共存。允许MDM和源系统同时存储主数据并进行读写。MDM通过ETL对各源系统清洗合并成权威数据再分发到各系统。对现有系统改变小,但不实时且不能根除数据不一致情况。
集中。MDM是主数据唯一读写入口,MDM从各源系统提取主数据并统一分发到其他系统。效果最好但投入大、对现有环境改造大。
答:一个完整的MDM应该具有下图中的几部分功能:
MDM对一个企业的重要性不言而喻。没有MDM,可能各个系统维护一套产品信息、产品分类、交易日历等等。有变化时都要手工维护不说,还经常会相互之间对不上;领导要查看某部门的绩效报告,不同系统出的结果又是对不上。并不是流水数据错了,经常是主数据出了问题。
— THE END —
以上是关于讨论帖:主数据管理和数据仓库等在实际使用中的区别的主要内容,如果未能解决你的问题,请参考以下文章