主数据与参考数据的定义与相互联系

Posted 一马平川的大草原

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了主数据与参考数据的定义与相互联系相关的知识,希望对你有一定的参考价值。

这是一篇有关数据管理方面的读书笔记,通过阅读DAMA数据管理知识体系,学习了我们在信息系统建设和系统数据整合过程中用到主数据和参考数据的相互关系,明确了两者的定义与异同点,使得我们了解到主数据和参考数据的重要性,应该说两者对数据治理、数据质量、元数据管理和数据整合等职能有着重要的作用,具体如下。

一、主数据与参考数据的定义

整体定义:主数据与参考数据是组织中需要跨领域、跨流程和跨系统使用的数据,是组织在业务流程开展过程中需要系统之间共享的数据,并确保系统之间使用这些数据的结构和数据值保持一致。

主数据:组织中有关业务实体的数据,并为组织的业务交易和数据分析提供上下文语境信息。业务实体主要有雇员、客户、产品、服务、金融结构、资产和位置等。

参考数据:组织中用于描述或分类其他数据的数据,或者将数据与组织外部的信息联系起来的任何信息。

二、主数据与参考数据的区别与联系

要理解主数据与参考数据的关系,首先要弄清楚常见的数据都有哪些类型,按照奇泽姆的六层分类法,数据类型主要有元数据、参考数据、企业结构数据、交易结构数据、交易活动数据和交易审计数据。而主数据包括参考数据、企业结构数据和交易结构数据,也就是说,参考数据是主数据的一种,但两者有区别,具体如下:

1.主数据需要为概念实体的每个实例识别和开发可信的实例版本,并维护该版本的时效性。面临的主要挑战是实体解析(用于识别和管理来自不同系统和流程的数据之间的关联过程)。

2.从概念方面来说,主数据与参考数据都是为了交易数据的创建和使用提供重要的上下文语境信息,同时参考数据为主数据提供上下文,以便用户理解数据的含义,在企业运营过程中塑造了进入组织的交易数据,而且两者都是从企业层面管理的共享资源。

3.相对于主数据,参考数据不容易变化,数据集通常比交易数据或主数据集小,复杂程度低,拥有的行列更少,同时参考数据不包括实体解析的挑战,但参考数据面临的一个挑战是由谁来主导或负责参考数据的定义与维护的问题。

4.相对于主数据,管理的重点不同。

参考数据管理(RDM):主要对定义的域值及其定义进行控制,管理目标是确保组织能够访问每个概念的一整套准确而且最新的值。

主数据管理(MDM):主要对主数据的值和标识符进行控制,能够跨系统、一致地使用核心业务实体中最准确最及时的数据,管理目标是确保当前值的准确性和可用性,同时降低由于不明确的标识符引发的相关风险。

三、为什么要开展主数据管理呢?

即驱动开展主数据管理的因素是满足组织的数据需求、管理数据质量、管理数据集成成本和降低风险。

同时,通过参考数据的集中管理可以带来以下好处:

1.通过使用一致的参考数据,满足多个项目的数据需求,降低数据整合的风险和成本。

2.提升参考数据的质量。数据驱动型组织主要关注交易数据,但交易数据的能力高度依赖于主数据与参考数据的可用性和质量。

3.能够简化IT环境、提升效率和生产力,从而改善用户体验。

以上是关于主数据与参考数据的定义与相互联系的主要内容,如果未能解决你的问题,请参考以下文章

内存,主存,存储器,外存,寄存器的概念,相互区别和联系

图像处理、模式识别、计算机图形学之间的相互关系

3NF 与BCNF 有啥区别? 求举个例子说明下~谢谢

多标签分类:keras自定义指标

PCA

分类与监督学习,朴素贝叶斯分类算法