数据仓库设计原则

Posted BYITTD

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据仓库设计原则相关的知识,希望对你有一定的参考价值。

采取务实的态度部署一个完备的企业数据仓库 ― 我的意思是一个准确、有效、更具生产力的企业数据仓库 ― 涉及到一个完善的设计原则。这些原则具体到于每一个部门的参考架构;每一个都有具体的能力和服务于特定的功能。在这里,我想列出信息仓库层标准中央存储器(记录系统)的原则。

信息仓库层被设计作为一种已在上游处理过的数据的标准数据存储器。它已经进行了清洗、转化和主数据处理,并在这里被合并成一个记录系统。数据标准化重构的原则是,将它从源系统单一视角中移出,放到整个企业的多角度中。数据建模是根据其本质而不是使用

这个流程的设计对数据加上一种严格的秩序以提升数据的完整性,并且保持高度的灵活性。数据被分散到单独的表中的方式对查询是一种挑战,但这不是它的主要目的。数据完整性和灵活性是主要目标,而且性能调整主要是朝向加载的速度而不是数据的访问的速度。

1. 数据完整性

以积极的姿态来保护引用完整性和减少冗余实体或不一致的可能。

2.可扩展性

允许数据量的增加或已有信息的额外数据源,无论在主题区域 (例如:发行者、同行)还是在核心概念上(如发行者、供应商)。

3.灵活性

允许额外数据源或现有源的变更,使设计不拘泥于一个给定的源或源的镜相。设计将主要考虑到再利用,然后是扩展 ,最后是对现有结构的修正。

4.一致性

采用数据仓库设计标准以促进数据仓库和ETL设计的效率。决策过程将会和数据建模工作和ETL的开发一样加快。

5.效率

关注三个方面的效率

1) 安装

可重复使用的数据设计的模式将最大限度地减少数据建模和ETL的工作量。

2) 操作

保持最小的数据组和保持一致的标准以便维护易于进行,运用逻辑结构以方便导航和使用。

3) 加载性能

优先考虑ETL加载流程的性能;包括那些使用记录系统作为一种源加载数据集市的部分。

6.从企业的角度

为所有的数据对象、保留和维持对各种实体间已有的和潜在的关系的开放,以确保数据反映了整个企业,而不是不限于任何特定的项目需求。

这些基本原则通过影响存储历史、层次结构、标准化程度、分类、代理键和许多其他方面的设计的策略进行实施。设计原则是判断在一个特定的情况中采取的最好方法的标准。它并不总是直截了当的,就算有适当的原则,有时候也会对多项原则有所侧重(例如, 侧重灵活性多于加载性能),但以上列项提供了对数据仓库设计方法的指导。


    正如之前所建议的那样,我不提倡盲目符合一套规则,但是,在我的经验中,高效开发的一个最大的障碍是决策过程。用智慧设计原则来减少讨论的参数可使决策过程更快更正确。


文章来源于网络,如有异议,请联系我删除此文!

以上是关于数据仓库设计原则的主要内容,如果未能解决你的问题,请参考以下文章

盘点数据仓库建设需要知道的那些事

数据仓库的模型设计 (转)

一种通用的数据仓库分层方法

15.数据仓库建设基本原则-实践篇

15.数据仓库建设基本原则-实践篇

收藏,数据仓库建设与框架终于有人给讲明白了