数据仓库模型设计

Posted tjp0210

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据仓库模型设计相关的知识,希望对你有一定的参考价值。

数据仓库概念

1.概念模型设计

所要完成的工作是:

(1)界定系统边界

要做的决策类型有哪些?

决策者感兴趣的是什么问题?

这些问题需要什么样的信息?

要得到这样信息需要包含原有数据库哪些数据?

(2)确定主要的主题及其内容:

主题是基于业务来说的,不是技术本身。如果业务能够按照一定规模分割出独立的几个模块,那每个模块就是一个主题域。这是分而治之的思想 

客户主题的含义可以简单给你解释为以客户号为主键的事实表的集合就是客户主题;
当中包含了客户的各方面信息;

数据仓库是对原有数据库中数据进行集成和重组而成的集合,看原有数据中"有什么"、“怎样组织的”、“如何分布的”等,考虑如何建立数据仓库

数据仓库步骤

1.确定主题

主题和业务结合,设计数据仓库之前一定要充分了解业务有哪方面需求,据此确定主题

2.确定度量

确定了主题,考虑要分析的技术指标

3.确定数据粒度

考虑到量度的聚合程度不同,我们将采用“最小粒度原则”,即将量度的粒度设置到最小

4.确定维度

设计各个维度的主键、层次、层级、尽量减少冗余

5.创建事实表

事实表中将存在维度代理键和各量度,而不应该存在描述性信息,即符合“瘦高原则”,即要求事实表数据条数尽量多(粒度最小),而描述性信息尽量少。

以上是关于数据仓库模型设计的主要内容,如果未能解决你的问题,请参考以下文章

数据仓库多维数据模型设计

Greenplum 实时数据仓库实践——数据仓库设计基础

Greenplum 实时数据仓库实践——数据仓库设计基础

数据仓库模型设计

数据仓库的模型设计 (转)

数据仓库设计要点