数据仓库中重要的数据模型 大神都在用

Posted IT大数据笔记

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据仓库中重要的数据模型 大神都在用相关的知识,希望对你有一定的参考价值。

数据仓库中重要的数据模型 大神都在用 

DATA WAREHOUSE常用模式

数据仓库:是面向主题的、集成的、不易丢失的并且是时变的。一个支持管理决策的数据集合。

切片:一种用来在数据仓库中将一个维度中的分析空间限制为数据子集的技术。

数据仓库中重要的数据模型 大神都在用

切块:一种用来在数据仓库中将多个维度中的分析空间限制为数据子集的技术。

粒度:粒度将直接决定所构建仓库系统能够提供决策支持的细节级别。粒度越高表示仓库中的数据较粗,反之,较细。粒度是与具体指标相关的,具体表现在描述此指标的某些可分层次维的维值上。例如,时间维度,时间可以分成年、季、月、周、日等。

度量值:在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。此外,度量值是所分析的多维数据集的中心值。即,度量值是最终用户浏览多维数据集时重点查看的数字数据。

星型模式:是DW中的最佳设计模式。星形图通常生成一个两层结构,即只有维度和指标。星型模式的核心是一个大的中心表(事实表),一组小的附属表(维表)。它在物理上表现为中心实体,内容包括指标数据、辐射数据,有助于浏览和聚集指标数据的维度。星形图模型得到的结果常常是查询式数据结构,能够为快速响应用户的查询要求提供最优的数据结构。星形图还常常产生一种包含维度数据和指标数据的两层模型。

雪花模式:星型模式的扩展,其中某些维表被规范化,进一步分解到附加表(维表)中。

事实星座模式:由多个主题构成,包含多个事实表,而维表是公共的,可以共享,这种模式可以看做星型模式的汇集,因而称作星系模式或者事实星座模式。

多维数据模型最典型的数据模式包括星型模式、雪花模式和事实星座模式

事实星座模式是数据仓库最长使用的数据模式,尤其是企业级数据仓库(EDW)。这也是数据仓库区别于数据集市的一个典型的特征,从根本上而言,数据仓库数据模型的模式更多是为了避免冗余和数据复用,套用现成的模式,是设计数据仓库最合理的选择。

喜欢就关注哦


以上是关于数据仓库中重要的数据模型 大神都在用的主要内容,如果未能解决你的问题,请参考以下文章

数据仓库的多维数据模型定义

ETL (数据仓库技术)

数据仓库——数据仓库命名规范

数据仓库知识点梳理

数据仓库系列3-键

数据仓库实践过程中的规范