数据仓库之粒度

Posted 一起来玩数据仓库

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据仓库之粒度相关的知识,希望对你有一定的参考价值。

概念: 

粒度是指数据仓库中数据单元的细节程度或综合程度的级别。说白了就是表示某一个事实表中的一行数据是什么。

原子粒度是最低级别的粒度。

双(多)重粒度指的是同时包含原子以及一种汇总(以上)的粒度


细节、粒度、查询范围、成本的关系

细节程度越高,粒度级就越低;相反,细节程度越低,粒度级就越高。

粒度级别越低,查询范围越广;相反,粒度级别越高,查询范围越小。

粒度级别越低,查询成本越大;相反,粒度级别越高,查询成本越小。


粒度声明的重要性

在选择维度和事实前必须先声明好粒度,因为每个维度和事实必须与粒度保持一致。

而且最好是从粒度最低的原子粒度开始进行相关设计,因为原子粒度可以承受无法预料到的用户查询。

另外针对不同的事实表粒度,要建立好不同的物理表,同一个实时表不要混用多种不同的粒度。


以上是关于数据仓库之粒度的主要内容,如果未能解决你的问题,请参考以下文章

数据仓库之三大事实表

数据仓库中重要的数据模型 大神都在用

事实和维度数据仓库 Datamart

识别数据模型粒度

数据仓库概述

数据仓库建模-维度建模