大数据平台粗略架构和数仓设计步骤

Posted 谦如尘埃风过隙

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据平台粗略架构和数仓设计步骤相关的知识,希望对你有一定的参考价值。

 

大数据平台粗略架构

 

 

数据仓库设计步骤

1、确定主题

主题与业务密切相关,所以设计数仓之前应当充分了解业务有哪些方面的需求,据此确定主题

2、确定量度

在确定了主题以后,我们将考虑要分析的技术指标,诸如年销售额之类。量度是要统计的指标,必须事先选 
择恰当,基于不同的量度将直接产生不同的决策结果。

3、确定数据粒度

考虑到量度的聚合程度不同,我们将采用“最小粒度原则”,即将量度的粒度设置到最小。例如如果知道某些数据细分到天就好了,那么设置其粒度到天;但是如果不确定的话,就将粒度设置为最小,即毫秒级别的。

4、确定维度

设计各个维度的主键、层次、层级,尽量减少冗余。

5、创建事实表

事实表中将存在维度代理键和各量度,而不应该存在描述性信息,即符合“瘦高原则”,即要求事实表数据条数尽量多(粒度最小),而描述性信息尽量少。

 

以上是关于大数据平台粗略架构和数仓设计步骤的主要内容,如果未能解决你的问题,请参考以下文章

大数据——如何设计实时数据平台

如何设计实时数据平台(设计篇)

离线实时一体化数仓与湖仓一体—云原生大数据平台的持续演进

离线实时一体化数仓与湖仓一体—云原生大数据平台的持续演进

电商供应链数仓平台该如何建设?应该注意什么?

大数据的下一站 DataOps,智领云发布纯 K8s 云原生数据平台 BDOS Online