如果 datamart 是 datawarehouse 的逻辑划分,那么它在 datalake 中对应的是啥?

Posted

技术标签:

【中文标题】如果 datamart 是 datawarehouse 的逻辑划分,那么它在 datalake 中对应的是啥?【英文标题】:If datamart is logical division of datawarehouse , then what is it corresponding in a datalake?如果 datamart 是 datawarehouse 的逻辑划分,那么它在 datalake 中对应的是什么? 【发布时间】:2018-04-02 02:00:17 【问题描述】:

如果 datamart 是 datawarehouse 的逻辑划分,那么它在 datalake 中对应的是什么? 数据湖中是否也有任何设计,如星型或雪花模式?

【问题讨论】:

【参考方案1】:

数据湖的概念是在一个地方提供所有类型的数据,因此它们中的大多数预计不会完全组织起来,如日志或社交媒体提要,因此没有数据集市的等效概念。

无论如何,为数据湖提供某种组织也是有用的,但如何做取决于您。一个简单的方法,但可能不是那么有用,是源代码。 IE。所有日志都在一个地方,so.me。喂另一个等等。

数据湖的一个非常有用的概念是能够知道那里有什么以及它是如何命名的,因此数据字典对于查找和理解信息都非常有用。

【讨论】:

以上是关于如果 datamart 是 datawarehouse 的逻辑划分,那么它在 datalake 中对应的是啥?的主要内容,如果未能解决你的问题,请参考以下文章

Datamart vs.reporting Cube,有啥区别?

调整SQL Server中的大型查询

解析导入 sqoop 的参数时出错

技术大数据时代,传统数据仓库技术是否已经过时?

数据仓库中事实表的复合索引 - 数据集市

来自多个表的oracle数据