数据仓库和数据集市的区别

Posted 田野与天

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据仓库和数据集市的区别相关的知识,希望对你有一定的参考价值。

 见过很多人搞不清楚数据仓库和数据集市的区别,下面是我见过的最好的关于“什么是数据仓库”的回答:

  “数据仓库是一种关系数据库模式,其中保存了来自一个或者多个源数据库的历史数据和元数据。数据仓库的目的是便于将数据的报告和分析汇总到多个层次。”

或者更简单点:

  “一个存放企业各个领域的数据的单独且有组织的库。”

典型的数据仓库有以下的一些特点:

  ~~涉及多个主题域

  ~~有十分详细的信息

  ~~集合来自不同数据源的数据

  ~~不一定使用维模型,但提供维模型

另一方面,数据集市(Data Mart)是数据仓库的一个访问层,用于从数据仓库抽取相关的数据给用户,数据集市是数据仓库的一个子集,通常面向特定的业务线或者团队(财政部门有他们自己的数据集市,市场部门有他们自己的数据集市,销售部门有他们自己的数据集市等等)。

 

根据Inmon学院对数据仓库的定义,一个独立的数据集市是更大的数据仓库的一个逻辑子集或物理子集,通常是相互独立的,因为数据模式和模型彼此之间不相同。微软提出的Tabular模型则使得你可以直接从数据仓库抽取数据而无需从数据集市抽取数据。

 

所以,简单地说,我认为数据仓库包含多个主题域,数据集市仅仅是多个主题域中的一个。

 

以上是关于数据仓库和数据集市的区别的主要内容,如果未能解决你的问题,请参考以下文章

数据仓库DM DW OLAP之间的联系与区别

一文读懂数据仓库数据集市数据库的区别与关联

分析工具9-企业的数据仓库和数据集市-企业数据架构的演进

独家 | 一文盘点数据集市和数据仓库的差异(附链接)

数据仓库数据集市数据湖数据中台到底有什么区别?

数据仓库,数据集市建模