"数据库" vs. "数据仓库": 区别与联系

Posted 智慧的流动

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了"数据库" vs. "数据仓库": 区别与联系相关的知识,希望对你有一定的参考价值。

(本文约500字,预计阅读时间1-2分钟)

 

在大数据时代,数据仓库(data warehouse) 是很常见的概念。但它和数据库(database)的关系是什么?笔者阅读了一些相关资料,小结如下。还请高手多指正:

 

1.前者偏重数据的业务处理(transaction),后者着重于分析,可能会重点面向某个行业;所以数据库一般和OLTPOnline transaction processing)相联系,数据仓库一般和OLAPOnline analytical processing)相联系。

 

2.所以数据仓库又被称为分析型数据库(相对于业务型数据库“而言)。它的数据结构有利于查询和分析的便利。数据库常采用行式存储,而数据仓库常采用列式存储。


3.前者的用户数量大(主要是业务人员),既要执行操作也要执行操作,每次写的量不大,但是对时间不敏感。/ 后者的用户数量小(主要是决策人员),一般只需要执行读操作,每次读取的数据量很大,对反应时间不那么敏感。

 

4.把所需要的数据从业务型数据库导入分析型数据仓库的过程,称为ETLExtract-Transform-Load,“抽取-转换-加载”)。

 

5.有人认为:数据仓库是一种结构体系,而数据库是一种具体技术。

 

6.数据库用到的工具主要有mysql, Oracle, MS SQLServer等,数据仓库用到的工具主要有Hive, AWSRedshift, Green Plum, SAP HANA等。

 




顺便想到O'Reilly推荐的“数据从业者技能路线图”:在上表中,每一行都是一种可能的数据技能发展路径。如果你已经学了某种技能,你可以按照箭头顺序继续学习下一种技能。

 


参考资料:

  1. 数据库与数据仓库的本质区别是什么?- 知乎.

  2. JohnKing & Roger Magoulas,2016 Data Science Salary Survey - O'Reilly.

 



以上是关于"数据库" vs. "数据仓库": 区别与联系的主要内容,如果未能解决你的问题,请参考以下文章

无法使用 $.ajax( type: "POST", using VS2017 C# 将数据从 aspx 文件发送到代码后面

"setTimeout" VS "debounce" 插件 - 延迟事件的代码执行

vs2005的注释问题

Java boolean getter "is" vs "are"

"and not" vs "or" t sql全文搜索

WPF:RenderOptions.EdgeMode="Unspecified" vs "Alias" 用本地设置覆盖全局设置