"数据库" vs. "数据仓库": 区别与联系
Posted 智慧的流动
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了"数据库" vs. "数据仓库": 区别与联系相关的知识,希望对你有一定的参考价值。
(本文约500字,预计阅读时间1-2分钟)
在大数据时代,数据仓库(data warehouse) 是很常见的概念。但它和数据库(database)的关系是什么?笔者阅读了一些相关资料,小结如下。还请高手多指正:
1.前者偏重数据的业务处理(transaction),后者着重于分析,可能会重点面向某个行业;所以数据库一般和OLTP(Online transaction processing)相联系,数据仓库一般和OLAP(Online analytical processing)相联系。
2.所以数据仓库又被称为“分析型数据库”(相对于“业务型数据库“而言)。它的数据结构有利于查询和分析的便利。数据库常采用行式存储,而数据仓库常采用列式存储。
3.前者的用户数量大(主要是业务人员),既要执行“读”操作也要执行“写”操作,每次写的量不大,但是对时间不敏感。/ 后者的用户数量小(主要是决策人员),一般只需要执行读操作,每次读取的数据量很大,对反应时间不那么敏感。
4.把所需要的数据从业务型数据库导入分析型数据仓库的过程,称为ETL(Extract-Transform-Load,“抽取-转换-加载”)。
5.有人认为:数据仓库是一种结构体系,而数据库是一种具体技术。
6.数据库用到的工具主要有mysql, Oracle, MS SQLServer等,数据仓库用到的工具主要有Hive, AWSRedshift, Green Plum, SAP HANA等。
顺便想到O'Reilly推荐的“数据从业者技能路线图”:在上表中,每一行都是一种可能的数据技能发展路径。如果你已经学了某种技能,你可以按照箭头顺序继续学习下一种技能。
参考资料:
《数据库与数据仓库的本质区别是什么?》- 知乎.
JohnKing & Roger Magoulas,《2016 Data Science Salary Survey》 - O'Reilly.
以上是关于"数据库" vs. "数据仓库": 区别与联系的主要内容,如果未能解决你的问题,请参考以下文章
无法使用 $.ajax( type: "POST", using VS2017 C# 将数据从 aspx 文件发送到代码后面
"setTimeout" VS "debounce" 插件 - 延迟事件的代码执行
Java boolean getter "is" vs "are"
WPF:RenderOptions.EdgeMode="Unspecified" vs "Alias" 用本地设置覆盖全局设置