数据仓库和Hadoop大数据平台有什么差别?

Posted jingluodashu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据仓库和Hadoop大数据平台有什么差别?相关的知识,希望对你有一定的参考价值。

 

广义上来说,Hadoop大数据平台也可以看做是新一代的数据仓库系统, 它也具有很多现代数据仓库的特征,也被企业所广泛使用。因为MPP架构的可扩展性,基于MPP的数据仓库系统有时候也被划分到大数据平台类产品。

但是数据仓库和Hadoop平台还是有很多显著的不同。针对不同的使用场景其发挥的作用和给用户带来的体验也不经相同。用户可以根据下表简单判断什么场景更适合用什么样的产品。

 数据仓库和Hadoop大数据平台特性比较

特性

Hadoop

Data Warehouse

计算节点数

可到数千个

一般在128个以内

数据量

支持大于10PB

一般不大于5PB

数据类型

关系型,半关系型,无结构化,语音,图像,视频

关系型

时延

中/高

应用生态

创新型/人工智能

传统数据库型/BI类

应用开发接口

SQL,MR,丰富的编程语言接口

标准数据库SQL

可扩展性

无穷的可能,完整的编程接口

有限扩展能力,主要通过UDF支持

事务支持

有限

完整

数据仓库和Hadoop平台互为补充,立足于满足客户在不同使用场景下的业务需求。公有云数据仓库服务DWS能够无缝地接入到公有云Hadoop平台MRS服务上,支持SQL-over-Hadoop的这个特性,提供跨平台, 跨服务的数据共享。让用户在充分享受Hadoop带来的开放,便捷,创新的同时,继续使用熟悉的数据(仓)库方式管理和使用自己的海量数据。继续使用传统的数据仓库的上层应用,特别是商业智能BI类的应用。

以上是关于数据仓库和Hadoop大数据平台有什么差别?的主要内容,如果未能解决你的问题,请参考以下文章

如何搭建基于Hadoop的大数据平台

星环助力恒丰银行打造基于hadoop大数据的数据仓库平台

ambari 搭建hadoop大数据平台系列3-搭建本地仓库

大数据与Hadoop之间是啥关系

hadoop是啥意思?与大数据有啥关系?

大数据开发工程师是做什么的?岗位要求高吗?