Hadoop 与 NoSQL 数据库

Posted

技术标签:

【中文标题】Hadoop 与 NoSQL 数据库【英文标题】:Hadoop vs. NoSQL-Databases 【发布时间】:2014-07-31 12:40:53 【问题描述】:

由于我是大数据和相关技术的新手,我的问题是,正如标题所示:

什么时候会使用 Hadoop,什么时候会使用某种 NoSQL 数据库来存储和分析海量数据?

我知道 Hadoop 是一个框架,而 Hadoop 和 NoSQL 是不同的。 但是您可以使用 HDFS 上的 Hadoop 以及 MongoDB、Neo4j 等 NoSQL-DB 保存大量数据...

因此,Hadoop 或 NoSQL 数据库的使用可能取决于您是只想分析数据还是只想存储数据? 或者仅仅是 HDFS 可以保存 RAW 数据,而 NoSQL-DB 更结构化(比原始数据更结构化,比 RDBMS 更少结构化)?

【问题讨论】:

【参考方案1】:

Hadoop 在一个完整的框架中,其中一个组件可以是 NOSQL。 Hadoop 通常是指协同工作以分析数据的系统集群。您可以从 NOSQL 获取数据并使用 Hadoop 并行处理它们。

HBase 是一种 NOSQL,它是 Hadoop 生态系统的一部分。您也可以使用其他不同的 NOSQL。

【讨论】:

【参考方案2】:

您的问题误导您将作为框架的 Hadoop 与数据库进行比较... Hadoop 包含许多功能(包括名为 HBase 的 NoSQL 数据库),以便为您提供大数据环境。如果您有大量数据,您可能会使用 Hadoop(用于 MapReduce 功能或数据仓库功能),但不确定,这取决于您正在处理的内容以及您希望如何处理它。如果您只是存储大量数据并且不需要其他功能(批处理数据处理或数据转换......),那么一个简单的 NoSQL 数据库就足够了。

【讨论】:

以上是关于Hadoop 与 NoSQL 数据库的主要内容,如果未能解决你的问题,请参考以下文章

大数据入门级学习:SQL与NOSQL数据库

持久化实体 nosql (hadoop/hbase/hive)

Hadoop-Hive

大数据时代,我们需要有超越 Hadoop和MapReduce的杀手级技术

数据分析≠Hadoop+NoSQL,不妨先看完善现有技术的10条捷径

Hadoop 视频教程 大数据 高性能 集群 NoSQL 实战 权威 入门 安装