Hadoop生态圈介绍

Posted 月疯

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop生态圈介绍相关的知识,希望对你有一定的参考价值。

hadoop生态:
1、hadoop的核心组件:
(hdfs)分布式存储、(mapReduce)分布式计算、(Yarn)资源调度与任务管理、Common
2、Lucene:索引检索工具包
3、Nutch:开源的搜索引擎
4、HBase/Cassandra:基于google的BigTable开源的列式存储的非关系型数据库
5、Hive:基于SQL的分布式计算引擎,同时是一个数据仓库
6、Thrift/Avro:Rpc框架,用户网络通讯
7、BigTop:项目测试、打包、部署
8、Oozie(乌贼)/Azakban:大数据的工作流框架
9、Chukwa/Scribe/Flume:数据收集框架
10、Whirr:部署为云服务的类库
11、sqoop:数据迁移的工具
12、Zookper:分布式协调框架
13、HAMA:图计算框架
14、solr:索引服务器
15、Pig:基于Pig Latin脚本的计算引擎
16、Mahout:机器学习框架 

以上是关于Hadoop生态圈介绍的主要内容,如果未能解决你的问题,请参考以下文章

大数据Hadoop生态圈介绍

Hadoop生态圈介绍

hadoop生态圈面试精华之HDFS部分

hadoop生态圈的详解

基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化

Hadoop生态圈中的调度组件-YARN