HADOOP生态圈以及各组成部分的简介
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HADOOP生态圈以及各组成部分的简介相关的知识,希望对你有一定的参考价值。
重点组件:
HDFS:分布式文件系统
MAPREDUCE:分布式运算程序开发框架
Hive:基于大数据技术(文件系统+运算框架)的SQL数据仓库工具
ZOOKEEPER:分布式协调服务基础组件
Mahout:基于mapreduce/Spark/flink等分布式运算框架的机器学习算法库
Oozie:工作流调度框架
Sqoop:数据导入导出工具
Flume:日志数据采集框架
以上是关于HADOOP生态圈以及各组成部分的简介的主要内容,如果未能解决你的问题,请参考以下文章
大数据开发基础入门与项目实战Hadoop核心及生态圈技术栈之1.Hadoop简介及Apache Hadoop完全分布式集群搭建