Todo转载全栈工程师-Hadoop, HBase, Hive, Spark

Posted 笨鸟居士的博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Todo转载全栈工程师-Hadoop, HBase, Hive, Spark相关的知识,希望对你有一定的参考价值。

学习参考这篇文章:

http://www.shareditor.com/blogshow/?blogId=96

机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统,

hadoop用于分布式存储和map-reduce计算,

spark用于分布式机器学习,

hive是分布式数据库,

hbase是分布式kv系统,

看似互不相关的他们却都是基于相同的hdfs存储和yarn资源管理,

本文通过全套部署方法来让大家深入系统内部以充分理解分布式系统架构和他们之间的关系。

以上是关于Todo转载全栈工程师-Hadoop, HBase, Hive, Spark的主要内容,如果未能解决你的问题,请参考以下文章

《Web全栈工程师的自我修养》读书笔记(转载)

转载全栈工程师系列

hbase实战 hbase权威指南哪本好书

HBase大数据工程师

Hadoop之——HBASE结合MapReduce批量导入数据

从零自学Hadoop(20):HBase数据模型相关操作上