Hadoop Join

Posted linkworld

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop Join相关的知识,希望对你有一定的参考价值。

1. Reduce Join工作原理

  • Map端的主要工作:为来自不同表或文件的key/value对,打标签以区别不同来源的记录。然后用连接字段作为key,其余部分和新加的标志作为value,最后进行输出。

2. Map Join

  • 使用场景:适用于一张表十分小,一张表很大的场景;
  • 在 Map 端缓存多张表,提前处理业务逻辑,这样增加Map端业务,减少Reduce端数据的压力,尽可能减少数据倾斜;

以上是关于Hadoop Join的主要内容,如果未能解决你的问题,请参考以下文章

hadoop 配置文件放到哪里

hadoop2 环境的搭建(自动HA)

Hadoop高手之路3-Hadoop集群搭建

Hadoop可以用来做啥

hadoop是啥 hadoop介绍

学习笔记Hadoop—— Hadoop集群的安装与部署—— Hadoop配置参数介绍Hadoop集群启动与监控