2.10 MapReduce文件合并
Posted 炫云云
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2.10 MapReduce文件合并相关的知识,希望对你有一定的参考价值。
文章目录
MRJOB 文件合并
需求描述
- 两个文件合并 类似于数据库中的两张表合并
uid uname
01 user1
02 user2
03 user3
uid orderid order_price
01 01 80
01 02 90
02 03 82
02 04 95
mrjob 实现
实现对两个数据表进行join操作,显示效果为每个用户的所有订单信息
"01:user1" "01:80,02:90"
"02:user2" "03:82,04:95"
from mrjob
以上是关于2.10 MapReduce文件合并的主要内容,如果未能解决你的问题,请参考以下文章
hadoop mapreduce开发实践文件合并(join)
实验5 MapReduce初级编程实践——编程实现文件合并和去重操作