2.9 MRJob编写和运行MapReduce

Posted 炫云云

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2.9 MRJob编写和运行MapReduce相关的知识,希望对你有一定的参考价值。

文章目录

mrjob

mrjob 简介

  • 使用python开发在Hadoop上运行的程序, mrjob是最简单的方式
  • mrjob程序可以在本地测试运行也可以部署到Hadoop集群上运行
  • 如果不想成为hadoop专家, 但是需要利用Hadoop写MapReduce代码,mrJob是很好的选择

mrjob 安装

  • 使用pip安装
    • pip install mrjob

mrjob实现WordCount

from mrjob.job import MRJob

以上是关于2.9 MRJob编写和运行MapReduce的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop学习笔记:使用Mrjob框架编写MapReduce

MapReduce 作业(用 python 编写)在 EMR 上运行缓慢

MRJob 极速入门,Python玩转Hadoop你会么?

python 用mrjob在python中做mapreduce

Python mrjob mapreduce如何预处理输入文件

2.10 MapReduce文件合并