2.9 MRJob编写和运行MapReduce
Posted 炫云云
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2.9 MRJob编写和运行MapReduce相关的知识,希望对你有一定的参考价值。
文章目录
mrjob
mrjob 简介
- 使用python开发在Hadoop上运行的程序, mrjob是最简单的方式
- mrjob程序可以在本地测试运行也可以部署到Hadoop集群上运行
- 如果不想成为hadoop专家, 但是需要利用Hadoop写MapReduce代码,mrJob是很好的选择
mrjob 安装
- 使用pip安装
- pip install mrjob
mrjob实现WordCount
from mrjob.job import MRJob
以上是关于2.9 MRJob编写和运行MapReduce的主要内容,如果未能解决你的问题,请参考以下文章
Hadoop学习笔记:使用Mrjob框架编写MapReduce
MapReduce 作业(用 python 编写)在 EMR 上运行缓慢
python 用mrjob在python中做mapreduce