在idea上运行hadoop程序
Posted multiangle
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在idea上运行hadoop程序相关的知识,希望对你有一定的参考价值。
本文的内容是如何让idea读取hdfs中的文件。
在开始前,我默认各位看官已经装好了hadoop。如果还没有安装hadoop,可以看这篇文章:linux下命令行安装hadoop2.7.2过程
首先要将文本文件从本地移到hdfs中
$hadoop fs -mkdir /tmp
$hadoop fs -copyFromLocal /home/multiangle/download/280.txt /tmp/280.txt
其中/home/multiangle/download/280.txt
为本地文件地址,内容是《斗破苍穹》(笑)。/tmp/280.txt
是hdfs中的地址。指令执行结果如下
我这边因为之前已经拷过一次,所以显示文件已经存在了。
建立工程,写代码
建立一个hadoop_test工程,新建一个file_sys_test文件,往其中拷入
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URI;
/**
* Created by multiangle on 16-10-31.
*/
public class file_sys_test
public static void main(String[] args)throws IOException
InputStream is = null ;
String addr = "hdfs://localhost:9000/tmp/280.txt" ;
Configuration conf = new Configuration() ;
FileSystem fs = FileSystem.get(URI.create(addr),conf) ;
try
is = fs.open(new Path(addr)) ;
InputStreamReader isr = new InputStreamReader(is,"gbk") ;
BufferedReader br = new BufferedReader(isr) ;
String line = br.readLine() ;
while (line!=null)
System.out.println(line);
line = br.readLine() ;
finally
IOUtils.closeStream(is) ;
设置各项参数
首先点击File->Project Structure, 在左侧找到modules,点击右边的绿色小十字->Jar or directories,
将$HADOOP_INSTALL/share/hadoop下的若干目录添加进来,如下图所示
再在Project Setting下找到 Artifacts选项,将Build on make选项勾上,再点中间的绿色小十字->module output
然后再菜单栏中找到Run->Edit Configuration, 再左边找到绿色小十字->Application, 在Main class中输入org.apache.hadoop.util.RunJar, 在program arguments中填入之前module output的jar包地址,还有包名.类名。如果没有包,则直接填类名。如下图所示
现在就能运行起来了
以上是关于在idea上运行hadoop程序的主要内容,如果未能解决你的问题,请参考以下文章
爬坑在 IDEA 中运行 Hadoop 程序 报 winutils.exe 不存在错误解决方案
IDEA maven打jar包在linux hadoop集群上运行