在idea上运行hadoop程序

Posted multiangle

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在idea上运行hadoop程序相关的知识,希望对你有一定的参考价值。


本文的内容是如何让idea读取hdfs中的文件。
在开始前,我默认各位看官已经装好了hadoop。如果还没有安装hadoop,可以看这篇文章:linux下命令行安装hadoop2.7.2过程


首先要将文本文件从本地移到hdfs中

$hadoop fs -mkdir /tmp
$hadoop fs -copyFromLocal /home/multiangle/download/280.txt /tmp/280.txt

其中/home/multiangle/download/280.txt为本地文件地址,内容是《斗破苍穹》(笑)。/tmp/280.txt是hdfs中的地址。指令执行结果如下

我这边因为之前已经拷过一次,所以显示文件已经存在了。


建立工程,写代码
建立一个hadoop_test工程,新建一个file_sys_test文件,往其中拷入


import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URI;

/**
 * Created by multiangle on 16-10-31.
 */


public class file_sys_test 

    public static void main(String[] args)throws IOException
        InputStream is = null ;
        String addr = "hdfs://localhost:9000/tmp/280.txt" ;
        Configuration conf = new Configuration() ;
        FileSystem fs = FileSystem.get(URI.create(addr),conf) ;
        try
            is = fs.open(new Path(addr)) ;
            InputStreamReader isr = new InputStreamReader(is,"gbk") ;
            BufferedReader br = new BufferedReader(isr) ;
            String line = br.readLine() ;
            while (line!=null)
                System.out.println(line);
                line = br.readLine() ;
            
         finally 
            IOUtils.closeStream(is) ;
        

    


设置各项参数
首先点击File->Project Structure, 在左侧找到modules,点击右边的绿色小十字->Jar or directories,
将$HADOOP_INSTALL/share/hadoop下的若干目录添加进来,如下图所示

再在Project Setting下找到 Artifacts选项,将Build on make选项勾上,再点中间的绿色小十字->module output

然后再菜单栏中找到Run->Edit Configuration, 再左边找到绿色小十字->Application, 在Main class中输入org.apache.hadoop.util.RunJar, 在program arguments中填入之前module output的jar包地址,还有包名.类名。如果没有包,则直接填类名。如下图所示


现在就能运行起来了

以上是关于在idea上运行hadoop程序的主要内容,如果未能解决你的问题,请参考以下文章

爬坑在 IDEA 中运行 Hadoop 程序 报 winutils.exe 不存在错误解决方案

hadoop的idea依赖包怎么下载

IDEA maven打jar包在linux hadoop集群上运行

使用idea在windows上连接远程hadoop开发

「hadoop」idea gradle hadoop 运行helloworld示例

6.4hadoop idea本地运行器测试