Hadoop java编程中的文件明智处理

Posted

技术标签:

【中文标题】Hadoop java编程中的文件明智处理【英文标题】:File wise processing in Hadoop java programming 【发布时间】:2013-09-10 15:06:09 【问题描述】:

我是 Hadoop 新手。我已经安装了 hadoop,并且能够编译和运行字数统计示例。

我需要一些关于如何进行文件操作的信息。

我有一些数据文件(a.txt、b.txt、.....),其中每个文件都有 100 行带有时间戳和读数的行。我想处理这些并为每个文件赋予价值(a- 10,b-15,....)。

主要问题是数据行的顺序对于处理很重要。

谢谢。

【问题讨论】:

看看 MapReduce 教程,例如developer.yahoo.com/hadoop/tutorial/module4.html. 【参考方案1】:

如果你想在自己的mapper中读取每个文件,可以试试WholeFileInputFormat

【讨论】:

以上是关于Hadoop java编程中的文件明智处理的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop文件存储系统-HDFS详解以及java编程实现

java调用Hadoop的jar

使用java API如何获取给定路径的HDF文件结构

hadoop12---?java并发编程的一些总结

java并发编程(10)Fork/Join

大数据学习---Hadoop的深入学习