java 读写操作大文件 BufferedReader和RandomAccessFile
Posted lgp20151222
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java 读写操作大文件 BufferedReader和RandomAccessFile相关的知识,希望对你有一定的参考价值。
一
老问这问题,两个都答出来算加分项?
二
具体代码如下,没什么好说的直接说对比。
BufferedReader和RandomAccessFile的区别
RandomAccessFile 在数据越大,性能越差。因为他是数据文件的一个channel,支持读改原数据文件。
BufferedReader是读改数据文件的一个在内存的副本。
那RandomAccessFile的优点?
1.RandomAccessFile忽略了字符编码的处理,加快了处理速度
2.若是对数据操作在BufferedReader创立buffer的时候就做完了,RandomAccessFile自然就快了。
ps.
小文件RandomAccessFile,大文件BufferedReader
按行生成文件和按大小生成文件都实现了
BufferedReader提供处理字符编码的方式,使用InputStreamReader或者DataInputStream之类的。
private static void fileRead() throws IOException { long time = System.currentTimeMillis(); int bufSize = 10 * 1024 * 1024; byte[] bs = new byte[bufSize]; ByteBuffer byteBuf = ByteBuffer.allocate(bufSize); FileChannel channel = new RandomAccessFile(input_path, "r").getChannel(); FileWriter fw = null; for (int i = 0; channel.read(byteBuf) != -1; i++) { byteBuf.rewind(); int size = byteBuf.limit(); byteBuf.get(bs); fw = new FileWriter(String.format(output_path_format1, i)); String line = new String(bs, 0, size); fw.append(line + System.getProperty("line.separator")); fw.flush(); byteBuf.clear(); } fw.close(); time = System.currentTimeMillis() - time; System.out.println("file read time = " + time); } private static void bufferRead() throws IOException { long time = System.currentTimeMillis(); BufferedInputStream bis = new BufferedInputStream(new FileInputStream(new File(input_path))); int bufferSize = 10 * 1024 * 1024; BufferedReader in = new BufferedReader(new InputStreamReader(bis, "utf-8"), bufferSize); FileWriter fw = new FileWriter(String.format(output_path_format2, 0)); for (int i = 0; in.ready(); i++) { if (i % 100 == 0) { fw = new FileWriter(String.format(output_path_format2, i / 100)); } String line = in.readLine(); fw.append(line + System.getProperty("line.separator")); if (i % 100 == 0) { fw.flush(); } } in.close(); fw.close(); time = System.currentTimeMillis() - time; System.out.println("buffer read time = " + time); }
这是生成大文件的代码,修改for循环次数控制文件大小,下面生成的文件大小是2G左右
private static String input_path = System.getProperty("user.dir") + File.separator + "data" + File.separator + "bigdata.txt"; private static String output_path_format1 = System.getProperty("user.dir") + File.separator + "data" + File.separator + "part_1_%s.txt"; private static String output_path_format2 = System.getProperty("user.dir") + File.separator + "data" + File.separator + "part_2_%s.txt"; private static int bufSize = 10 * 1024 * 1024; private static void makeBigData() throws IOException { FileWriter fw = new FileWriter(input_path); String line = "start "; for (int i = 0; i < 20000; i++) { line += i; fw.append(line + System.getProperty("line.separator")); } fw.flush(); fw.close(); System.out.println("end"); }
三
因为是自己琢磨的,总感觉写的有点丑,特别是生成大文件那里,希望各位指正一番。
源码地址 https://github.com/247292980/spring-boot 。fork的比star还多什么道理啊。
以上是关于java 读写操作大文件 BufferedReader和RandomAccessFile的主要内容,如果未能解决你的问题,请参考以下文章
Java操作HDFS分布式文件存储?我来教你Java可视化操作大数据分析!
NIOMappedByteBuffer-内存映射文件 I/O
#私藏项目实操分享#Java深层系列「技术盲区」让我们一起去挑战一下如何读取一个较大或者超大的文件数据!