java 读写操作大文件 BufferedReader和RandomAccessFile

Posted lgp20151222

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java 读写操作大文件 BufferedReader和RandomAccessFile相关的知识,希望对你有一定的参考价值。

老问这问题,两个都答出来算加分项?

 

具体代码如下,没什么好说的直接说对比。

 

BufferedReader和RandomAccessFile的区别
RandomAccessFile 在数据越大,性能越差。因为他是数据文件的一个channel,支持读改原数据文件。

BufferedReader是读改数据文件的一个在内存的副本。

 

那RandomAccessFile的优点?

1.RandomAccessFile忽略了字符编码的处理,加快了处理速度

2.若是对数据操作在BufferedReader创立buffer的时候就做完了,RandomAccessFile自然就快了。

 

ps.

小文件RandomAccessFile,大文件BufferedReader

按行生成文件和按大小生成文件都实现了

BufferedReader提供处理字符编码的方式,使用InputStreamReader或者DataInputStream之类的。

    private static void fileRead() throws IOException {
        long time = System.currentTimeMillis();

        int bufSize = 10 * 1024 * 1024;
        byte[] bs = new byte[bufSize];
        ByteBuffer byteBuf = ByteBuffer.allocate(bufSize);
        FileChannel channel = new RandomAccessFile(input_path, "r").getChannel();
        FileWriter fw = null;
        for (int i = 0; channel.read(byteBuf) != -1; i++) {
            byteBuf.rewind();
            int size = byteBuf.limit();
            byteBuf.get(bs);

            fw = new FileWriter(String.format(output_path_format1, i));
            String line = new String(bs, 0, size);
            fw.append(line + System.getProperty("line.separator"));
            fw.flush();
            byteBuf.clear();
        }
        fw.close();
        time = System.currentTimeMillis() - time;
        System.out.println("file read time = " + time);
    }

    private static void bufferRead() throws IOException {
        long time = System.currentTimeMillis();
        BufferedInputStream bis = new BufferedInputStream(new FileInputStream(new File(input_path)));

        int bufferSize = 10 * 1024 * 1024;
        BufferedReader in = new BufferedReader(new InputStreamReader(bis, "utf-8"), bufferSize);
        FileWriter fw = new FileWriter(String.format(output_path_format2, 0));

        for (int i = 0; in.ready(); i++) {
            if (i % 100 == 0) {
                fw = new FileWriter(String.format(output_path_format2, i / 100));
            }
            String line = in.readLine();
            fw.append(line + System.getProperty("line.separator"));
            if (i % 100 == 0) {
                fw.flush();
            }
        }
        in.close();
        fw.close();
        time = System.currentTimeMillis() - time;
        System.out.println("buffer read time = " + time);
    }

 

这是生成大文件的代码,修改for循环次数控制文件大小,下面生成的文件大小是2G左右

    private static String input_path = System.getProperty("user.dir") + File.separator + "data" + File.separator + "bigdata.txt";
    private static String output_path_format1 = System.getProperty("user.dir") + File.separator + "data" + File.separator + "part_1_%s.txt";
    private static String output_path_format2 = System.getProperty("user.dir") + File.separator + "data" + File.separator + "part_2_%s.txt";
    private static  int bufSize = 10 * 1024 * 1024;

     private static void makeBigData() throws IOException {
        FileWriter fw = new FileWriter(input_path);
        String line = "start ";
        for (int i = 0; i < 20000; i++) {
            line += i;
            fw.append(line + System.getProperty("line.separator"));
        }
        fw.flush();
        fw.close();
        System.out.println("end");
    }

 

因为是自己琢磨的,总感觉写的有点丑,特别是生成大文件那里,希望各位指正一番。

源码地址 https://github.com/247292980/spring-boot 。fork的比star还多什么道理啊。

 


以上是关于java 读写操作大文件 BufferedReader和RandomAccessFile的主要内容,如果未能解决你的问题,请参考以下文章

Java操作HDFS分布式文件存储?我来教你Java可视化操作大数据分析!

NIOMappedByteBuffer-内存映射文件 I/O

#私藏项目实操分享#Java深层系列「技术盲区」让我们一起去挑战一下如何读取一个较大或者超大的文件数据!

jdbc mysql crud dao模型 sql注入漏洞 jdbc 操作大文件

PHP 操作大对象 数组如何节省内存

hibernate操作大文本字段Blob和Clob