Java IO流字节流和字符流详解

Posted 2020-10-06

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Java IO流字节流和字符流详解相关的知识，希望对你有一定的参考价值。

字节流和字符流

对于文件必然有读和写的操作，读和写就对应了输入和输出流，流又分成字节和字符流。

1.从对文件的操作来讲，有读和写的操作——也就是输入和输出。

2.从流的流向来讲，有输入和输出之分。

3.从流的内容来讲，有字节和字符之分。

这篇文章先后讲解IO流中的字节流和字符流的输入和输出操作。

一、字节流

1）输入和输出流

首先，字节流要进行读和写，也就是输入和输出，所以它有两个抽象的父类InputStream、OutputStream。

InputStream抽象了应用程序读取数据的方式，即输入流。
OutputStream抽象了应用程序写出数据的方式，即输出流。

2）读写结束

在字节流中当读写结束，达到文件结尾时，称为EOF = End或者读到-1就读到结尾。

3）输入流基本方法

首先我们要清楚输入流是什么。比如通过我们的键盘在文本文件上输入内容，这个过程键盘充当的就是输入流，而不是输出流。因为键盘的功能是将内容输入到系统，系统再写入到文件上。以下是输入流的基本方法read()：

 int b = in.read(); //读取一个字节无符号填充到int低八位。-1是EOF。
 in.read(byte[] buf); //读取数据填充到字节数组buf中。返回的是读到的字节个数。
 in.read(byte[] buf,int start, int size)//读取数据到字节数组buf从buf的start位置开始存放size长度分数据

其中in是InputStream抽象类的实例，可以发现这个方法和RandomAccessFile类中的read()方法差不多，因为两者都是通过字节来读取的。

4）输出流基本方法

输出流是进行写的操作,其基本操作方法是write()，可以将此方法与输入read()方法一一去对应，更好理解。

1 out.write(int b)//写出一个byte到流，b的低8位
2 out.write(byte[] buf)//将buf字节数组都写到流
3 out.write(byte[] buf, int start,int size) //字节数组buf从start位置开始写size长度的字节到流

了解了InputStream、OutputStream的基本操作方法后，再来看看它们两个的“孩子”FileInputStream和FileOutputStream。

这两个子类具体实现了在文件上读取和写入数据的操作，日程编程中更多的是使用这两个类。

二、FileInputStream和FileOutputStream类的使用

-----------------FileInputStream类的使用

1.使用read()方法读取文件

 1 /**
 2      * 读取指定文件内容,按照16进制输出到控制台
 3      * 并且每输出10个byte换行
 4      * @throws FileNotFoundException 
 5      */
 6     public static void printHex(String fileName) throws IOException{
 7         //把文件作为字节流进行读操作
 8         FileInputStream in=new FileInputStream(fileName);
 9         int b;
10         int count=0;//计数读到的个数
11         while((b=in.read())!=-1){
12             if(b<=0xf){
13                 //单位数前面补0
14                 System.out.println("0");
15             }
16             System.out.print(Integer.toHexString(b& 0xff)+" ");
17             if(++count%10==0){
18                 System.out.println();
19             }
20         }
21         in.close();//一定要关闭流
22     }

运行结果（随便一个文件来测试的）：

技术分享

注意：

FileInputStream()构造函数可以通过文件名（String）也可以通过File对象。上面的案例是使用文件名来构造的。
(b=in.read())!=-1 通过读到-1来判断是否读到文件结尾。
in.close() 使用完IO流的对象一定要关闭流，养成好习惯很重要。

2.使用read(byte[] buf,int start, int size)方法读取文件

上述方法只能一个一个字节读取，对于较大的文件效率太低，推荐使用这个方法来一次性读取文件。

 1 public static void printHexByBytes(String fileName) throws IOException{
 2         FileInputStream in=new FileInputStream(fileName);
 3         byte[] buf=new byte[20*1024];//开辟一个20k大小的字节数组
 4         /*
 5          * 从in中批量读取字节，放入到buf这个字节数组中
 6          * 从第0个位置开始放，最多放buf.length个
 7          * 返回的是读到的字节个数
 8          */
 9         //一次性读完的情况
10         int count=in.read(buf, 0, buf.length);
11         int j=1;
12         for(int i=0;i<count;i++){
13             if((buf[i]&0xff)<=0xf){
14                 //单位数前面补0
15                 System.out.print("0");
16             }
17             System.out.print(Integer.toHexString(buf[i]&0xff)+ " ");
18             if(j++%10==0){
19                 System.out.println();
20             }
21         }
22              in.close();
23     }
24 }

read(byte[] buf,int start, int size)返回的是读到的字节个数，即buf字节数组的有效长度，所以输出buf数组时用的长度是count而不是buf.length，因为我们不知道文件大小和数组大小的关系，上述方法适用于文件大小不超过数组大小的情况下，一次性把文件内容读取到数组里，这里就有一个问题了，如果文件大小超过数组大小，那又该如何读取才能把文件全部读完呢？？

我们知道读到-1就是读到文件末，所以还是利用while循环重复读取直到读到-1结束循环，把上述代码修改后如下：

 1     public static void printHexByBytes(String fileName) throws IOException{
 2         FileInputStream in=new FileInputStream(fileName);
 3         byte[] buf=new byte[20*1024];//开辟一个20k大小的字节数组
 4         /*
 5          * 从in中批量读取字节，放入到buf这个字节数组中
 6          * 从第0个位置开始放，最多放buf.length个
 7          * 返回的是读到的字节个数
 8          */
 9         int j=1;
10         //一个字节数组读不完的情况，用while循环重复利用此数组直到读到文件末=-1
11         int b=0;
12         while((b=in.read(buf, 0, buf.length))!=-1){
13             for(int i=0;i<b;i++){
14                 if((buf[i]&0xff)<=0xf){
15                     //单位数前面补0
16                     System.out.print("0");
17                 }
18                 System.out.print(Integer.toHexString(buf[i]&0xff)+ " ");
19                 if(j++%10==0){
20                     System.out.println();
21                 }
22             }
23         }
24         in.close();
25     }
26 }

好了，我们用一个大于数组的文件来测试一下结果（太长，只截图末尾）：

技术分享

大家可以比较两者的不同，第二种优化后更适合日常的使用，因为无论文件大小我们都可以一次性直接读完。

-----------------FileOutputStream类的使用

FileOutputStream类和FileInputStream类的使用相类似，它实现了向文件中写出btye数据的方法。里面的一些细节跟FileInputStream差不多的我就不提了，大家自己可以理解的。

1.构造方法

FileOutputStream类构造时根据不同的情况可以使用不同的方法构造，如：

1 //如果该文件不存在，则直接创建，如果存在，删除后创建
2         FileOutputStream out = new FileOutputStream("demo/new1.txt");//以路径名称构造

1 //如果该文件不存在，则直接创建，如果存在，在文件后追加内容
2         FileOutputStream out = new FileOutputStream("demo/new1.txt",true);

更多内容可以查询API。

2.使用write()方法写入文件

write()方法和read()相似，只能操作一个字节，即只能写入一个字节。例如：

1 out.wirte(‘A’);//写出了‘A’的低八位
2 int a=10;//wirte只能写八位，那么写一个int需要写4次，每次八位
3 out.write(a>>>24);
4 out.write(a>>>16);
5 out.write(a>>>8);
6 out.wirte(a);

每次只写一个字节，显然是不效率的，OutputStream当然跟InputStream一样可以直接对byte数组操作。

3.使用write(byte[] buf,int start, int size)方法写入文件

意义：把byte[]数组从start位置到size位置结束长度的字节写入到文件中。

语法格式和read相同，不多说明

三、FileInputStream和FileOutputStream结合案例

了解了InputStream和OutputStream的使用方法，这次结合两者来写一个复制文件的方法。

 1 public static void copyFile(File srcFile,File destFile)throws IOException{
 2         if(!srcFile.exists()){
 3             throw new IllegalArgumentException("文件："+srcFile+"不存在");
 4         }
 5         if(!srcFile.isFile()){
 6             throw new IllegalArgumentException(srcFile+"不是一个文件");
 7         }
 8         FileInputStream in =new FileInputStream(srcFile);
 9         FileOutputStream out =new FileOutputStream(destFile);
10         
11         byte[] buf=new byte[8*1024];
12         int b;
13         while((b=in.read(buf, 0, buf.length))!=-1){
14             out.write(buf, 0, b);
15             out.flush();//最好加上
16         }
17         in.close();
18         out.close();
19     }

测试文件案例：

try {
        IOUtil.copyFile(new File("C:\\\\Users\\\\acer\\\\workspace\\\\encode\\\\new4\\\\test1"), new File("C:\\\\Users\\\\acer\\\\workspace\\\\encode\\\\new4\\\\test2"));
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
    }

运行结果：

技术分享

复制成功！

四、DataInputStream和DataOutputStream的使用

DataInputStream、DataOutputStream 是对“流”功能的扩展，可以更加方便地读取int，long。字符等类型的数据。

对于DataOutputStream而言，它多了一些方法，如

writeInt()/wirteDouble()/writeUTF()

这些方法其本质都是通过write()方法来完成的，这些方法都是经过包装，方便我们的使用而来的。

1.构造方法

以DataOutputStream为例，构造方法内的对象是OutputStream类型的对象，我们可以通过构造FileOutputStream对象来使用。

1 String file="demo/data.txt";
2         DataOutputStream dos= new DataOutputStream(new FileOutputStream(file));

2.write方法使用

1         dos.writeInt(10);
2         dos.writeInt(-10);
3         dos.writeLong(10l);
4         dos.writeDouble(10.0);
5         //采用utf-8编码写出
6         dos.writeUTF("中国");
7         //采用utf-16be（java编码格式）写出
8         dos.writeChars("中国");

3.read方法使用

以上述的写方法对立，看下面例子用来读出刚刚写的文件

 1 String file="demo/data.txt";
 2         IOUtil.printHex(file);
 3         DataInputStream dis=new DataInputStream(new FileInputStream(file));
 4         int i=dis.readInt();
 5         System.out.println(i);
 6         i=dis.readInt();
 7         System.out.println(i);
 8         long l=dis.readLong();
 9         System.out.println(l);
10         double d=dis.readDouble();
11         System.out.println(d);
12         String s= dis.readUTF();
13         System.out.println(s);
14         dis.close();

运行结果：

技术分享

总结：DataInputStream和DataOutputStream其实是对FileInputStream和FileOutputStream进行了包装，通过嵌套方便我们使用FileInputStream和FileOutputStream的读写操作，它们还有很多其他方法，大家可以查询API。

注意：进行读操作的时候如果类型不匹配会出错！

五、字节流的缓冲流BufferredInputStresam&BufferredOutputStresam

这两个流类为IO提供了带缓冲区的操作，一般打开文件进行写入或读取操作时，都会加上缓冲，这种流模式提高了IO的性能。

从应用程序中把输入放入文件，相当于将一缸水倒入另一个缸中：

FileOutputStream---->write()方法相当于一滴一滴地把水“转移”过去

DataOutputStream---->write()XXX方法会方便一些，相当于一瓢一瓢地把水“转移”过去

BufferedOutputStream---->write方法更方便，相当于一瓢一瓢水先放入一个桶中（缓冲区），再从桶中倒入到一个缸中。提高了性能，推荐使用！

上述提到过用FileInputStream和FileOutputStream结合写的一个拷贝文件的案例，这次通过字节的缓冲流对上述案例进行修改，观察两者的区别和优劣。

主函数测试：

1 try {
2         long start=System.currentTimeMillis();
3         //IOUtil.copyFile(new File("C:\\\\Users\\\\acer\\\\Desktop\\\\学习路径.docx"), new File("C:\\\\Users\\\\acer\\\\Desktop\\\\复制文本.docx"));
4         long end=System.currentTimeMillis();
5         System.out.println(end-start);
6     } catch (IOException e) {
7         // TODO Auto-generated catch block
8         e.printStackTrace();
9     }

（1）单字节进行文件的拷贝，利用带缓冲的字节流

 1 /*
 2      * 单字节进行文件的拷贝，利用带缓冲的字节流
 3      */
 4     public static void copyFileByBuffer(File srcFile,File destFile)throws IOException{
 5         if(!srcFile.exists()){
 6             throw new IllegalArgumentException("文件："+srcFile+"不存在");
 7         }
 8         if(!srcFile.isFile()){
 9             throw new IllegalArgumentException(srcFile+"不是一个文件");
10         }
11         BufferedInputStream bis=new BufferedInputStream(new FileInputStream(srcFile));
12         BufferedOutputStream bos=new BufferedOutputStream(new FileOutputStream(destFile));
13         int c;
14         while((c=bis.read())!=-1){
15             bos.write(c);
16             bos.flush();//刷新缓冲区
17         }
18         bis.close();
19         bos.close();
20     }

运行结果（效率）：技术分享

（2）单字节不带缓冲进行文件拷贝

 1 /*
 2      * 单字节不带缓冲进行文件拷贝
 3      */
 4     public static void copyFileByByte(File srcFile,File destFile)throws IOException{
 5         if(!srcFile.exists()){
 6             throw new IllegalArgumentException("文件："+srcFile+"不存在");
 7         }
 8         if(!srcFile.isFile()){
 9             throw new IllegalArgumentException(srcFile+"不是一个文件");
10         }
11         FileInputStream in=new FileInputStream(srcFile);
12         FileOutputStream out=new FileOutputStream(destFile);
13         int c;
14         while((c=in.read())!=-1){
15             out.write(c);
16             out.flush();//不带缓冲，可加可不加
17         }
18         in.close();
19         out.close();
20     }

运行结果（效率）：技术分享

（3）批量字节进行文件的拷贝，不带缓冲的字节流（就是上面第三点最初的案例的代码）

 1 /*
 2      * 字节批量拷贝文件，不带缓冲
 3      */
 4     public static void copyFile(File srcFile,File destFile)throws IOException{
 5         if(!srcFile.exists()){
 6             throw new IllegalArgumentException("文件："+srcFile+"不存在");
 7         }
 8         if(!srcFile.isFile()){
 9             throw new IllegalArgumentException(srcFile+"不是一个文件");
10         }
11         FileInputStream in =new FileInputStream(srcFile);
12         FileOutputStream out =new FileOutputStream(destFile);
13         
14         byte[] buf=new byte[8*1024];
15         int b;
16         while((b=in.read(buf, 0, buf.length))!=-1){
17             out.write(buf, 0, b);
18             out.flush();//最好加上
19         }
20         in.close();
21         out.close();
22     }

View Code

运行结果（效率）：技术分享

（4）批量字节进行文件的拷贝，带缓冲的字节流（效率最高，推荐使用！！）

 1 /*
 2      * 多字节进行文件的拷贝，利用带缓冲的字节流
 3      */
 4     public static void copyFileByBuffers(File srcFile,File destFile)throws IOException{
 5         if(!srcFile.exists()){
 6             throw new IllegalArgumentException("文件："+srcFile+"不存在");
 7         }
 8         if(!srcFile.isFile()){
 9             throw new IllegalArgumentException(srcFile+"不是一个文件");
10         }
11         BufferedInputStream bis=new BufferedInputStream(new FileInputStream(srcFile));
12         BufferedOutputStream bos=new BufferedOutputStream(new FileOutputStream(destFile));
13         byte[] buf=new byte[20*1024];
14         int c;
15         while((c=bis.read(buf, 0, buf.length))!=-1){
16             bos.write(buf, 0, c);
17             bos.flush();//刷新缓冲区
18         }
19         bis.close();
20         bos.close();
21     }

运行结果（效率）：技术分享

注意：

批量读取或写入字节，带字节缓冲流的效率最高，推荐使用此方法。
当使用字节缓冲流时，写入操作完毕后必须刷新缓冲区，flush()。
不使用字节缓冲流时，flush()可以不加，但是最好加上去。

六、字符流

首先我们需要了解以下概念。

1）需要了解编码问题---->转移至《计算机中的编码问题》

2）认识文本和文本文件

java的文本（char）是16位无符号整数，是字符的unicode编码（双字节编码）

文件是byte byte byte...的数据序列

文本文件是文本（char）序列按照某种编码方案（utf-8,utf-16be,gbk）序列化byte的存储

3）字符流（Reader Writer）

字符的处理，一次处理一个字符；

字符的底层依然是基本的字节序列；

4）字符流的基本实现

InputStreamReader：完成byte流解析成char流，按照编码解析。

OutputStreamWriter：提供char流到byte流，按照编码处理。

-------------------------Reader和Writer的基本使用-------------------------------

 1 String file1="C:\\\\Users\\\\acer\\\\workspace\\\\encode\\\\new4\\\\test1";
 2         String file2="C:\\\\Users\\\\acer\\\\workspace\\\\encode\\\\new4\\\\test2";
 3         InputStreamReader isr=new InputStreamReader(new FileInputStream(file1));
 4         OutputStreamWriter osw=new OutputStreamWriter(new FileOutputStream(file2));
 5 //        int c;
 6 //        while((c=isr.read())!=-1){
 7 //            System.out.print((char)c);
 8 //        }
 9         char[] buffer=new char[8*1024];
10         int c;
11         //批量读取，放入buffer这个字符数组，从第0个位置到数组长度
12         //返回的是读到的字符个数
13         while((c=isr.read(buffer,0,buffer.length))!=-1){
14             String s=new String(buffer,0,c);//将char类型数组转化为String字符串
15             System.out.println(s);
16             osw.write(buffer,0,c);
17             osw.flush();
18             //osw.write(s);
19             //osw.flush();
20         }
21         isr.close();
22         osw.close();

注意：

字符流操作的是文本文件，不能操作其他类型的文件！！
默认按照GBK编码来解析（项目默认编码），操作文本文件的时候，要写文件本身的编码格式（在构造函数时在后面加上编码格式）！！
字符流和字节流的区别主要是操作的对象不同，还有字符流是以字符为单位来读取和写入文件的，而字节流是以字节或者字节数组来进行操作的！！
在使用字符流的时候要额外注意文件的编码格式，一不小心就会造成乱码！

七、字符流的文件读写流FileWriter和FileReader

跟字节流的FileInputStream和FileOutputStream类相类似，字符流也有相应的文件读写流FileWriter和FileReader类，这两个类主要是对文本文件进行读写操作。

FileReader/FileWriter：可以直接写文件名的路径。

与InputStreamReader相比坏处：无法指定读取和写出的编码，容易出现乱码。

1 FileReader fr = new FileReader("C:\\\\Users\\\\acer\\\\workspace\\\\encode\\\\new4\\\\test1"); //输入流
2 FileWriter fw = new FileWriter(C:\\\\Users\\\\acer\\\\workspace\\\\encode\\\\new4\\\\test2");//输出流

1 char[] buffer=new char[8*1024];
2         int c;
3         while((c=fr.read(buffer, 0, buffer.length))!=-1){
4             fw.write(buffer, 0, c);
5             fw.flush();
6         }
7         fr.close();
8         fw.close();

注意：FileReader和FileWriter不能增加编码参数，所以当项目和读取文件编码不同时，就会产生乱码。这种情况下，只能回归InputStreamReader和OutputStreamWriter。

八、字符流的过滤器BufferedReader&BufferedWriter

字符流的过滤器有BufferedReader和BufferedWriter/PrintWriter

除了基本的读写功能外，它们还有一些特殊的功能。

BufferedReader----->readLine 一次读一行，并不识别换行
BufferedWriter----->write 一次写一行，需要换行
PrintWriter经常和BufferedReader一起使用，换行写入比BufferedWriter更方便

定义方式：

BufferedReader br ＝new BufferedReader(new InputStreamReader(new FileInputStream(目录的地址)))

BufferedWriter br ＝new BufferedWriter(new InputStreamWriter(new FileOutputStream(目录的地址)))

PrintWriter pw=new PrintWriter(目录/Writer/OutputStream/File);

使用方法：

 1 //对文件进行读写操作
 2         String file1="C:\\\\Users\\\\acer\\\\workspace\\\\encode\\\\new4\\\\test1";
 3         String file2="C:\\\\Users\\\\acer\\\\workspace\\\\encode\\\\new4\\\\test2";
 4         BufferedReader br = new BufferedReader(new InputStreamReader(
 5                 new FileInputStream(file1)));
 6         BufferedWriter bw=new BufferedWriter(new OutputStreamWriter(
 7                 new FileOutputStream(file2)));
 8 String line;
 9         while((line=br.readLine())!=null){
10             System.out.println(line);//一次读一行，并不能识别换行
11             bw.write(line);
12             //单独写出换行操作
13             bw.newLine();
14             bw.flush();
15 }
16                 br.close();
17         bw.close();
18 }

在这里我们可以使用PrintWriter来代替BufferedWriter做写操作，PrintWriter相比BufferedWriter有很多优势：

构造函数方便简洁，使用灵活
构造时可以选择是否自动flush
利用println()方法可以实现自动换行，搭配BufferedReader使用更方便

使用方法：

 1 String file1="C:\\\\Users\\\\acer\\\\workspace\\\\encode\\\\new4\\\\test1";
 2         String file2="C:\\\\Users\\\\acer\\\\workspace\\\\encode\\\\new4\\\\test2";
 3         BufferedReader br = new BufferedReader(new InputStreamReader(
 4                 new FileInputStream(file1)));
 5 PrintWriter pw=new PrintWriter(file2);
 6 //PrintWriter pw=new PrintWriter(outputStream, autoFlush);//可以指定是否自动flush
 7 String line;
 8         while((line=br.readLine())!=null){
 9             System.out.println(line);//一次读一行，并不能识别换行
10             pw.println(line);//自动换行
11             pw.flush();//指定自动flush后不需要写
12         }
13         br.close();
14         pw.close();
15 }

注意：

可以使用BufferedReader的readLine()方法一次读入一行，为字符串形式，用null判断是否读到结尾。
使用BufferedWriter的write()方法写入文件，每次写入后需要调用flush()方法清空缓冲区；PrintWriter在构造时可以指定自动flush，不需要再调用flush方法。
在写入时需要注意写入的数据中会丢失换行，可以在每次写入后调用BufferedReader的newLine()方法或改用PrintWriter的println()方法补充换行。
通常将PrintWriter配合BufferedWriter使用。（PrintWriter的构造方法，及使用方式更为简单）。

-----------------更多java流的操作和内容请自行查阅API------------------------