java字节流对汉字输出为乱码的问题

Posted 2023-04-30

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了java字节流对汉字输出为乱码的问题相关的知识，希望对你有一定的参考价值。

package IoOut;
import java.io.*;
public class App14_1

public static void main(String args[]) throws IOException //read()方法抛出IOException异常，在此交给JVM处理

FileInputStream fr =new FileInputStream("c:\\aaa.txt"); //ok,但不能正确读取出汉字
int ch;
int count=0;
ch=fr.read(); //read()方法返回的是一个整型数字
while(ch!=-1)

System.out.print((char)ch);
ch=fr.read();
count++;

fr.close();

System.out.println("\n共读取了:"+count+"个字符");

在aaa.txt中有汉字，但输出为乱码，字符输出正常，为什么？

出现问题的原因是字节流中每个汉字是两个字节，所以肯定会出现乱码的，要将字节流通过BufferedReader变成按行读取的就可以了。
BufferedReader bre = null;
try
String file = "D:/test/test.txt";
bre = new BufferedReader(new FileReader(file));//此时获取到的bre就是整个文件的缓存流
while ((str = bre.readLine())!= null) // 判断最后一行不存在，为空结束循环

System.out.println(str);//原样输出读到的内容
；
备注：流用完之后必须close掉，如上面的就应该是：bre.close()，否则bre流会一直存在，直到程序运行结束。参考技术A 首先确认你的字符编码，gbk编码中文是2个字节，utf编码是3个字节代表一个字符
read读到的是一个节，一个中文，当然就读半个字节了，不完全当然是乱码了本回答被提问者采纳参考技术B txt 的字符是gb2312的控制台喷出的字符一般要经过转码转成utf-8 就行了吧参考技术C 先请看我修改后的源代码：

package IoOut;

import java.io.*;

public class App14_1

public static void main(String args[]) throws IOException //read()方法抛出IOException异常，在此交给JVM处理

FileInputStream fr =new FileInputStream("c:\\aaa.txt"); //ok,但不能正确读取出汉字
int ch;
int count=0;
ch=fr.read(); //read()方法返回的是一个整型数字
while(ch!=-1)

System.out.write(ch);
ch=fr.read();
count++;

fr.close();
System.out.println("\n共读取了:"+count+"个字符");

其实只改了一处地方，
System.out.print((char)ch);
改为
System.out.write(ch);
前者是按字符格式写，后者是按字节格式写。汉字、图片、音频等应该按字节处理，否则会出现所谓的乱码。
实际上没有所谓的乱码，只是不同Unicode编码组合表示的字符而已。参考技术D 热一天我也吧

Javaweb 响应字节流输出中文乱码问题

问题：使用字节流输出，产生了中文乱码？

举个栗子

如下面的形式就会输出中文乱码

public class ResponseDemo1 extends HttpServlet {

    /**
     * 演示字节流输出的乱码问题
     */
    public void doGet(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
       
        String str = "字节流输出中文的乱码问题";//UTF-8的字符集，此时浏览器显示也需要使用UTF-8的字符集。
        //1.拿到字节流输出对象
        ServletOutputStream sos = response.getOutputStream();

        //2.把str转换成字节数组之后输出到浏览器
        sos.write(str.getBytes("UTF-8")); 
    }

    public void doPost(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
        doGet(request, response);
    }
}

原因：存和取用的不是同一个码表

在保存时用的是IDEA创建文件使用的字符集UTF-8。
到浏览器上显示，chrome浏览器和ie浏览器默认的字符集是GB2312(其实就是GBK)，存和取用的不是同一个码表，就会产生乱码。

解决办法：把存和取的码表统一

第一种解决办法：

修改浏览器的编码，使用右键——编码——改成UTF-8。(不推荐使用，我们的应用尽量不要求用户取做什么事情)

ie和火狐浏览器可以直接右键设置字符集。而chrome需要安装插件，很麻烦。

在这里插入图片描述

第二种解决办法： (不建议使用，因为不好记)

向页面上输出一个meta标签，内容如下：

 <meta http-equiv="content-type" content="text/html;charset=UTF-8">

其实它就是指挥了浏览器，使用哪个编码进行显示。

在java中是这样写的：

//1.拿到字节流输出对象
ServletOutputStream sos = response.getOutputStream();

sos.write("<meta http-equiv='content-type' content='text/html;charset=UTF-8'>".getBytes());

第三种解决办法：

设置响应消息头，告知浏览器响应正文的MIME类型和字符集

response.setHeader("Content-Type","text/html;charset=UTF-8");

在Java中是这样实现的：

//1.拿到字节流输出对象
ServletOutputStream sos = response.getOutputStream();
      
response.setHeader("Content-Type","text/html;charset=UTF-8");

第四种解决办法：我们推荐使用的办法

它的本质就是设置了一个响应消息头

response.setContentType("text/html;charset=UTF-8");

在java中是这样实现的

//1.拿到字节流输出对象
ServletOutputStream sos = response.getOutputStream();

response.setContentType("text/html;charset=UTF-8");
//2.把str转换成字节数组之后输出到浏览器
sos.write(str.getBytes("UTF-8"));

案例

上述四种解决办法的案例：

public class ResponseDemo1 extends HttpServlet {

    /**
     * 演示字节流输出的乱码问题
     */
    public void doGet(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
        /**
         * 问题：
         * 	  String str = "字节流中文乱码问题";
         * 	     使用字节流输出，会不会产生中文乱码？
         * 答案：
         * 	  会产生乱码
         * 原因：
         * 	String str = "字节流中文乱码问题"; 在保存时用的是IDEA创建文件使用的字符集UTF-8。
         * 	到浏览器上显示，chrome浏览器和ie浏览器默认的字符集是GB2312(其实就是GBK)，存和取用的不是同一个码表，就会产生乱码。
         *
         * 引申：
         *   如果产生了乱码，就是存和取用的不是同一个码表
         * 解决办法：
         *   把存和取的码表统一。
         */
        String str = "字节流输出中文的乱码问题";//UTF-8的字符集，此时浏览器显示也需要使用UTF-8的字符集。
        //1.拿到字节流输出对象
        ServletOutputStream sos = response.getOutputStream();
        /**
         * 解决办法：
         * 	第一种解决办法：
         *      修改浏览器的编码，使用右键——编码——改成UTF-8。(不推荐使用，我们的应用尽量不要求用户取做什么事情)
         *      ie和火狐浏览器可以直接右键设置字符集。而chrome需要安装插件，很麻烦。
         * 	第二种解决办法： (不建议使用，因为不好记)
         *  	向页面上输出一个meta标签，内容如下： <meta http-equiv="content-type" content="text/html;charset=UTF-8">
         *      其实它就是指挥了浏览器，使用哪个编码进行显示。
         *  第三种解决办法：
         * 		设置响应消息头，告知浏览器响应正文的MIME类型和字符集
         * 		response.setHeader("Content-Type","text/html;charset=UTF-8");
         * 	第四种解决办法：我们推荐使用的办法
         * 	    它的本质就是设置了一个响应消息头
         *  	response.setContentType("text/html;charset=UTF-8");
         */
        //第二种解决办法：sos.write("<meta http-equiv='content-type' content='text/html;charset=UTF-8'>".getBytes());
        //第三种解决办法：response.setHeader("Content-Type","text/html;charset=UTF-8");
        //第四种解决办法：
        response.setContentType("text/html;charset=UTF-8");
        //2.把str转换成字节数组之后输出到浏览器
        sos.write(str.getBytes("UTF-8")); 
    }

    public void doPost(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
        doGet(request, response);
    }
}

问题解决后案例：正常输出中文

public class ResponseDemo2 extends HttpServlet {

    /**
     * 字符流输出中文乱码
     * @param request
     * @param response
     * @throws ServletException
     * @throws IOException
     */
    public void doGet(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
        String str = "字符流输出中文乱码";
        //response.setCharacterEncoding("UTF-8");

        //设置响应正文的MIME类型和字符集
        response.setContentType("text/html;charset=UTF-8");
        //1.获取字符输出流
        PrintWriter out = response.getWriter();
        //2.使用字符流输出中文
        /**
         * 问题：
         * 	out.write(str); 直接输出，会不会产生乱码
         * 答案：
         * 	会产生乱码
         * 原因：
         * 	存用的什么码表：UTF-8
         *  在浏览器取之前，字符流PrintWriter已经获取过一次了，PrintWriter它在取的时候出现了乱码。
         * 	浏览器取默认用的是GBK。（本地系统字符集）
         *
         *  UTF-8(存)————>PrintWriter ISO-8859-1(取)					乱
         *  PrintWirter ISO-8859-1(存)————>浏览器 GBK(取)				乱
         *
         * 解决办法：
         * 	改变PrintWriter的字符集，PrintWriter是从response对象中获取的，其实设置response的字符集。
         *  注意：设置response的字符集，需要在拿流之前。
         *  response.setCharacterEncoding("UTF-8");
         *
         * response.setContentType("text/html;charset=UTF-8");
         * 此方法，其实是做了两件事：
         * 		1.设置响应对象的字符集（包括响应对象取出的字符输出流）
         * 		2.告知浏览器响应正文的MIME类型和字符集
         */

        out.write(str);
    }

    public void doPost(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
        doGet(request, response);
    }
}

以上是关于java字节流对汉字输出为乱码的问题的主要内容，如果未能解决你的问题，请参考以下文章