java字节流对汉字输出为乱码的问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java字节流对汉字输出为乱码的问题相关的知识,希望对你有一定的参考价值。

package IoOut;
import java.io.*;
public class App14_1

public static void main(String args[]) throws IOException //read()方法抛出IOException异常,在此交给JVM处理

FileInputStream fr =new FileInputStream("c:\\aaa.txt"); //ok,但不能正 确读取出汉字
int ch;
int count=0;
ch=fr.read(); //read()方法返回的是一个整型数字
while(ch!=-1)

System.out.print((char)ch);
ch=fr.read();
count++;


fr.close();

System.out.println("\n共读取了:"+count+"个字符");


在aaa.txt中有汉字,但输出为乱码,字符输出正常,为什么?

出现问题的原因是字节流中每个汉字是两个字节,所以肯定会出现乱码的,要将字节流通过BufferedReader变成按行读取的就可以了。
BufferedReader bre = null;
try
String file = "D:/test/test.txt";
bre = new BufferedReader(new FileReader(file));//此时获取到的bre就是整个文件的缓存流
while ((str = bre.readLine())!= null) // 判断最后一行不存在,为空结束循环

System.out.println(str);//原样输出读到的内容

备注: 流用完之后必须close掉,如上面的就应该是:bre.close(),否则bre流会一直存在,直到程序运行结束。
参考技术A 首先确认你的字符编码,gbk编码中文是2个字节,utf编码是3个字节代表一个字符
read读到的是一个节,一个中文,当然就读半个字节了,不完全当然是乱码了本回答被提问者采纳
参考技术B txt 的字符是gb2312的 控制台 喷出的字符一般要经过转码 转成utf-8 就行了吧 参考技术C 先请看我修改后的源代码:

package IoOut;

import java.io.*;

public class App14_1

public static void main(String args[]) throws IOException //read()方法抛出IOException异常,在此交给JVM处理

FileInputStream fr =new FileInputStream("c:\\aaa.txt"); //ok,但不能正 确读取出汉字
int ch;
int count=0;
ch=fr.read(); //read()方法返回的是一个整型数字
while(ch!=-1)

System.out.write(ch);
ch=fr.read();
count++;


fr.close();
System.out.println("\n共读取了:"+count+"个字符");



其实只改了一处地方,
System.out.print((char)ch);
改为
System.out.write(ch);
前者是按字符格式写,后者是按字节格式写。汉字、图片、音频等应该按字节处理,否则会出现所谓的乱码。
实际上没有所谓的乱码,只是不同Unicode编码组合表示的字符而已。
参考技术D 热一天我也吧

Javaweb 响应字节流输出中文乱码问题

问题:使用字节流输出,产生了中文乱码?

举个栗子

如下面的形式就会输出中文乱码

public class ResponseDemo1 extends HttpServlet {

    /**
     * 演示字节流输出的乱码问题
     */
    public void doGet(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
       
        String str = "字节流输出中文的乱码问题";//UTF-8的字符集,此时浏览器显示也需要使用UTF-8的字符集。
        //1.拿到字节流输出对象
        ServletOutputStream sos = response.getOutputStream();

        //2.把str转换成字节数组之后输出到浏览器
        sos.write(str.getBytes("UTF-8")); 
    }

    public void doPost(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
        doGet(request, response);
    }
}

原因:存和取用的不是同一个码表

  • 在保存时用的是IDEA创建文件使用的字符集UTF-8
  • 到浏览器上显示,chrome浏览器和ie浏览器默认的字符集是GB2312(其实就是GBK),存和取用的不是同一个码表,就会产生乱码。

解决办法:把存和取的码表统一

第一种解决办法:

修改浏览器的编码,使用右键——编码——改成UTF-8。(不推荐使用,我们的应用尽量不要求用户取做什么事情)

ie和火狐浏览器可以直接右键设置字符集。而chrome需要安装插件,很麻烦。

在这里插入图片描述

第二种解决办法: (不建议使用,因为不好记)

向页面上输出一个meta标签,内容如下:

 <meta http-equiv="content-type" content="text/html;charset=UTF-8">

其实它就是指挥了浏览器,使用哪个编码进行显示。

在java中是这样写的:

//1.拿到字节流输出对象
ServletOutputStream sos = response.getOutputStream();

sos.write("<meta http-equiv='content-type' content='text/html;charset=UTF-8'>".getBytes());
        

第三种解决办法:

设置响应消息头,告知浏览器响应正文的MIME类型和字符集

response.setHeader("Content-Type","text/html;charset=UTF-8");

在Java中是这样实现的:

//1.拿到字节流输出对象
ServletOutputStream sos = response.getOutputStream();
      
response.setHeader("Content-Type","text/html;charset=UTF-8");

第四种解决办法:我们推荐使用的办法

它的本质就是设置了一个响应消息头

response.setContentType("text/html;charset=UTF-8");

在java中是这样实现的

//1.拿到字节流输出对象
ServletOutputStream sos = response.getOutputStream();

response.setContentType("text/html;charset=UTF-8");
//2.把str转换成字节数组之后输出到浏览器
sos.write(str.getBytes("UTF-8")); 

案例

上述四种解决办法的案例:

public class ResponseDemo1 extends HttpServlet {

    /**
     * 演示字节流输出的乱码问题
     */
    public void doGet(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
        /**
         * 问题:
         * 	  String str = "字节流中文乱码问题";
         * 	     使用字节流输出,会不会产生中文乱码?
         * 答案:
         * 	  会产生乱码
         * 原因:
         * 	String str = "字节流中文乱码问题"; 在保存时用的是IDEA创建文件使用的字符集UTF-8。
         * 	到浏览器上显示,chrome浏览器和ie浏览器默认的字符集是GB2312(其实就是GBK),存和取用的不是同一个码表,就会产生乱码。
         *
         * 引申:
         *   如果产生了乱码,就是存和取用的不是同一个码表
         * 解决办法:
         *   把存和取的码表统一。
         */
        String str = "字节流输出中文的乱码问题";//UTF-8的字符集,此时浏览器显示也需要使用UTF-8的字符集。
        //1.拿到字节流输出对象
        ServletOutputStream sos = response.getOutputStream();
        /**
         * 解决办法:
         * 	第一种解决办法:
         *      修改浏览器的编码,使用右键——编码——改成UTF-8。(不推荐使用,我们的应用尽量不要求用户取做什么事情)
         *      ie和火狐浏览器可以直接右键设置字符集。而chrome需要安装插件,很麻烦。
         * 	第二种解决办法: (不建议使用,因为不好记)
         *  	向页面上输出一个meta标签,内容如下: <meta http-equiv="content-type" content="text/html;charset=UTF-8">
         *      其实它就是指挥了浏览器,使用哪个编码进行显示。
         *  第三种解决办法:
         * 		设置响应消息头,告知浏览器响应正文的MIME类型和字符集
         * 		response.setHeader("Content-Type","text/html;charset=UTF-8");
         * 	第四种解决办法:我们推荐使用的办法
         * 	    它的本质就是设置了一个响应消息头
         *  	response.setContentType("text/html;charset=UTF-8");
         */
        //第二种解决办法:sos.write("<meta http-equiv='content-type' content='text/html;charset=UTF-8'>".getBytes());
        //第三种解决办法:response.setHeader("Content-Type","text/html;charset=UTF-8");
        //第四种解决办法:
        response.setContentType("text/html;charset=UTF-8");
        //2.把str转换成字节数组之后输出到浏览器
        sos.write(str.getBytes("UTF-8")); 
    }

    public void doPost(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
        doGet(request, response);
    }
}

问题解决后案例:正常输出中文

public class ResponseDemo2 extends HttpServlet {

    /**
     * 字符流输出中文乱码
     * @param request
     * @param response
     * @throws ServletException
     * @throws IOException
     */
    public void doGet(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
        String str = "字符流输出中文乱码";
        //response.setCharacterEncoding("UTF-8");

        //设置响应正文的MIME类型和字符集
        response.setContentType("text/html;charset=UTF-8");
        //1.获取字符输出流
        PrintWriter out = response.getWriter();
        //2.使用字符流输出中文
        /**
         * 问题:
         * 	out.write(str); 直接输出,会不会产生乱码
         * 答案:
         * 	会产生乱码
         * 原因:
         * 	存用的什么码表:UTF-8
         *  在浏览器取之前,字符流PrintWriter已经获取过一次了,PrintWriter它在取的时候出现了乱码。
         * 	浏览器取默认用的是GBK。(本地系统字符集)
         *
         *  UTF-8(存)————>PrintWriter ISO-8859-1(取)					乱
         *  PrintWirter ISO-8859-1(存)————>浏览器 GBK(取)				乱
         *
         * 解决办法:
         * 	改变PrintWriter的字符集,PrintWriter是从response对象中获取的,其实设置response的字符集。
         *  注意:设置response的字符集,需要在拿流之前。
         *  response.setCharacterEncoding("UTF-8");
         *
         * response.setContentType("text/html;charset=UTF-8");
         * 此方法,其实是做了两件事:
         * 		1.设置响应对象的字符集(包括响应对象取出的字符输出流)
         * 		2.告知浏览器响应正文的MIME类型和字符集
         */

        out.write(str);
    }

    public void doPost(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {
        doGet(request, response);
    }
}

以上是关于java字节流对汉字输出为乱码的问题的主要内容,如果未能解决你的问题,请参考以下文章

Java IO-file(读写查)字节流字符流

JAVA读取字节流

java字节流读txt文件出现乱码怎么解决?

Servlet中文乱码解决方法

Javaweb 响应字节流输出中文乱码问题

Javaweb 响应字节流输出中文乱码问题