Web 项目遇到的乱码问题
Posted 耍流氓的兔兔
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Web 项目遇到的乱码问题相关的知识,希望对你有一定的参考价值。
问题代码:
jsp:
<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>Insert title here</title> </head> <body> <!-- 提交的时候必须是name=value键值对 --> <!-- 应用名+请求路径 --> <form action="/gp_web_day17/RequestDemo5" method="get"> 用户名:<input type="text" name="username"><br/> 密 码:<input type="password" name="pwd"><br/> 性 别:<input type="radio" name="sex" value="男" />男 <input type="radio" name="sex" value="女" />女<br /> 爱 好:<input type="checkbox" name="hobby" value="睡觉">睡觉 <input type="checkbox" name="hobby" value="游戏">游戏 <input type="checkbox" name="hobby" value="旅游">旅游<br /> 所在国家:<select name="sel"> <option>-----请选择-----</option> <option value="cn">中国</option> <option value="fa">法国</option> <option value="en">英国</option> </select> <input type="submit" value="注册"> </form> </body> </html>
Servlet:
@WebServlet("/RequestDemo5") public class RequestDemo5 extends HttpServlet { private static final long serialVersionUID = 1L; public RequestDemo5() { super(); } //处理get方式的乱码问题: // get方式传递的参数内容默认编码方式问ISO-8859-1 // 1 自己用再编码再解码处理 // 2在tomcat的配置文件中加入URIEncoding="UTF-8" public String dispose(String str){ try {
//编码 byte[] arr = str.getBytes("ISO-8859-1"); //解码 String ssString = new String(arr, "UTF-8"); return ssString; } catch (UnsupportedEncodingException e) { e.printStackTrace(); } return null; } protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { System.out.println("解码前:"+request.getParameter("username")+" "+request.getParameter("sex")); String name = dispose(request.getParameter("username")); String sex = dispose(request.getParameter("sex")); System.out.println("解码后:"+name+" sex:"+sex); } protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { doGet(request, response); }
运行结果:
问题分析:
问题解决:
//告诉浏览器使用ISO-8859-1编码方式,就可以检测get方法再编码再解码方式是否可以解决乱码问题
<meta http-equiv="Content-Type" content="text/html; charset="ISO-8859-1">
问题总结:
<!-- contentType="text/html; charset=UTF-8: jsp在编辑器中保存文件,使用的是UTF-8编码格式 问题:通过浏览器调用servlet文件,出现中文乱码 --> <!-- pageEncoding="UTF-8: jsp在编辑器中保存文件,使用的是UTF-8编码格式 问题:通过浏览器调用jsp,jsp出现中文乱码 --> <%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>
<!-- 通过<meta>标签模拟response头,控制浏览器用ISO-8859-1的编码解析 --> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
//处理get方式的乱码问题:
// get方式传递的参数内容默认编码方式ISO-8859-1
// 1 自己用再编码再解码处理
// 2在tomcat的配置文件中加入URIEncoding="UTF-8"
//处理post方法解决乱码问题:
//将response对象中的数据以UTF-8解码后的字节发送给浏览器
// request.setCharacterEncoding("utf-8");
UTF-8国际编码 GBK中文编码(包含GB2312,即通过GB2312编码后可以通过GBK解码,反之不成立)
tomcat8以后默认编码格式是utf-8;7之前的都是iso8859-1
如果默认情况下,tomcat使用的的编码方式:iso8859-1
修改tomcat下的conf/server.xml文件
找到如下代码:
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" />
这段代码规定了Tomcat监听HTTP请求的端口号等信息。
可以在这里添加一个属性:URIEncoding,将该属性值设置为UTF-8,即可让Tomcat(默认ISO-8859-1编码)以UTF-8的编码处理get请求。
修改完成后:
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8" />
getBytes()通过平台默认字符集进行编码
get方式传递的参数内容默认编码方式ISO-8859-1
?? 表示没有编码
String编码和URLEncoder.encode编码方式的区别:
new String(bytes[], "utf-8"):新建了一个utf-8编码的字符串
URLEncoder.encode("", "utf-8"):不只是按照utf-8生成了一个字符串,还将其中不安全字符做了处理
看到tomcat8.0之后默认是UTF-8编码,打算测试一下,使用response的输出流对象,将“你好”写入到浏览器端,此时出现了一个新的问题:
预计结果:
tomcat使用UTF-8编码,通过response.setContentType()告知浏览器使用UTF-8解码,而“你好”.getBytes()使用平台默认编码,即UTF-8,二者输出结果应该一致
浏览器输出 “你好 你好”
出现问题:
浏览器输出 “���你好”
protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { ServletOutputStream soServletOutputStream = response.getOutputStream(); //解决:设置服务器端使用的编码 同时告知浏览器是用什么编码 response.setContentType("text/html;charset=UTF-8"); //getBytes() //使用平台的默认字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中 //getBytes( charset )使用给定的 charset //将此 String 编码到 byte 序列,并将结果存储到新的 byte 数组 soServletOutputStream.write("你好".getBytes()); soServletOutputStream.write("你好".getBytes("UTF-8")); soServletOutputStream.close(); }
问题分析:
“你好”.getBytes("UTF-8")正常输出,说明tomcat8.5默认编码为UTF-8,浏览器使用UTF-8进行解码,输出正常不乱码
“你好”.getByte()输出乱码,说明编码格式不是UTF-8,查看文档“适用平台默认字符集编码”,而平台为Eclipse(默认编码为GBK),浏览器使用UTF-8解码,输出乱码
问题解决:
为了测试是否是默认平台编码的问题,通知浏览器使用GBK编码,输出 “你好浣犲ソ”,那么说明问题原因正确
response.setContentType("text/html;charset=GBK");
问题描述:
出现“UnsupportedEncodingException”异常
问题分析:
查看文档“不支持问题编码”,说明一定是getBytes(charset)参数有问题
outputStream.write("你好".getBytes(""));
问题解决:
outputStream.write("你好".getBytes());
参考博客:http://www.cnblogs.com/oldinaction/p/5167481.html
以上是关于Web 项目遇到的乱码问题的主要内容,如果未能解决你的问题,请参考以下文章