地址栏url中文乱码问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了地址栏url中文乱码问题相关的知识,希望对你有一定的参考价值。

参照博文:http://blog.csdn.net/howlaa/article/details/12834595

做视频的时候,视频的Url和videoName( 含中文)放在的href中,然后转向播放页面,地址栏中的url存在中文编码问题.

问题:使用了encodeURI对Url进行了一次编码,依然是中文乱码。

解决方法:

1.在js中使用encodeURI对url进行双重编码。(一定要双重的,之前用一重的似乎并没有用)

 var url="<%=basePath%>videoJsp/videoSearch.jsp?key="+search_key;
			 	 url=encodeURI(encodeURI(url));
			 	 window.location.href=url;

  解码的话同样需要解码两次:

video_name=encodeURI(encodeURI(video_name));

 2.在使用java代码应该也是可以的.

  同样使用的是java库中的

 

借鉴前面的博文,分析原因:

 encodeURI函数主要是对Url老进行转码,他默认采用UTF-8的编码.

 encodeURI编码的格式是:一个汉字有三个字节组成,每个字节会转成16进制的编码,同时会加上%.

  假设页面端输入的中文是一个“中”,按照下面步骤进行解码:

  • 1.第一次encodeURI,按照utf-8方式获取字节数组变成[-28,-72-83],对字节码数组进行遍历,把每个字节转化成对应的16进制数,这样就变成了[E4,B8,AD],最后变成[%E4,%B8,%AD]  此时已经没有了多字节字符,全部是单字节字符。
  • 2、第二次encodeURI,进行编码,会把%看成一个转义字符,并不编码%以后字符,会把%编码成%25.把数组最后变成[%25E4,%25B8,%25AD]然后就把处理后的数据[%25E4,%25B8,%25AD]发往服务器端,当应用服务器调用getParameter方法,getParameter方法会去向应用服务器请求参数,应用服务器最初获得的就是发送来的[%25E4,%25B8,%25AD],应用服务器会对这个数据进行URLdecode操作,应用服务器进行解码的这一次,不管是按照UTF-8,还是GBK,还是ISO-8859,,都能得到[%E4,%B8,%AD],因为都会把%25解析成%.并把这个值返回给getParameter方法.
  • 3\、再用UTF-8解码一次,就得到"中"了,想想看,如果不编码两次,当服务器自动解码的时候,假如是按照ISO-8859去解码UTF-8编码的东西,就是会出现乱码。 

 

以上是关于地址栏url中文乱码问题的主要内容,如果未能解决你的问题,请参考以下文章

利用JS获取地址栏的中文参数,如何避免取到乱码?

JS获取URL传的值与解决获取URL中的中文参数出现乱码

js获取当前url地址参数中文乱码问题

url 乱码

AJAX的url中文参数问题

IE地址栏输入网址出现乱码,怎么处理?