记一个 中文乱码问题

Posted flyaway2013

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了记一个 中文乱码问题相关的知识,希望对你有一定的参考价值。

中文乱码问题, 一直陪伴着我,时不时这里出现,那里出现!

这回的问题 跟记事本有关, Windows记事本, 你懂的, 酸爽的一比。

 

源文件的 是记事本创建的,当然,也是记事本保存的(公司有些同事 竟然喜欢记事本, 我无语凝噎) 我平时都是使用 notepadd++。 编码格式不同,导致的问题。网上也有很多人吐槽这个记事本。

如下:

 

技术图片

 

用notepadd++ 打开记事本创建的txt文件, 都是正常的, 也没有乱码,但是文件上传之后,默认以 UTF-8存储, 然后再次预览、下载下来查看 就出现问题了:

技术图片

 

 

这样的文件 蛋疼。

 

怎么办呢? 其实很简单,需要进行编码探测,EncodingDetect 搞一下就好了! 仔细测试一下,发现还有问题, 发现, 编码问题似乎是好了,但是 内容长度有所减少,而且 后面出现了一个 奇怪的 乱码符合:

技术图片

后面发现,注意到, 重新编码之后, 其长度也发生了变化,

            String name = downloadFilename(request, filename);
            response.addHeader(HttpHeaders.CONTENT_DISPOSITION, "attachment;filename=\\"" + name + "\\"");
            if (contentLength != null) 
                response.addHeader(HttpHeaders.CONTENT_LENGTH, "" + contentLength);
            
            if (StringUtils.isNotBlank(contentType)) 
                response.setContentType(contentType);
            
            out = new BufferedOutputStream(response.getOutputStream());
            out.write(buffer);
            out.flush();

 

上面的 contentLength 是bytes 的长度, 应该是重新编码后的  bytes 的长度 !!

 

终于好了!

 

不过, 另外 需要注意的是, 这个时候, 如果用浏览器的 控制台查看,发现是乱码,

技术图片

 

 

 

 

 

技术图片

 

 

 

 

估计跟 响应头有关:

技术图片

 

可以考虑设置 ContentType 或者  ;charset=

这个其实是不要紧的, 暂时 忽略即可。。

 

以上是关于记一个 中文乱码问题的主要内容,如果未能解决你的问题,请参考以下文章

请求接口中文乱码问题

java链接mysql 中文乱码

记Linux下一次乱码事件

arcgis10.2 打开CAD文件注记乱码

Javaweb 响应字节流输出中文乱码问题

Javaweb 响应字节流输出中文乱码问题