Linux Centos7设置UTF-8编码,防止中文乱码

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux Centos7设置UTF-8编码,防止中文乱码相关的知识,希望对你有一定的参考价值。

参考技术A Centos7设置UTF-8编码,防止中文乱码

登录的时候出现invalid utf-8错误,以及出现其它中文乱码解决方案:

CentOS系统下中文文件名乱码

从windows上传到linux的文件或者目录,在Linux系统中显示为乱码。虽然将Linux的env设置了LANG=en_US.UTF-8,并且本地的Shell客户端编码也设置成UTF-8,但在Shell中(或通过http访问),仍是乱码……

原因在于,Windows 的文件名中文编码默认为GBK,压缩或者上传后,文件名还会是GBK编码,而Linux中默认文件名编码为UTF8,由于编码不一致所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。

安装方式1:wget http://pkgs.repoforge.org/convmv/convmv-1.15-1.el6.rf.noarch.rpm
rpm -ivh convmv-1.15-1.el6.rf.noarch.rpm

安装方式2:yum install convmv

语法:
convmv [options] FILE(S) ... DIRECTORY(S)
主要选项:
1、-f ENCODING
指定目前文件名的编码,如-f gbk
2、-t ENCODING
指定将要转换成的编码,如-f utf-8
3、-r
递归转换目录下所有文件名
4、--list
列出所有支持的编码
5、--notest
默认是只打印转换后的效果,加这个选项才真正执行转换操作。

常用参数:
-r 递归处理子文件夹
–notest 真正进行操作,默认情况下是不对文件进行真实操作
–list 显示所有支持的编码
–unescap 可以做一下转义,比如把%20变成空格
-i 交互模式(询问每一个转换,防止误操作)
convmv 的使用方法:
convmv -f 源编码 -t 新编码 [选项] 文件名

使用:/usr/bin/convmv -f gbk -t utf-8 -r --notest /home/wwwroot(要转码的文件夹)

inux下有许多方便的小工具来转换编码:
文本内容转换 iconv
文件名转换 convmv
mp3标签转换 python-mutagen

例子:

这样转换以后“GBK编码的文件名”会被转换成UTF-8编码(只是文件名编码的转换,文件内容不会发生变化)。

注意:不要在NTFS和FAT文件系统中使用此命令,否则可能产生意外结果,如果要在Linux中正确的显示NTFS和 FAT的中文件名,可以通过mount参数来解决,具体方法参考man手册。

例子1:
1.递归转换centos目录下的目前文件名编码gbk为utf-8:
convmv -f gbk -t utf-8 --notest -r centos

列子2:
convmv -f GBK -t UTF-8 --notest -r mirrors.zzsir.cn/*
(mirrors.zzsir.cn/*为要转编码的文件的当前目录)

例子3
convmv -f GBK -t UTF-8 --notest *.zip
把当前目录以.zip结尾的文件批量转码

以上是关于Linux Centos7设置UTF-8编码,防止中文乱码的主要内容,如果未能解决你的问题,请参考以下文章

Linux(Ubuntu)使用日记------Mysql编码(utf-8)的设置

idea 通用设置 编码设置防止乱码ctrl+鼠标滚动就可以缩放字体大小 跟浏览器一样

在linux中每次打开一个终端,终端的默认编码为 utf-8,如何设置为让他每次打开编码为GBK ???

如何设置linux服务器的语言 字符encode为utf-8编码

如何在 Linux 中将文件编码转换为 UTF-8

如何在 Linux 中将文件编码转换为 UTF-8