Linux shell 命令 转换文件的字符编码

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux shell 命令 转换文件的字符编码相关的知识,希望对你有一定的参考价值。

windows 上默认的简体中文字符编码是GBK,而Linux是UTF-8(这里的描述好像并不准确,字符编码与字符集应该不是一回事,还没搞清楚)。

查看文件编码:(enca 软件包可能并没有默认安装,用apt-get install enca或yum install enca等命令安装即可):
  1. $ enca filename
GB2312编码的文件输出:
  1. Simplified Chinese National Standard; GB2312
  2. CRLF line terminators

将文件编码转换成UTF-8:
  1. $ iconv -f GB2312 -t UTF-8 filename > newfilename
  2. //注: Filename 与 Newfilename  不要相同 否则为空。
此时用enca命令查看newfilename,输出:
  1. Universal transformation format 8 bits; UTF-8
  2. CRLF line terminators







以上是关于Linux shell 命令 转换文件的字符编码的主要内容,如果未能解决你的问题,请参考以下文章

使用编码字的 MIME 标头中的换行符是不是合法?

如何批量修改linux 文件编码格式

shell几个字符转换命令

linux shell命令怎么查找文件中指定字符串,并把这个字符串所在行和下面一行的内容写到另外一个文件中?

转换流,Properties 集合

shell :linux sed 批量替换字符串