linux常用編碼處理

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了linux常用編碼處理相关的知识,希望对你有一定的参考价值。

——經驗果然是踩坑才過來的,每一個經驗也許都會隱藏着一次被坑的經歷

中文出現亂碼主要因爲編碼不同,編碼不同主要分爲一下兩種情況:

1.文件本身編碼不一致

2.某些軟件自帶轉碼功能

注意:

英文字母也需要轉碼!!!一般情況下沒有影響,但是在某些情況下會導致非常嚴重的影響並且不能找到原因。

Ex: 之前在windowscopy了一份網頁文件,Winodws中文用的是GBK編碼,因爲沒有出現亂碼就沒有進行文件名轉碼,結果導致nginx無法打開某些文件,偶然間發現是文件名編碼問題,然而之前我已經在配置上折騰幾個小時了。

一、應對第一種情況可採用工具轉碼

  • 文件內容轉碼

  • iconv -f FROM_ENCODING -t TO_ENCODING filename

      • -o tofile

ex: iconv -f gbk -t utf-8 filename

  • enconv -L FROM_ENCODING -x(convert to) TO_ENCODING filename

ex: enconv -f zh_CN -t utf-8 filename

  • 文件名轉碼

    • convmv -f FROM_ENCODING -t TO_ENCODING filename

ex: convmv-f gbk -t utf-8 filename

、軟件自帶轉碼功能

  • mount –o iocharset = ENCODING

    ENCODING常用的有:utf8, gbk

  • zip -O CP936

如果不指定編碼則很可能會顯示亂碼。

以上是关于linux常用編碼處理的主要内容,如果未能解决你的问题,请参考以下文章

字符編碼

Python編碼格式錯誤解決方案及案例

PTA题目的處理

C#常用代码片段备忘

常用python日期日志获取内容循环的代码片段

swift常用代码片段