ASCIIUnicode和UTF-8编码的区别;中英文混合截取
Posted 蒙蒙大川
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ASCIIUnicode和UTF-8编码的区别;中英文混合截取相关的知识,希望对你有一定的参考价值。
ASCII编码是128个字符
中国把汉字编入GB2312,Shift_JIS/Euc-kr各国标准.....
Unicode是为了解决各国乱码的,但浪费存储空间
UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6字节,英文字母是1字节,汉字通常是3字节,生僻字符是4-6字节
txt文本文档为什么有时打开是一堆乱码?
1:编码方式由ASCII码和Unicode码
其中Unicode码包括UTF-8,UTF-16,UTF-32三种,其中UTF-8是变长码,
由于解码错误,导致了打开错误
你可以使用RTF(写字板)或者Word等软件打开
2:源文件根本就不是文本文件,有些人出于保密或者网络传输方便(有些网络传输对格式有明确限制,所以需要修改扩展名)把源文件的扩展名改成了txt
扩展名:文件名中最后的一个“.”之后的名字,用来表明文件类型,帮助设置默认程序
以上是关于ASCIIUnicode和UTF-8编码的区别;中英文混合截取的主要内容,如果未能解决你的问题,请参考以下文章
ASCIIUnicode和UTF-8编码的区别;中英文混合截取
字符编码的来源,asciiunicode和utf-8编码的关系