ASCIIUnicode和UTF-8编码的区别;中英文混合截取

Posted 蒙蒙大川

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ASCIIUnicode和UTF-8编码的区别;中英文混合截取相关的知识,希望对你有一定的参考价值。

ASCII编码是128个字符

中国把汉字编入GB2312,Shift_JIS/Euc-kr各国标准.....

Unicode是为了解决各国乱码的,但浪费存储空间

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6字节,英文字母是1字节,汉字通常是3字节,生僻字符是4-6字节

  

txt文本文档为什么有时打开是一堆乱码?

1:编码方式由ASCII码和Unicode码
其中Unicode码包括UTF-8,UTF-16,UTF-32三种,其中UTF-8是变长码,
由于解码错误,导致了打开错误
你可以使用RTF(写字板)或者Word等软件打开
2:源文件根本就不是文本文件,有些人出于保密或者网络传输方便(有些网络传输对格式有明确限制,所以需要修改扩展名)把源文件的扩展名改成了txt
扩展名:文件名中最后的一个“.”之后的名字,用来表明文件类型,帮助设置默认程序

以上是关于ASCIIUnicode和UTF-8编码的区别;中英文混合截取的主要内容,如果未能解决你的问题,请参考以下文章

ASCIIUnicode和UTF-8编码的区别

ASCIIUnicode和UTF-8编码的区别;中英文混合截取

Java 字符编码 ASCIIUnicode和UTF-8

字符编码的来源,asciiunicode和utf-8编码的关系

编码解码--三种常见字符编码简介:ASCIIUnicode和UTF-8

三种常见字符编码简介:ASCIIUnicode和UTF-8