计算机的字符与编码集

Posted 爱上口袋的天空

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了计算机的字符与编码集相关的知识,希望对你有一定的参考价值。

一、字符编码集的历史

1、 ASCII码

◆ 包含95个可打印字符
◆ 使用7个bits就可以完全表示ASCII码
◆ 33个不可打印字符(包括控制字符)

在这里插入图片描述

 2、Extended ASCII码

第一次对ASCII码进行扩充,7bits => 8bits

◆ 带音标的欧洲字符
◆ 常见数学运算符
◆ 其他常用符、表格符等

在这里插入图片描述

3、 字符编码集的国际化

二、中文编码集 

1、中文编码集GB2312

◆ 一共收录了 7445 个字符
◆ 《信息交换用汉字编码字符集——基本集》
◆ 包括 6763 个汉字和 682 个其它符号

2、中文编码集GBK

◆ 向下兼容GB2312,向上支持国际ISO标准
◆ 《汉字内码扩展规范》
◆ 收录了21003个汉字,支持全部中日韩汉字

3、Unicode(utf-8/16/64)

◆ Unicode定义了世界通用的符号集,UTF-*实现了编码
◆ Unicode:统一码、万国码、单一码
◆ UTF-8以字节为单位对Unicode进行编码

以上是关于计算机的字符与编码集的主要内容,如果未能解决你的问题,请参考以下文章

编程必备基础知识|计算机组成原理篇(06):计算机的字符与编码集

浅谈编码集

字节流与字符流的区别

字符编码集格式

字符编码集

JSP/Servlet 中的汉字编码问题