一个汉字占用2个字节,用UTF-8编码方式存储10个汉字,请问一共占用多少个字节

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一个汉字占用2个字节,用UTF-8编码方式存储10个汉字,请问一共占用多少个字节相关的知识,希望对你有一定的参考价值。

要看不同的编码的,汉字在gbk编码方式存储的话,一个汉字占2个字节,要是UTF-8的话,一个汉字是3个字节或者4个字节。常用汉字是3个,冷门的是4个汉字,所以10个一般是30或30个以上字节 参考技术A 二十字节追问

那为什么我在一个UTF-8编码的文件里输入10个中文汉字,每个汉字却占用了3个字节

UTF8和UTF16

1  如果只是论一个汉字占用的字节数,那么 UTF-8 占用3个字节, UTF-16 占用2个字节。但是如果存储文本的话,需要在文本使用 EF BB BF 三个字节表示使用 UTF-8 编码,使用 FE FF 表示使用 UTF-16 编码。
 
2  UTF-16 固定表示两个字节表示一个字符,不管是字母还是汉字; UTF-8 使用 1- 3 个字节表示一个字符
 
3 UTF-8 一个字节表示英文, 3个字节表示汉字. UTF-16不论英文还是汉字都是2个字节

以上是关于一个汉字占用2个字节,用UTF-8编码方式存储10个汉字,请问一共占用多少个字节的主要内容,如果未能解决你的问题,请参考以下文章

UTF8和UTF16

一个汉字到底占几个字节

java一个汉字占几个字节?

Python 字符集编码 - UTF-8 编码

编码初识

阿拉伯语编码成utf8 需要几个字节?