一个汉字占用2个字节,用UTF-8编码方式存储10个汉字,请问一共占用多少个字节
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一个汉字占用2个字节,用UTF-8编码方式存储10个汉字,请问一共占用多少个字节相关的知识,希望对你有一定的参考价值。
要看不同的编码的,汉字在gbk编码方式存储的话,一个汉字占2个字节,要是UTF-8的话,一个汉字是3个字节或者4个字节。常用汉字是3个,冷门的是4个汉字,所以10个一般是30或30个以上字节 参考技术A 二十字节追问那为什么我在一个UTF-8编码的文件里输入10个中文汉字,每个汉字却占用了3个字节
UTF8和UTF16
1 如果只是论一个汉字占用的字节数,那么 UTF-8 占用3个字节, UTF-16 占用2个字节。但是如果存储文本的话,需要在文本使用 EF BB BF 三个字节表示使用 UTF-8 编码,使用 FE FF 表示使用 UTF-16 编码。
2 UTF-16 固定表示两个字节表示一个字符,不管是字母还是汉字; UTF-8 使用 1- 3 个字节表示一个字符
3 UTF-8 一个字节表示英文, 3个字节表示汉字. UTF-16不论英文还是汉字都是2个字节
以上是关于一个汉字占用2个字节,用UTF-8编码方式存储10个汉字,请问一共占用多少个字节的主要内容,如果未能解决你的问题,请参考以下文章