在JavaScript中检测含中文的字符串在UTF-8编码下占用的字节数

Posted bkzy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在JavaScript中检测含中文的字符串在UTF-8编码下占用的字节数相关的知识,希望对你有一定的参考价值。

1. 需求

在前台向后台传输数据时,如果后台需要校验所传输的字符串长度,且后台编码为UTF-8编码格式时(比如Golang环境),则需要此功能。

2. JS实现

2.1思路

检测每个字符在js环境下的16进制编码。

UTF-8编码规则如下:字符代码在000000 – 00007F之间的,用一个字节编码;000080 – 0007FF之间的字符用两个字节;000800 – 00D7FF 和 00E000 – 00FFFF之间的用三个字节(注: Unicode在范围 D800-DFFF 中不存在任何字符);010000 – 10FFFF之间的用4个字节。

2.2 JS代码

function str_UTF8_len(str)
    let len=0;
    //let value = [];
    for (var i = 0; i < str.length; i++) 
		let c_hex = parseInt(str.charCodeAt(i));
		if (c_hex<=0x00007f)
	        len+=1; //在UTF-8编码占用1个字节
	    else if(c_hex>=0x000080 && c_hex<=0x0007ff)
	        len+=2; //在UTF-8编码中占用2个字节
	    else if(c_hex>=0x000800 && c_hex<=0x00ffff)
	        len+=3; //在UTF-8编码中占用3个字节
	    else
	        len+=4;
	    
	    //value.push(c_hex.toString(16));
    
    //console.log(str,value,"长度=",len);
    return len;

3.测试结果

注意:“hello word”后面的冒号是中文冒号“:”

4. 结论

符合预期。

5.参考文献

https://m.imooc.com/wenda/detail/562773

以上是关于在JavaScript中检测含中文的字符串在UTF-8编码下占用的字节数的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 javascript 检测表情符号

在 JavaScript 中检测苹果的强制幻象横幅

在javascript中包含整个字符串中的单词[关闭]

iOS小技能:URL编码

iOS小技能:URL编码

iOS小技能:URL编码