正则表达式如何只匹配一个中文字符

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式如何只匹配一个中文字符相关的知识,希望对你有一定的参考价值。

php中匹配一个或多个中文字符(包含简体和繁体中文字符)的正则表达式如下:/[[b]\x4e00-\x9fa5]+/注意:php中正则表达式的16进制是以
\x
开头的。
参考技术A 如果是GB码,可能是双字节GBK[0x81-0xfe][0x40-0xfe],也可能是四字节GB18030[0x81-0xfe][0x30-0x39][0x81-0xfe][0x30-0x39]。
汉字在Unicode中称作CJK 统一表意符号 (CJK Unified Ideographs),包括
reg=/^([\u+3400-\u+4dbf\u4e00-\u9fff\u+20000-\u3fffd\ue000-f8ff]2,7)$/; //只能是中文,长度为2-7位
最后一项为PUA,参见百度百科【统一码】。

以上是关于正则表达式如何只匹配一个中文字符的主要内容,如果未能解决你的问题,请参考以下文章

如何让正则表达式匹配只添加一次到匹配集合中?

java正则表达式 过滤特殊字符 只允许中文、字母和数字, 该怎么写?急。。。

如何使用正则表达式的结果进行进一步匹配?

Nginx中的正则如何匹配数字

求教正则表达式如何匹配

如何编写正则表达式模式以匹配字符串结尾或字符串开头的货币符号