正则表达式匹配中文,网上有两种: [\u4e00-\u9fa5]和[^\x00-\xff],但貌似不只匹配中文。
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式匹配中文,网上有两种: [\u4e00-\u9fa5]和[^\x00-\xff],但貌似不只匹配中文。相关的知识,希望对你有一定的参考价值。
两种方法都能匹配中文,可是也同样匹配¥%^&*等字符,我只想要匹配中文,不想匹配那些符号,怎么办?
[\u4e00-\u9fa5]+ 匹配一个或多个中文[\u4e00-\u9fa5] 只匹配一个中文
他们并不匹配¥%^&*等字符啊,做个简单的测试就知道了。
import java.util.regex.*;
public class Test1
public static void main(String[] args)
Pattern p =Pattern.compile("[\u4e00-\u9fa5]+");
//下面就是你要匹配的字符,如果中文可以测试用p.matcher("中");
Matcher m =p.matcher("%");
System.out.println(m.matches());
输出结果是false。 参考技术A [\u4e00-\u9fa5]这个确实只匹配中文
[^\x00-\xff]这个匹配所有非ASCII的字符,也就是一般意义上的半角字符,而这些%!)(之类的是全角字符 。
以上是关于正则表达式匹配中文,网上有两种: [\u4e00-\u9fa5]和[^\x00-\xff],但貌似不只匹配中文。的主要内容,如果未能解决你的问题,请参考以下文章
正则表达式[\u4E00-\u9fa5]为啥能匹配到数字,字母和某些符号?