如何在 python 的正则表达式中指定一系列 unicode 字符? [复制]

Posted

技术标签:

【中文标题】如何在 python 的正则表达式中指定一系列 unicode 字符? [复制]【英文标题】:How do I specify a range of unicode characters in a regular-expression in python? [duplicate] 【发布时间】:2011-04-14 12:19:28 【问题描述】:

我正在尝试匹配一系列 Unicode 字符,我想知道该怎么做。我可以匹配像 [a-zA-Z] 这样的简单范围,但是如何指定 Unicode 字符的范围。我试过了

[#xD8-#xF6]

没有任何运气。有什么想法吗?

【问题讨论】:

【参考方案1】:

试试:

[\u00D8-\u00F6]

【讨论】:

你知道如何将 [#xD8-#xF6] 格式转换为 [\u00D8-\u00F6] 吗?【参考方案2】:

Python 2.X

u'[\u00d8-\u00f6]'

Python 3.X

'[\u00d8-\u00f6]'

【讨论】:

用 grep 匹配 unicode 字符:grep -Pe '[\x1200-\x137c]'

以上是关于如何在 python 的正则表达式中指定一系列 unicode 字符? [复制]的主要内容,如果未能解决你的问题,请参考以下文章

python如何读取txt文件中指定内容?

如何在 python 中替换正则表达式?

python 根据python中指定的正则表达式对字符串列表进行分组

如何使用 Python 将正则表达式应用于系列中的元素 [重复]

mysql 正则表达式 如何截取字符串中指定格式的字符

mysql 中用正则表达式如何取一个字符串中指定的字段,