如何在 python 的正则表达式中指定一系列 unicode 字符? [复制]
Posted
技术标签:
【中文标题】如何在 python 的正则表达式中指定一系列 unicode 字符? [复制]【英文标题】:How do I specify a range of unicode characters in a regular-expression in python? [duplicate] 【发布时间】:2011-04-14 12:19:28 【问题描述】:我正在尝试匹配一系列 Unicode 字符,我想知道该怎么做。我可以匹配像 [a-zA-Z] 这样的简单范围,但是如何指定 Unicode 字符的范围。我试过了
[#xD8-#xF6]
没有任何运气。有什么想法吗?
【问题讨论】:
【参考方案1】:试试:
[\u00D8-\u00F6]
【讨论】:
你知道如何将 [#xD8-#xF6] 格式转换为 [\u00D8-\u00F6] 吗?【参考方案2】:Python 2.X
u'[\u00d8-\u00f6]'
Python 3.X
'[\u00d8-\u00f6]'
【讨论】:
用 grep 匹配 unicode 字符:grep -Pe '[\x1200-\x137c]'以上是关于如何在 python 的正则表达式中指定一系列 unicode 字符? [复制]的主要内容,如果未能解决你的问题,请参考以下文章
python 根据python中指定的正则表达式对字符串列表进行分组