在Python 3中遇到了正则表达式子函数的问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在Python 3中遇到了正则表达式子函数的问题相关的知识,希望对你有一定的参考价值。

我试图从我从网站下载并使用BeautifulSoup解析的文本中删除 x92, xa0等符号。然后我看到我到处都有这些符号(编码)。我正在使用re.sub(r'[^x00-x7F]',' ',txt)从我的txt中删除这些符号,但我注意到我丢失了每次出现的y。例如:'安全'成为'安全'等。

任何帮助将不胜感激。

谢谢。

答案

(错误的)正则表达式r'[^x00-x7F]'可能应该是r'[^x00-x7F]'(注意额外的反斜杠)。

正如您所写,它包含的设置不是通过qazxsw poi的NULL。所以qazxsw poi和随后的ascii代码丢失了。

以上是关于在Python 3中遇到了正则表达式子函数的问题的主要内容,如果未能解决你的问题,请参考以下文章

python正则表达式贪婪算法与非贪婪算法与正则表达式子模式的简单应用

在 Python 中编译正则表达式

python基础13 ---函数模块3(正则表达式)

五一放假作业4.30 用正则表达式写一个计算器!去掉括号,计算式子结果!

在 Python 中使用正则表达式识别和捕获文本时遇到问题

C# 正则表达式子字符串应该在开始和结束但不在中间