在 Python 中使用正则表达式从特定 xml 标记中提取特定值 [重复]

Posted

技术标签:

【中文标题】在 Python 中使用正则表达式从特定 xml 标记中提取特定值 [重复]【英文标题】:Extracting a specific value from a specific xml tag using Regex in Python [duplicate] 【发布时间】:2018-07-27 22:39:30 【问题描述】:

我的 xml:

<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

我需要一个正则表达式来提取“本周末不要忘记我!”在标签中,如果标签存在于 python 中,使用正则表达式。

我写了一段代码,但我无法弄清楚正则表达式。

【问题讨论】:

我认为你应该看看正则表达式,然后对你拥有的正则表达式产生疑问,如果有的话 我认为你应该包含你的代码。 Why “Can someone help me?” is not an actual question? 您确定正则表达式是正确的工具吗?这通常不是解析 xml 或 html 的正确方法。 【参考方案1】:

一个基本的解决方案:

import re  


data  = """
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>"""

found = re.findall('<body>(.*)</body>', data)

if found:
  for x in found:
    print(x)

>> Don't forget me this weekend!

【讨论】:

以上是关于在 Python 中使用正则表达式从特定 xml 标记中提取特定值 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

python使用正则表达式寻找具有特定后缀的文件

[使用正则表达式从python文本中提取特定单词

特定 XML 元素的正则表达式

从 XML 文件 (Java) 中的特定标签解析内容

最全的python正则使用

python爬虫从入门到放弃之 正则的基本使用