如何用python和漂亮的汤从html代码中提取一个小时

Posted

技术标签:

【中文标题】如何用python和漂亮的汤从html代码中提取一个小时【英文标题】:How to extract an hour from html code with python and beautiful soup 【发布时间】:2020-04-05 23:10:36 【问题描述】:

我对 Python 和美丽的汤有点陌生。 任何人都可以帮助并回答我如何从这个 html 代码中提取一个小时?

<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>

输出应该是:12:20

提前感谢您的所有回答!

【问题讨论】:

这能回答你的问题吗? BeautifulSoup innerhtml? 【参考方案1】:

你可以试试:

>>> from bs4 import BeautifulSoup as bs

>>> data = """<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>"""

>>> soup = bs(StringIO(data))
>>> a_tag = soup.find_all('a')

>>> a_tag[0]
<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>

>>> a_tag[0].text
'12:20'

【讨论】:

【参考方案2】:

查看Soup documentation 并尝试先自己制定答案。我建议您查看 find_all('a').text 功能作为您的示例。

【讨论】:

以上是关于如何用python和漂亮的汤从html代码中提取一个小时的主要内容,如果未能解决你的问题,请参考以下文章

使用美丽的汤从标签中提取“href”

如何使用美丽的汤从脚本标签中提取 json?

如何用漂亮的汤刮掉谷歌搜索的第一个链接

如何使用美丽的汤从 kick starter 中获取以下数据?

在python中使用漂亮的汤和硒来解析html

使用 python re.compile 和漂亮的汤来匹配一个字符串