Python:通过 BeautifulSoup 搜索单个标签 [重复]

Posted

技术标签:

【中文标题】Python:通过 BeautifulSoup 搜索单个标签 [重复]【英文标题】:Python: search individual tag through BeautifulSoup [duplicate] 【发布时间】:2016-11-13 22:05:28 【问题描述】:

我正在尝试创建一个来自 BBC 阅读量最高的部分的前 10 篇新闻文章列表。我的代码如下:

from bs4 import BeautifulSoup, SoupStrainer
import urllib2
import re

opener = urllib2.build_opener()

url = 'http://www.bbc.co.uk/news/popular/read'

soup = BeautifulSoup(opener.open(url), "lxml")

titleTag = soup.html.head.title

print(titleTag.string)

tagSpan = soup.find_all("span");

for tag in tagSpan:
    print(tag.get("class"))

我正在寻找的是<span class="most-popular-page-list-item__headline"></span> 之间的字符串

如何获取字符串并列出这些字符串?

【问题讨论】:

x = soup.find_all('span','class':'most-popular-page-list-item__headline') 太棒了,很高兴我能帮上忙! 【参考方案1】:

这个怎么样:

from bs4 import BeautifulSoup
from urllib.request import urlopen

url = 'http://www.bbc.co.uk/news/popular/read'

page = urlopen(url)
soup = BeautifulSoup(page, "lxml")
titles = soup.findAll('span', 'class': "most-popular-page-list-item__headline")
headlines = [t.text for t in titles]

【讨论】:

以上是关于Python:通过 BeautifulSoup 搜索单个标签 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

使用 urllib 和 BeautifulSoup 通过 Python 从 Web 检索信息

Python:通过 BeautifulSoup 搜索单个标签 [重复]

Python爬虫教程-25-数据提取-BeautifulSoup4

python--BeautifulSoup

使用python抓取并分析数据—链家网(requests+BeautifulSoup)(转)

Python:使用 BeautifulSoup 库抓取百度天气