Python:通过 BeautifulSoup 搜索单个标签 [重复]
Posted
技术标签:
【中文标题】Python:通过 BeautifulSoup 搜索单个标签 [重复]【英文标题】:Python: search individual tag through BeautifulSoup [duplicate] 【发布时间】:2016-11-13 22:05:28 【问题描述】:我正在尝试创建一个来自 BBC 阅读量最高的部分的前 10 篇新闻文章列表。我的代码如下:
from bs4 import BeautifulSoup, SoupStrainer
import urllib2
import re
opener = urllib2.build_opener()
url = 'http://www.bbc.co.uk/news/popular/read'
soup = BeautifulSoup(opener.open(url), "lxml")
titleTag = soup.html.head.title
print(titleTag.string)
tagSpan = soup.find_all("span");
for tag in tagSpan:
print(tag.get("class"))
我正在寻找的是<span class="most-popular-page-list-item__headline">
和</span>
之间的字符串
如何获取字符串并列出这些字符串?
【问题讨论】:
x = soup.find_all('span','class':'most-popular-page-list-item__headline') 太棒了,很高兴我能帮上忙! 【参考方案1】:这个怎么样:
from bs4 import BeautifulSoup
from urllib.request import urlopen
url = 'http://www.bbc.co.uk/news/popular/read'
page = urlopen(url)
soup = BeautifulSoup(page, "lxml")
titles = soup.findAll('span', 'class': "most-popular-page-list-item__headline")
headlines = [t.text for t in titles]
【讨论】:
以上是关于Python:通过 BeautifulSoup 搜索单个标签 [重复]的主要内容,如果未能解决你的问题,请参考以下文章
使用 urllib 和 BeautifulSoup 通过 Python 从 Web 检索信息
Python:通过 BeautifulSoup 搜索单个标签 [重复]
Python爬虫教程-25-数据提取-BeautifulSoup4