有些类不会在Python Web抓取中被删除

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了有些类不会在Python Web抓取中被删除相关的知识,希望对你有一定的参考价值。

http://finance.daum.net/item/main.daum?code=052400

**这是一个韩国金融门户网站,显示一家名为“Kona i”的韩国公司的股票信息

我是初学者,刚开始用Python学习网络抓取。我试图用BS来削减这种股票的价格。在网页中,标签和股票价格的类别分别为“curPrice up”。所以我在选择器部分放了“em.curPrice up”。当我打印它时,只想出一个空列表。它有什么问题?

price = requests.get("http://finance.daum.net/item/main.daum?code=052400")
html = bs(price.text, "lxml")
current_price = html.select("em.curPrice up")
答案

你在html中寻找的元素似乎就是这个。

Kakao Corp.

<em class="curPrice up">19,450</em> 的html选择器将em.curPrice up与curPrice类匹配,然后找到一个子元素<em>

您应该将选择器修改为<up>

以上是关于有些类不会在Python Web抓取中被删除的主要内容,如果未能解决你的问题,请参考以下文章

python Web抓取selenium模块的使用

为啥我的行不会在数据工厂中被删除?

在 Python3 中使用 request_html 和 BeautifulSoup 使用 select/option 抓取 Web 数据

Scrapy spider不会在start-url列表上进行迭代

使用 VBA 从 Web 抓取数据时无法获取准确的元素类表

python web抓取并将数据写入csv