有些类不会在Python Web抓取中被删除
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了有些类不会在Python Web抓取中被删除相关的知识,希望对你有一定的参考价值。
http://finance.daum.net/item/main.daum?code=052400
**这是一个韩国金融门户网站,显示一家名为“Kona i”的韩国公司的股票信息
我是初学者,刚开始用Python学习网络抓取。我试图用BS来削减这种股票的价格。在网页中,标签和股票价格的类别分别为“curPrice up”。所以我在选择器部分放了“em.curPrice up”。当我打印它时,只想出一个空列表。它有什么问题?
price = requests.get("http://finance.daum.net/item/main.daum?code=052400")
html = bs(price.text, "lxml")
current_price = html.select("em.curPrice up")
答案
你在html中寻找的元素似乎就是这个。
Kakao Corp.
<em class="curPrice up">19,450</em>
的html选择器将em.curPrice up
与curPrice类匹配,然后找到一个子元素<em>
您应该将选择器修改为<up>
以上是关于有些类不会在Python Web抓取中被删除的主要内容,如果未能解决你的问题,请参考以下文章
在 Python3 中使用 request_html 和 BeautifulSoup 使用 select/option 抓取 Web 数据