如何使用Python BeautifulSoup刮取ID

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用Python BeautifulSoup刮取ID相关的知识,希望对你有一定的参考价值。

我想使用Python中的BeautifulSoup来抓取div class = size和'ID'值。

<div class="size ">
 <a class="selectVar" id="23333" data="40593232" data-price="13000,00 €" data-tprice="" data-sh="107-42" data-size-original="92" data-eu="92" data-size-uk="5" data-size-us="5.5" data-size-cm="26.5" data-branch-2="1" data-branch-3="1" data-branch-4="1" data-branch-5="1" data-branch-6="1" data-branch-on="1">
  92
 </a>
</div>

我尝试了以下但没有成功:

product = soup.find("div", {'class': 'size ', 'type':'id'})['value']
答案

你走在正确的轨道上。 要获取标记的属性,请使用tag.attrs方法:

# Find the <div> tag 
product_div = soup.find('div', {'class': 'size '})

# Find the <a> tag within the div
product_tag = product_div.find('a')

# Get the 'id' attribute of the <a> tag
product_id = product_tag.attrs['id']

print(product_id) # 23333

以上是关于如何使用Python BeautifulSoup刮取ID的主要内容,如果未能解决你的问题,请参考以下文章

用BeautifulSoup刮Instagram

BeautifulSoup刮表id与python

用漂亮的汤和熊猫刮桌子时如何保留链接

美丽的汤和桌子刮 - lxml 与 html 解析器

Python 使用 Selenium 和 Beautiful Soup 抓取 JavaScript

如何使用Python BeautifulSoup刮取ID