简单:如何使用 Selenium Webdriver 分离由类名抓取的元素?
Posted
技术标签:
【中文标题】简单:如何使用 Selenium Webdriver 分离由类名抓取的元素?【英文标题】:EASY: How do I separate elements grabbed by class name using Selenium Webdriver? 【发布时间】:2022-01-24 01:20:33 【问题描述】:我从 links.txt 打开两个链接并输出到 names.txt。
我正在尝试删除单词:“FEATURING”并在元素之间添加:“,”。
当前输出:
FEATURING
Arietta AdamsIsiah MaxwellFEATURING
Vanessa VegaRichard Mann
期望的输出:
Arietta Adams, Isiah Maxwell
Vanessa Vega, Richard Mann
我的代码:
one = open("links.txt", "r")
for two in one.readlines():
driver.get(two)
sleep(3)
for element in driver.find_elements_by_class_name('sceneColActors'):
with open("names.txt", "a") as testtxt:
testtxt.write(element.text)
html:
<div class="sceneCol sceneColActors"> == $0
<b>Featuring </b>
<a href="/en/Arietta-Adams/58224" title="Arietta Adams">Arietta Adams</a>
<span class="actorSeparator">, </span>
<a href="/en/Isiah-Maxwell/34204" title="Isiah Maxwell">Isiah Maxwell</a>
Here's a screenshot of the html just in case.
【问题讨论】:
【参考方案1】:我想你应该尝试单独获取a
标签。试试
driver.find_elements_by_css_selector('.sceneColActors a')
而不是
driver.find_elements_by_class_name('sceneColActors')
现在您可以单独获取所有需要的单词,只需在它们之间添加分隔符,
。
【讨论】:
这就是作品。谢谢。以上是关于简单:如何使用 Selenium Webdriver 分离由类名抓取的元素?的主要内容,如果未能解决你的问题,请参考以下文章
如何使用Python避免Selenium Webdriver中的SSL认证错误?