使用 Selenium 获取整个页面的内容 [重复]
Posted
技术标签:
【中文标题】使用 Selenium 获取整个页面的内容 [重复]【英文标题】:Get contents of entire page using Selenium [duplicate] 【发布时间】:2013-04-13 09:57:32 【问题描述】:使用 Selenium 实现浏览器自动化 (Python)。
如果我理解正确,将使用以下代码
inputElement = driver.find_element_by_name("q")
the_text = inputElement.text
我将如何获取整个页面上的文本而不是查看特定元素?
【问题讨论】:
driver.find_element_by_name('body').text
?
如果 html 格式错误怎么办?
您使用的是 DOM,而不是 HTML。浏览器非常宽松,会尝试理解 HTML。
嗯,好的。这不包括 HEAD 部分吗?
不应该。 <head>
不应该在 <body>
中。
【参考方案1】:
看起来整个页面文本都可以在以下位置找到:
driver.page_source
【讨论】:
以上是关于使用 Selenium 获取整个页面的内容 [重复]的主要内容,如果未能解决你的问题,请参考以下文章
如何在 selenium 驱动程序中获取整个页面的 innerHTML?
如何使用 Selenium/Python 获取由 JavaScript 编写的 html 内容 [重复]
如何使用Selenium Webdriver捕获特定元素而不是整个页面的屏幕截图?