Selenium 和 Goodreads 的分页

Posted

技术标签:

【中文标题】Selenium 和 Goodreads 的分页【英文标题】:Selenium and Goodreads' pagination 【发布时间】:2017-11-11 09:33:48 【问题描述】:

我正在尝试从 Goodreads 中提取信息。问题是如果我进入如下网址:

https://www.goodreads.com/shelf/show/programming?page=2

使用 Selenium chrome webdriver 或 BeautifulSoup,它仍然显示第一页,而不是第二页。 使用 chrome 网络驱动程序的示例:

在普通浏览器上,它会显示这些书籍:

【问题讨论】:

【参考方案1】:

看起来发生这种情况是因为您没有在 selenium 会话中登录,您必须在重新启动之间登录并保存 cookie。

查看this *** 的答案以了解如何提取 cookie。

【讨论】:

有趣。谢谢!

以上是关于Selenium 和 Goodreads 的分页的主要内容,如果未能解决你的问题,请参考以下文章

使用Java查找Selenium WebDriver中的分页表中的行数

加入模板和视图的分页

简单说下 Winform 的分页快速开发框架必须要实现的几个功能之一

摆脱报告中的分页符

分库分表后的分页查询

Django的分页