如何在 python 中使用 selenium 下载 pdf 文件

Posted

技术标签:

【中文标题】如何在 python 中使用 selenium 下载 pdf 文件【英文标题】:How to download pdf files using selenium in python 【发布时间】:2018-11-13 14:52:19 【问题描述】:

我正在尝试使用 selenium 从网站下载 pdf 文件,但我能够打开文件,但无法使用代码自动下载。

代码:

chrome_profile = webdriver.ChromeOptions()
profile = "download.default_directory": "C:\Users\Downloads",
   "download.prompt_for_download": False,
   "download.directory_upgrade": True,
   "plugins.plugins_disabled": ["Chrome PDF Viewer"]
chrome_profile.add_experimental_option("prefs", profile)

请提出建议。提前谢谢你

【问题讨论】:

你用的是哪个浏览器? @Prany,谷歌浏览器 【参考方案1】:

这样问题就解决了:

prefs = "plugins.always_open_pdf_externally": True
chromeOptions.add_experimental_option("prefs",prefs)
chromedriver = "\path\chromedriver.exe"
driver = webdriver.Chrome(executable_path=chromedriver, chrome_options=chromeOptions)

【讨论】:

【参考方案2】:

把它放在代码的配置文件部分,它会禁用 chrome PDF 查看器并触发自动下载

"plugins.plugins_disabled": ["Chrome PDF Viewer"]

【讨论】:

以上是关于如何在 python 中使用 selenium 下载 pdf 文件的主要内容,如果未能解决你的问题,请参考以下文章

如何在没有chromedriver selenium python的情况下完全使用普通chrome不重复

Selenium 之 Mac 环境下 Python 安装 selenium 踩坑记录

如何在 Python 中使用 Selenium WebDriver 获取文本

如何在Python中使用Selenium

如何在一个选项卡中使用 Selenium 和 Python 逐一运行测试?

如何在 Python Scraping 中使用 beautifulsoup 和 selenium 识别类名或 id