刮取密码保护目录(使用python)

Posted

技术标签:

【中文标题】刮取密码保护目录(使用python)【英文标题】:Scrape password protected directory (with python) 【发布时间】:2017-03-20 14:10:12 【问题描述】:

我有一个受密码保护的目录,里面有很多文件,我正在尝试使用 Python 的 BeautifulSoup 下载这些文件。

问题是因为它只是一个受密码保护的目录并且没有登录表单,我似乎无法像this example那样使用Mechanize?

有人建议吗?

【问题讨论】:

请展示您到目前为止所做的尝试。 SO 不是一个建议论坛。 【参考方案1】:

不需要进行屏幕自动化登录。这是使用 HTTP 身份验证,像 urllib2、urllib3 和 request(构建在 urllib 之上的库)等 HTTP 库都支持。

更简单的是,您可以在 URL 前加上用户名和密码,这就是 HTTP 库在后台所做的。

https://username:password@example.com

【讨论】:

以上是关于刮取密码保护目录(使用python)的主要内容,如果未能解决你的问题,请参考以下文章

Python刮取谷歌财务

python 使用pycurl的cURL Fitbit社区组,使用BeautifulSoup刮取页面,发送给Redis(写入获取数据以创建Fitbit仪表板

Python - 密码保护 Zip 文件夹

为图像和镜像目录刮取.xml文件wget / grep / curl(?)

求助,使用Python合并多个EXCEL表格时,如果表格有密码,密码已知,该怎么通过pandas合并,

python实现替代密码与置换密码