如何避免程序终止urllib2.httperror 404错误并显示相应的消息

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何避免程序终止urllib2.httperror 404错误并显示相应的消息相关的知识,希望对你有一定的参考价值。

我正在从100k系统URL中抓取内容(example.com/entry/1> example.com/entry/100000)。

但是,大约10%的URL已被删除,这意味着当脚本到达它们时,它会给出错误“urllib2.httperror http error 404”并停止运行。

我对python比较陌生,想知道是否有办法做这样的事情:

if result == error:
    div_text = "missing"

这样循环可以继续到下一个URL,但请注意它失败了。

答案

urllib2.HTTPError是Python提出的一个例外。您可以使用try / except块包装URL调用:

try:
    # ... put your URL open call here ... 
except urllib2.HTTPError:
    div_text = 'missing'

这样,如果再次遇到此异常,Python解释器将运行除块之外的代码。

以上是关于如何避免程序终止urllib2.httperror 404错误并显示相应的消息的主要内容,如果未能解决你的问题,请参考以下文章

urllib2.HTTPError:HTTP 错误 401:未经授权

python: urllib2.HTTPError: HTTP 错误 405: 方法不允许

覆盖 urllib2.HTTPError 或 urllib.error.HTTPError 并读取响应 HTML

Python 2.7 urllib2 在使用 xml 内容点击重定向时引发 urllib2.HTTPError 301

urllib2.HTTPError: HTTP Error 403: Forbidden 解决方法

python urllib2导出elasticsearch数据时 返回 "urllib2.HTTPError: HTTP Error 500: Internal Server Error&q