403 Forbidden - 从谷歌的图片搜索中获取网址

Posted

技术标签:

【中文标题】403 Forbidden - 从谷歌的图片搜索中获取网址【英文标题】:403 Forbidden - get url from images search from google 【发布时间】:2014-03-23 14:33:03 【问题描述】:

用google搜索引擎寻找我的网站图片获取以下链接:

   http://www.rionegro.com.ar/diario/funciones/binario/imagen.aspx%3Fidart%3D380098%26idcat%3D9862%26idcon%3D1087449%26resolucion%3D1%26tipo%3D2?

如您所见,网址有特殊字符,但我认为应该不是问题。

在搜索结果中没有显示图像,而是显示以下错误:

403 禁止

我检查了 firefox 的萤火虫,我得到以下信息:

Response Headers
HTTP/1.1 403 Forbidden
Content- Length: 0
Server : Microsoft-IIS/7.5
X -Powered -By : ASP.NET
Date: Fri, 21 February 2014 20:53:02 GMT

请求标头 GET /diario/funciones/binario/imagen.aspx%3Fidart%3D380098%26idcat%3D9862%26idcon%3D1087449%26resolucion%3D1%26tipo%3D2 HTTP/1.1 主持人:www.rionegro.com.ar 用户代理:Mozilla/5.0(Windows NT 6.1;WOW64;rv:27.0)Gecko/20100101 Firefox/27.0 接受:text/html、application/xhtml+xml、application/xml; q = 0.9 , * / * , q = 0.8 接受- 语言: en -ar , is , q = 0.8 , en-us ; q = 0.5, 在 , q = 0.3 接受-编码:gzip,放气 饼干:__utma = 194708910.1295956645.1392158205.1392994869.1393012210.13; __utmz=194708910.1392413045.7.2.utmcsr=200.32.2.69|utmccn=(推荐)|utmcmd=推荐|utmcct=/diario/inicio.aspx; _cb_ls = 1; _chartbeat2 = qdoy9rkh40fmppme.1392162975510.1392982793966.11011111011; _chartbeat_uuniq = 2 连接:keep -alive 缓存控制:max -age = 0

如果我在搜索中输入带有特殊字符的正确网址:

http://www.rionegro.com.ar/diario/funciones/binario/imagen.aspx?idart=380098&idcat=9862&idcon=1087449&resolucion=1&tipo=2?

搜索结果正确,带上图片。

有人可以帮我解决问题,因为谷歌返回了我上面提到的文本开头的url。

【问题讨论】:

Batch searching on google : 403 error 的可能副本 【参考方案1】:

你有read the documentation吗? RFC 2616,超文本传输​​协议 -- HTTP/1.1 说,§10.4.4; 关于 HTTP 状态 403 Forbidden 有这样的说法:

10.4.4 403 禁止

服务器理解请求,但拒绝执行。授权不会 帮助和请求不应重复。如果请求方法不是 HEAD 并且 服务器希望公开请求未完成的原因,它应该描述 实体拒绝的原因。如果服务器不希望这样做 客户端可用的信息,则可以使用状态码 404(未找到)。

几乎可以肯定,Google 已经检测到您对其搜索结果的抓取,并拒绝了您的请求。

您需要从他们那里获取 API 密钥 (for which see this answer)

另见

Why does Google Search return HTTP Error 403? Batch searching on google : 403 error

【讨论】:

【参考方案2】:

如果您的请求超出了您的可用配额,服务器将返回 HTTP 403 状态。见以下链接

Google Places Photo Api

【讨论】:

以上是关于403 Forbidden - 从谷歌的图片搜索中获取网址的主要内容,如果未能解决你的问题,请参考以下文章

如何从谷歌的材料设计图标外观中删除间距?

403 Forbidden - 无法解决,搜索高低

JavaScript 如果失败则从谷歌的CDN中获取jQuery库然后拉取本地版本

HTML 正确的方法从谷歌的CDN加载jQuery,必要时回退到本地库

401 Unauthorized vs 403 Forbidden:当用户没有登录时,哪个是正确的状态码? [复制]

百度和谷歌的收录