Google 域的 YQL“重定向到 robots.txt 受限 URL”错误

Posted

技术标签:

【中文标题】Google 域的 YQL“重定向到 robots.txt 受限 URL”错误【英文标题】:YQL "Redirected to a robots.txt restricted URL" Error for Google Domain 【发布时间】:2012-03-01 07:30:24 【问题描述】:

我正在使用 YQL 控制台,我想从这个 link in Google Shopping 返回结果

在 YQL 中使用以下内容:

  select content from html where url="www.google.com/products/seller?hl=en&q=burkett+restaurant+equipment+reviews&tbo=u&tbm=shop&zmi=basequipment.com&cmi=12986189937115136" and xpath="//body"

这是说:

重定向到 robots.txt 受限网址

并且不会显示任何结果,有什么办法可以解决这个问题?

【问题讨论】:

谷歌ask bots not to touch that data 和雅虎!尊重他们的要求。所以不应该有解决这个问题的技术方法。我希望他们的条款和条件也禁止您以这种方式访问​​数据,因此您的法律依据也很不稳定。 【参考方案1】:

您可以使用打开的表:

http://developer.yahoo.com/yql/console/?q=show%20tables&env=store://datatables.org/alltableswithkeys#h=select%20content%20from%20data.headers%20where%20url%3D%22www.google.com/products/seller%3Fhl%3Den%26q%3Dburkett+restaurant+equipment+reviews%26tbo%3Du%26tbm%3Dshop%26zmi%3Dbasequipment.com%26cmi%3D12986189937115136%22

【讨论】:

以上是关于Google 域的 YQL“重定向到 robots.txt 受限 URL”错误的主要内容,如果未能解决你的问题,请参考以下文章

返回雅虎!摄氏天气 API 数据,使用 YQL

即使请求了 format=json,YQL 也会返回 application/javascript

jQuery YQL 从 rss 变量中选择

数星星

用于执行javascript的YQL开放表模板

带有特定域的 Spring Boot 的 Google 社交登录