ruby 使用带有Mechanize的Pismo gem从网页中提取内容。来自http://stackoverflow.com/questions/14283974/what-ruby-gem-pro

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ruby 使用带有Mechanize的Pismo gem从网页中提取内容。来自http://stackoverflow.com/questions/14283974/what-ruby-gem-pro相关的知识,希望对你有一定的参考价值。

agent = WWW::Mechanize.new
agent.get("http://www.awesomeblog.com/amazing-article")

scraper.text = MyScraper.new(:text => Pismo::Document.new(agent.url))

while agent.page.link_with("rel='next'").click do
  pismo_doc = Pismo::Document.new(agent.url)
  scraper.text << pismo_doc.lede
end

scraper.save!

以上是关于ruby 使用带有Mechanize的Pismo gem从网页中提取内容。来自http://stackoverflow.com/questions/14283974/what-ruby-gem-pro的主要内容,如果未能解决你的问题,请参考以下文章

ruby 使用CLI的Magento DB修复工具 - Ruby + Mechanize

ruby 使用Mechanize的Hacky爬虫

无法使用 Ruby Mechanize 登录亚马逊

ruby 使用docs提供的代码测试Mechanize gem

如何配置 Ruby Mechanize 代理以通过 Charles Web 代理工作?

在Ruby中满足条件时强制Mechanize返回HTTP Success