ruby 基本Web Scraper

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ruby 基本Web Scraper相关的知识,希望对你有一定的参考价值。

require 'selenium-webdriver'

options = Selenium::WebDriver::Chrome::Options.new(args: ['headless'])
driver = Selenium::WebDriver.for(:chrome, options: options)

driver.get('http://jquery.com/')

# element = driver.find_element(css: 'article header h2')

# puts driver.title
# puts element.text.strip

# driver.find_element(link_text: 'Random article').click

# puts driver.page_source

# element = driver.find_element(name: 'q')
# element.send_keys('passport')
# element.submit

# results = driver.find_element(id: 'results')

# results.find_elements(tag_name: 'h3').each do |h3|
#   puts h3.text.strip
# end

version = driver.execute_script('return jQuery.fn.jquery')

puts "Using jQuery #{version}"

driver.quit

以上是关于ruby 基本Web Scraper的主要内容,如果未能解决你的问题,请参考以下文章

ruby Scraper.rb

ruby simpledesktops_scraper.rb

简易数据分析 09 | Web Scraper 自动控制抓取数量 & Web Scraper 父子选择器

python Web Image Scraper

json 用于Micro Web Scraper配置文件的JSONSchema

使用web scraper抓取分页内容