javascript 使用PhantomJS和Aysnc.js的并行爬虫示例

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了javascript 使用PhantomJS和Aysnc.js的并行爬虫示例相关的知识,希望对你有一定的参考价值。

// usage: phantomjs async-phantom.js

var async = require('async'),
links = [
    "http://google.com",
    "http://yahoo.com",
    "http://duckduckgo.com",
    "http://bing.com",
];

function crawler(url, callback) {
    var page = require('webpage').create();
    page.open(url, function (status) {
        console.log( page.evaluate(function(){ return document.title }) );
        page.close();
        callback.apply();
    });
}

async.each(links, crawler, function (err) {
    if (err) console.log(err);
    phantom.exit();
});

以上是关于javascript 使用PhantomJS和Aysnc.js的并行爬虫示例的主要内容,如果未能解决你的问题,请参考以下文章

javascript 使用PhantomJS和Aysnc.js的并行爬虫示例

如何在 PhantomJS 中使用 JavaScript 检测网页上的声音?

javascript 使用phantomjs和horseman抓取并抓取包含ajax内容的网页

使用 javascript (phantomjs) 导航/抓取 hashbang 链接

PhantomJS如何执行Javascript?

使用PhantomJS和node.js保存并呈现网页