node.js 爬虫以及数据导出到excel

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了node.js 爬虫以及数据导出到excel相关的知识,希望对你有一定的参考价值。

//server.js
1
var http = require(‘http‘), 2 url = require("url"), 3 superagent = require("superagent"), 4 cheerio = require("cheerio"), 5 async = require("async"), 6 eventproxy = require(‘eventproxy‘), 7 fs = require("fs"), 8 nodeExcel = require(‘excel-export‘), 9 querystring = require(‘querystring‘); 10 11 exports.start=function() { 12 //request 客户端的HTTP请求 //response服务器端的HTTP回应 13 function onReqoest(req,response){ 14 // 设置字符编码(去掉中文会乱码,回应) 15 response.writeHead(200, {‘Content-Type‘: ‘text/html;charset=utf-8‘}); 16 superagent 17 .get(‘https://list.yohobuy.com/boys-new/‘) 18 .set(‘Accept‘,‘application/json‘) 19 .end(function(err,pres){ 20 var startDate = new Date(); 21 //常规错误处理 22 if (err) { 23 console.log(1) 24 return; 25 } 26 var html=pres.text; 27 var chapterData; 28 var chapter = crawlerChapter(html);//2 29 //console.log(chapter); 30 console.log(chapter); 31 function crawlerChapter(html) { 32 var $ = cheerio.load(html); 33 var chapters = $(‘.good-info‘); 34 var data1 = []; 35 chapterData = { 36 imgUrl:[], 37 biaoti: [], 38 price:[] 39 }; 40 $(‘.good-detail-img‘).each(function(i, elem) { 41 chapterData.imgUrl[i] = $(this).text(); 42 }); 43 $(‘.good-detail-text>a‘).each(function(i, elem) { 44 chapterData.biaoti[i] = $(this).text().trim(); 45 }); 46 $(‘.good-detail-text .price .market-price‘).each(function(i, elem) { 47 chapterData.price[i] = $(this).text().trim(); 48 }); 49 }; 50 var conf= {},temp=[]; 51 conf.cols =[ 52 {caption:‘标题‘, 53 type:‘string‘}, 54 {caption:‘价格‘, 55 type:‘string‘}, 56 {caption:‘图片地址‘, 57 type:‘string‘} 58 ]; 59 for(var i=0; i<chapterData.biaoti.length;i++) { 60 var buffer = [chapterData.biaoti[i], chapterData.price[i]]; 61 console.log(buffer); 62 temp.push(buffer); 63 } 64 conf.rows=temp; 65 var result = nodeExcel.execute(conf); 66 var random = Math.floor(Math.random()*10000+0);//用来保证生成不同的文件名 67 var filePath ="fi" + random + ".xlsx"; //文件名 68 fs.writeFile(filePath, result, ‘binary‘,function(err){ 69 if(err){ 70 console.log(err); 71 } 72 }); 73 }); 74 } 75 http.createServer(onReqoest).listen(3500); 76 }
//app.js
var
server = require("./server"); //node js创建了一个模块 server.start();

第一次写,随便找个网页,然后就好了!!!

大家有什么意见一定发表噢。。。。,我要进步呀!。



 





以上是关于node.js 爬虫以及数据导出到excel的主要内容,如果未能解决你的问题,请参考以下文章

jsp程序再linux下运行数据库导出excel文件,导不出,界面一片空白,windows下运行导出exel文件可以

node读写Excel操作

Node.js(十三)——Promise重构爬虫代码

nodejs中间件xlsx.js导出excel文件使用方法封装(原创)

Vue小模块之功能全面的表格表格数据的Excel导出

node.js爬虫杭州房产销售及数据可视化