NodeJS: 处理request网页乱码问题

Posted IWS

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NodeJS: 处理request网页乱码问题相关的知识,希望对你有一定的参考价值。

对于gb2312编码的网页,直接用request去获取会得到乱码的结果,解决方法很简单:

1. npm install iconv-lite

2. var iconv = require(‘iconv-lite‘);

3. 

request.get({
    url : url ,
    encoding : null //让body 直接是buffer
}, response);

4. 

var response = function (err, response, body) {
    //返回的body 直接就是buffer 了...
    var buf =  iconv.decode(body, ‘gb2312‘);
    ...
    ...
}

done.

以上是关于NodeJS: 处理request网页乱码问题的主要内容,如果未能解决你的问题,请参考以下文章

nodejs单页面爬虫--解决编码问题

爬虫requests爬去网页乱码问题

python(27)requests 爬取网页乱码,解决方法

python爬虫中文乱码解决方法

爬虫rewquests爬去网页乱码问题

python爬虫抓下来的网页,中间的中文乱码怎么解决