superagent抓取gb2312网页出来是十六进制的解决办法

Posted white_0710

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了superagent抓取gb2312网页出来是十六进制的解决办法相关的知识,希望对你有一定的参考价值。

var htmlentities = {
    encode: function(str) {
            var buf = [];
            
            for (var i=str.length-1;i>=0;i--) {
                buf.unshift([\'&#\', str[i].charCodeAt(), \';\'].join(\'\'));
            }
            
            return buf.join(\'\');
        },
    decode: function(str) {
            return str.replace(/&#(\\d+);/g, function(match, dec) {
                return String.fromCharCode(dec);
            });
        }
}

 

以上是关于superagent抓取gb2312网页出来是十六进制的解决办法的主要内容,如果未能解决你的问题,请参考以下文章

用python抓取的网页保存后为啥乱码?

node爬虫解决网页编码为gb2312结果为乱码的方法

delphi7 用 idhttp.get 抓取网页显示乱码

如何解决用 Beautiful Soup 抓取网页却得到乱码的问题

怎样把utf-8编码网页 转换为gb2312

php中抓取网页内容的代码