javascript 抓取已经结构化的网页内容(.entry含量,可调整),将HTML转成纯文字格式并输出,使用jQuery的。

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了javascript 抓取已经结构化的网页内容(.entry含量,可调整),将HTML转成纯文字格式并输出,使用jQuery的。相关的知识,希望对你有一定的参考价值。

function getContent(str) {
  return str.replace(/<[^>]+>/g,"");
};
getContent($('.entry-content').html());

以上是关于javascript 抓取已经结构化的网页内容(.entry含量,可调整),将HTML转成纯文字格式并输出,使用jQuery的。的主要内容,如果未能解决你的问题,请参考以下文章

使用 Python 抓取网页动态内容(动态 HTML/Javascript 表格)

javascript 使用phantomjs和horseman抓取并抓取包含ajax内容的网页

用于 javascript 生成内容的 Python 网页抓取

使用javascript呈现的内容从网页抓取数据

使用 python 抓取网页动态内容

抓取javascript生成的网页