类似 Node.js 的 Jsoup 库 [关闭]

Posted

技术标签:

【中文标题】类似 Node.js 的 Jsoup 库 [关闭]【英文标题】:Jsoup like library for Node.js [closed] 【发布时间】:2016-07-12 06:35:28 【问题描述】:

Node.js 是否有任何 API 可以从 URL 和静态 html 获取和查询 html?

我喜欢用 webscrape 做这样的事情:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

我查看了这个Question 并查看了其中大部分 API,但我没有发现(也许我无法识别)任何如此相似的东西。

【问题讨论】:

【参考方案1】:

Jsdom 可能就是你想要的https://github.com/tmpvar/jsdom 您可以将它与 jquery 结合使用来查询 dom。这是一个关于我如何在我的一个项目中使用它的示例https://github.com/gabesoft/seryth/blob/master/lib/sanitizer.js 您可能还需要request 从网址https://github.com/request/request 获取html

【讨论】:

以上是关于类似 Node.js 的 Jsoup 库 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

KoaHub平台基于Node.js开发的Koa的简单包装到请求库的类似接口

HTMLXML 等 Dom 结点类解析库Jsoup

如何在java中提取网页文本内容? [关闭]

哪些库可用于使用 WritableStream 和 Node.js Readable 等标准流 API 将数据从浏览器流式传输到服务器? [关闭]

Node.js - Redis 教程 [关闭]

在 Node.js 中发送电子邮件? [关闭]