如何在Java应用程序中使用Nutch API?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在Java应用程序中使用Nutch API?相关的知识,希望对你有一定的参考价值。

我想在我的java应用程序中使用Nutch API来从网站抓取pdf链接进行分析,如何在我的java应用程序中使用Nutch jar呢?我能举个例子吗?

答案

首先,您需要通过下载并提取Nutch然后通过发出命令来运行Nutch作为服务器,

bin/nutch startserver

之后,您可以在Java中使用REST客户端,如RestTemplate,并调用所需的API。以下是Nutch提供的所有REST API的文档。

https://wiki.apache.org/nutch/Nutch_1.X_RESTAPI/RunningJobsTutorial

以上是关于如何在Java应用程序中使用Nutch API?的主要内容,如果未能解决你的问题,请参考以下文章

Java分布式爬虫Nutch教程——导入Nutch工程,执行完整爬取

nutch和solr建立搜索引擎基础(单机版)

Nutch 1.x:如何使用 s3a 代替 HDFS?

如何在以伪分布式模式安装的Hadoop中运行Nutch

使用nutch搭建类似百度/谷歌的搜索引擎

使用nutch搭建类似百度/谷歌的搜索引擎