在 Hortownworks 或 YARN 上集成 Nutch

Posted

技术标签:

【中文标题】在 Hortownworks 或 YARN 上集成 Nutch【英文标题】:Integrating Nutch on Hortownworks OR YARN 【发布时间】:2015-03-12 10:18:12 【问题描述】:

我正在尝试抓取网络。最好使用 Nutch。 如果 Hortownworks 开箱即用支持 Nutch,则找不到参考。

有没有人在 YARN 上专门与 Hortonworks HDP 集成了 Nutch? 或者有人尝试在 Hadoop 2.x (YARN) 上集成 Nutch?

提前致谢。

【问题讨论】:

【参考方案1】:

HDP 2.3 不支持开箱即用的 Nutch(HDP 网站上有一张图表显示支持的服务:HDP2.3 What's New)。但是它确实支持 Nutch 所依赖的服务。可以定义自定义 Ambari 服务并将其添加到 HDP 2.3 堆栈定义中,以支持 Nutch。

【讨论】:

以上是关于在 Hortownworks 或 YARN 上集成 Nutch的主要内容,如果未能解决你的问题,请参考以下文章

使用 Google Chrome 或 Safari 在 Mac 上集成 Windows Auth (NTLM)

在 ASP.NET MVC 站点上集成 PayPal 的简单解决方案

在 ASP.NET MVC 站点上集成 PayPal 的简单解决方案

如何在 MapView 上集成雷达叠加?

在角度通用应用程序(nodejs)上集成newrelic

在灯箱上集成网页内容页面