如何将数据从静态网站带到 HDFS?

Posted

技术标签:

【中文标题】如何将数据从静态网站带到 HDFS?【英文标题】:how can i bring data from static websites to HDFS? 【发布时间】:2016-01-07 06:54:36 【问题描述】:

还有哪些其他可用的框架,例如 spring XD、Flume?其中哪一个是最好的;请告知携带数据的步骤。

【问题讨论】:

我需要遵循哪些步骤才能从静态站点获取 hdfs 中的数据。我在 cloudera 有卡夫卡 【参考方案1】: 使用 NUTCH 使用 Kafka 水槽 使用弹簧 xd scraper import.io 生产者消费者的java程序

【讨论】:

以上是关于如何将数据从静态网站带到 HDFS?的主要内容,如果未能解决你的问题,请参考以下文章

如何通过节点 expressjs 从 s3 提供静态网站?

如何从AWS Lambda检索数据并将其显示在AWS S3托管的静态网站上?

真静态和伪静态的区别

如何从数据库中投放混合的静态和动态广告?

如何将数据库中的内容生成静态页面

如何将用 Dash 编写的网站显示为静态 PDF (Python)?