以下使用 Hadoop 生态系统的用例的最佳方法是啥？

Posted 2023-04-18

技术标签:

【中文标题】以下使用 Hadoop 生态系统的用例的最佳方法是啥？【英文标题】：Which is the best approach for the below use case using Hadoop ecosystem?以下使用 Hadoop 生态系统的用例的最佳方法是什么？ 【发布时间】：2016-03-24 09:51:06 【问题描述】：

我通过 restservice 从 1000 多个传感器单元获取数据到我的 Web 服务器，我将这些传感器数据写入单个文件。我通过 Flume 将这些传感器数据存储到 HDFS。通过 PIG、Hive 和 MR，我正在分析数据并将其存储回 HDFS 4。分析后，我将通过 Sqoop 写回 RDBMS。请指导我我是否遵循正确的方法？

【问题讨论】：

听起来不错，您是在存储结果之前在 PIG 中进行地图缩减，对吧？是的，先生，感谢我们的宝贵意见。 【参考方案1】：

我认为该管道没有任何问题，如果它满足您的需求......您就是黄金。

你可能想读一些关于 Kafka 的文章；也许谷歌“Kafka vs. Flume”。根据您的限制，您可能会发现 Kafka 很有吸引力。

【讨论】：

是的，先生，感谢我们的宝贵意见。

以上是关于以下使用 Hadoop 生态系统的用例的最佳方法是啥？的主要内容，如果未能解决你的问题，请参考以下文章

我的用例的最佳代理解决方案是啥？

Linux文件系统的用例建模

使用postman做接口自动化测试，如何设置执行某个用例前先执行指定的用例（除了用复制用例的方法）

NoSQL 的用例 [关闭]

优秀测试用例的设计策略

Elasticsearch集成Hadoop最佳实践.pdf（内含目录）