技术适合大数据的分布式存储与计算平台—Hadoop

Posted 2021-04-13 云创大数据

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了技术适合大数据的分布式存储与计算平台—Hadoop相关的知识，希望对你有一定的参考价值。

【技术】适合大数据的分布式存储与计算平台—Hadoop

【技术】适合大数据的分布式存储与计算平台—Hadoop

适合大数据的分布式存储与计算平台！

官方版本(1.1.2)

使用下载最多的版本，稳定，有商业支持，在Apache的基础上打上了一些patch。推荐使用。

Yahoo内部使用的版本，发布过两次，已有的版本都放到了Apache上，后续不在继续发布，而是集中在Apache的版本上。

能可靠地(reliably)存储和处理千兆字节(PB)数据。

可以通过普通机器组成的服务器群来分发以及处理数据，这些服务器群总计科大数千个节点。

通过分发数据，hadoop可以在数据所在的节点上并行地(parallel)处理它们，这样就使得处理非常的快速。

Hadoop能自动地维护数据的多份副本，并且在任务失败后能自动地重新部署(redeploy)计算任务。

以上是关于技术适合大数据的分布式存储与计算平台—Hadoop的主要内容，如果未能解决你的问题，请参考以下文章