数据中心的 Amazon S3 替代方案?

Posted

技术标签:

【中文标题】数据中心的 Amazon S3 替代方案?【英文标题】:Alternative to Amazon S3 for the data center? 【发布时间】:2010-10-21 23:38:11 【问题描述】:

我正在寻找一种类似于 Amazon S3 的服务,一种用于存储和检索任意数据(和元数据)的简单服务,但它在您自己的数据中心本地运行。严格来说,我不确定您是否将其称为 CDN 或轻量级 CMS。

它必须是水平可扩展的(存储和带宽)和容错。它还必须支持带有可插入身份验证和授权系统的 REST,最好也支持 WS。对于更方便的集成和可扩展性,使用 Java EE 构建的东西会更可取,但这只是个人喜好,并不是必需的。

建议?

【问题讨论】:

如果它在您的数据中心内,为什么不使用某种 SAN? SAN 只是存储部分(不是吗?)。我正在寻找存储和与之配套的 API:存储和检索任意数据和元数据、安全性等。 【参考方案1】:

以下是我遇到的一些值得进一步研究的开源解决方案:

    Apache Sling(基于 JCR 的 CMS(JSR170、JSR283),RESTful 接口)。 Apache Hadoop(基于 Java 的分布式数据存储,map reduce 功能)。 HBase(建立在 Hadoop 之上,提供类似 Google Bigtable 的功能)。 CouchDB(基于 Erlang 的键/值数据库,具有 Map/Reduce 功能,RESTful 接口)。 Dynomite(基于 Erlang,亚马逊 dynamo 克隆)。 Voldemort(分布式键值存储系统)。 Cassandra(高度可扩展、最终一致、分布式、结构化的键值对存储)。 MongoDB(高度可扩展、基于 JSON 文档的存储)。

【讨论】:

【参考方案2】:

Walrus 项目(大部分与 s3 api 兼容)。 . .

http://open.eucalyptus.com/wiki/EucalyptusStorage_v1.4

【讨论】:

【参考方案3】:

Park place 是 Ruby 中的 S3 克隆。

【讨论】:

我试图找到那个网址。 这看起来很有趣。这个领域真的没有嵌入式 JEE 解决方案吗?必须有(并不是说我对 Ruby 有任何反对,事实上,我可能会秒杀公园的地方)。也许我只是缺少这些类型的解决方案的正确分类和术语,所以它们没有出现在我的搜索中? 可能有,但我不知道。我只知道这本书,因为我正在阅读的一本死树书提到了它【参考方案4】:

除了 Park Place,目前对抗 S3 的唯一其他大玩家是 Nirvanix。 Nirvanix

【讨论】:

以上是关于数据中心的 Amazon S3 替代方案?的主要内容,如果未能解决你的问题,请参考以下文章

将 Paperclip 数据库迁移到 Active Storage Amazon S3

自托管 S3 替代方案 [关闭]

获取存储在 Amazon S3 上的图像的图像高度和宽度

将数据从 Amazon redshift 卸载到 Amazon s3

公共数据集:Amazon Customer Reviews ( s3://amazon-reviews-pds )

如何为 Amazon S3 存储桶配置 SSL