列式数据库比较和 DBA 工作

Posted

技术标签:

【中文标题】列式数据库比较和 DBA 工作【英文标题】:Columnar Database Comparisons and DBA efforts 【发布时间】:2013-07-01 21:07:17 【问题描述】:

我正在尝试寻找一种数据库解决方案,我发现 InfobrightAmazon Redshift 作为潜在的解决方案。两者都是柱状数据库。 Infobright 已经存在了很长一段时间,而 Amazon Redshift 是较新的。

    Infobright 和 Amazon Redshift 之间的DBA 工作是什么? Infobright(API、查询接口等)与 AWS 的可访问性如何? 两者在您的系统架构中处于什么位置?是否作为传统 RDBMS 之上的一个层进行操作? 为设置 Infobright 和 Redshift 所做的 DevOps 工作是什么?

我更倾向于 Redshift,因为我的应用程序托管在 AWS 上,我认为从长远来看这会带来实实在在的好处,因为一切都在 AWS 中。提前谢谢!

【问题讨论】:

【参考方案1】:

首先,我承认我为 Infobright 工作。我对 Redshift 做了重要的研究,我觉得我可以给出一个诚实的意见。我刚刚写了两种技术之间的比较;可以在这里找到:https://www.infobright.com/wp-content/plugins/download-monitor/download.php?id=37

    DBA 工作 - Infobright 几乎不需要管理。你不能索引;你不需要分区/等。它是一种 SMP 架构,可扩展性很好。因此,您不会处理多个节点。 Redshift 也相当简单。您将需要维护排序并确保运行足够的分析。

    Infobright 使用 mysql Shell。因此,任何可以利用 MySQL 的工具都可以利用 Infobright。因此,Infobright 的工具/接口/API 与 MySQL 相同。 AWS 确实有一个 SQL 接口,并且它确实有一些 API 功能。它确实需要您直接从 S3 加载。 Infobright 从本地或远程服务器的平面文件和命名管道加载。

    两个数据库都是分析数据库。您不想将它们用作事务数据库。相反,您通常将数据从事务系统推送到分析数据库。

    设置 Infobright 的 DevOps 将低于 Redshift。然而,Redshift 也没有那么复杂。不过,维护环境对 Redshift 来说更重要。

Infobright 确实有许多特定于 AWS 的安装。事实上,我们已经在一台服务器上实现了接近 100TB 的原始存储。也就是说,具有许多节点的 Redshift 可以在实现上实现 PB 级规模。

还有其他因素会影响您的选择。例如,Redshift 已经内置了非常好的故障转移/HA 选项。另一方面,Infobright 可以支持许多并发查询和用户;无论集群大小如何,Redshift 都将查询限制为 15 个。

查看文档,如果您对任一技术有任何具体问题,请随时与我联系。

【讨论】:

以上是关于列式数据库比较和 DBA 工作的主要内容,如果未能解决你的问题,请参考以下文章

为什么大数据分析系统大都用列式存储?看了这篇文章你就知道了

数据库自动化运维实践

数据库自动化运维实践

Hbase与Oracle比较(列式数据库与行式数据库)

DBA系列技术干货 | 数据库维护

什么是列式数据库?