“order by”的 Hive、Impala、HBASE 和 SQL 比较

Posted

技术标签:

【中文标题】“order by”的 Hive、Impala、HBASE 和 SQL 比较【英文标题】:Comparison on Hive, Impala, HBASE and SQL for "order by" 【发布时间】:2014-09-10 16:23:10 【问题描述】:

我对 hive、impala、HBASE 完全陌生。我正在做一些全文搜索应用程序。我在 oracle 平台上的 SQL 中使用 order by 对相关性进行排序是一个痛苦的步骤。想知道我在 hadoop 生态系统中更改它是否会有所帮助。希望有人可以帮助解决这个问题。 提前致谢。

【问题讨论】:

【参考方案1】:

如果您想在 Hadoop 中使用全文搜索,您应该考虑使用Apache Solr(如果您使用 Cloudera,则为Cloudera Search)

【讨论】:

谢谢,圣地亚哥。您是否针对 Solr 进行了全文搜索。如果有,数据库有多大,Solor 中的效率如何? 我已经将 solr 与 Cloudera 一起使用并且效果很好。我们谈论的是 100s Gb 数据集。主要问题是您需要在架构更改时重新索引。

以上是关于“order by”的 Hive、Impala、HBASE 和 SQL 比较的主要内容,如果未能解决你的问题,请参考以下文章

Hive中sort by,order by,cluster by,distribute by总结

Hive中的Order by与关系型数据库中的order by语句的异同点

Hive Order By操作

Hive之cluster by , distribute by,order by,sort by

hive的 order by & distribute by & cluter by

hive中order by,sort by, distribute by, cluster by的用法