如何从 hive 或 impala 读取 Hbase 当前和以前版本的数据?

Posted

技术标签:

【中文标题】如何从 hive 或 impala 读取 Hbase 当前和以前版本的数据?【英文标题】:how to read Hbase current and previous versions of data from hive or impala? 【发布时间】:2016-05-12 05:02:18 【问题描述】:

我想从 Hive 或 Impala 读取 Hbase 当前和以前版本的数据。在我最初的研究中,我发现只能从 Hive 访问当前版本。那么,目前有没有办法从 hive 或 Impala 中检索旧版本?

【问题讨论】:

似乎 hive 和 impala 都无法查看以前版本的单元格数据。请。看我的回答。 我的回答有用吗?你还有什么发现吗? 【参考方案1】:

在 Hive 的情况下: 请看this

似乎不可能在 Hive 中获得同一单元的不同版本(即使 Hbase 具有同一单元的多个版本),它总是返回具有最新时间戳的单元。我相信我们可以在战术上处理这个问题。我们可以将以前的版本附加到 Hbase 行键或作为单独的单元格(名称、值)在 Impala 的情况下: 请参阅limitations部分

【讨论】:

以上是关于如何从 hive 或 impala 读取 Hbase 当前和以前版本的数据?的主要内容,如果未能解决你的问题,请参考以下文章

Cloudera Impala:它如何从 HDFS 块中读取数据?

从 Hive 或 Webhdfs 运行 Impala Refresh

如何使用 impyla 连接到 impala 或使用 pyhive 连接到 hive?

如何对 hdfs 中的数据进行加密,然后创建 hive 或 impala 表进行查询?

如何从 Spark Structured Streaming 刷新 Hive/Impala 表?

hive 或 impala 中的计算表统计信息如何加速 Spark SQL 中的查询?