了解 Hbase 中新添加/更新行的最佳策略

Posted

技术标签:

【中文标题】了解 Hbase 中新添加/更新行的最佳策略【英文标题】:Best strategy for knowing newly added/updated rows in Hbase 【发布时间】:2014-08-03 08:11:48 【问题描述】:

我需要知道 HBase 表中新添加/更新/删除的行是什么。 考虑我有一个单独的表,我在其中维护这个更改列表(即已更改的键),并且有一个标志告诉这是一个更改的行(0 - 已更改,1 - 已处理更改的行)。

还有另一个进程对了解更改的行感兴趣,一旦它处理了这些行,它就会将这些行更新为 1。 在 hbase 中执行此操作的最佳策略是什么?

【问题讨论】:

【参考方案1】:

在插入行时,如果将时间戳设置为当前日期,则可以使用 TimestampFilter 查找新添加的行。要跟踪特定行键/值的更改,您可以使用 hbase 的版本功能。

【讨论】:

以上是关于了解 Hbase 中新添加/更新行的最佳策略的主要内容,如果未能解决你的问题,请参考以下文章

Bulk Load-HBase数据导入最佳实践

markdown 34 - 了解React的DOM更新策略

用于报告的 Hive 或 HBase?

HBase最佳实践-CMS GC调优(从gc本身参数调优)

需要了解passport.js本地策略

基于WPS的Word最佳实践系列(目录的插入及更新)