Google Cloud Bigtable 协处理器支持

Posted

技术标签:

【中文标题】Google Cloud Bigtable 协处理器支持【英文标题】:Google Cloud Bigtable coprocessor support 【发布时间】:2015-07-17 13:08:44 【问题描述】:

Google Cloud BigTable 不支持协处理器:

不支持协处理器。你不能创建类 实现接口 org.apache.hadoop.hbase.coprocessor。

https://cloud.google.com/bigtable/docs/hbase-differences

我可以理解协处理器需要在每个 Tablet (RS) 节点上部署客户代码(jar)。尽管如此,Endpoint 协处理器对于 HBase 应用程序在某些情况下确保数据局部性至关重要。 Apache Phoenix 等 HBase 扩展依赖于 Observer 协处理器来维护二级索引,因此缺乏协处理器支持对我来说似乎是一个主要的不兼容领域。

将来是否可能支持协处理器?在 BigTable 平板电脑上执行自定义 Java“存储过程”有哪些解决方法?

更新 1: Apache Phoenix coprosessors 列表:

GroupedAggregateRegionObserver 索引器 MetaDataEndpointImpl MetaDataRegionObserver ScanRegionObserver SequenceRegionObserver ServerCachingEndpointImpl UngroupedAggregateRegionObserver

【问题讨论】:

为什么对这个问题投反对票?该政策说“每当你遇到一个非常草率、不费吹灰之力的帖子时,就使用你的反对票”。那里真的没有太多托管的 BigTable 信息。 这是 cloud-bigtable-discuss@googlegroups.com 列表的一个好问题。但我会转发给团队。 @Les 谢谢。我一天前注册了该列表,所以我也在看。除了 Phoenix(HBase 之上的 SQL 层)之外,我们自己的协处理器主要执行一组额外的删除和压缩(无损和有损压缩)。我们倾向于开发执行相同任务的 MapReduce 作业,以便我们可以按照文档中的说明在 BigTable 集群上运行 M/R 作业。 据我了解,我们不太可能支持自定义协处理器,但我们可能支持特定的通用功能——尽管没有承诺何时支持。表达您的需求的地方是讨论列表。 【参考方案1】:

自 2015 年 6 月 1 日起,不再支持自定义协处理器。

【讨论】:

截至 2017 年 9 月 15 日仍然如此。

以上是关于Google Cloud Bigtable 协处理器支持的主要内容,如果未能解决你的问题,请参考以下文章

抛开价格不谈,为啥要选择 Google Cloud Bigtable 而不是 Google Cloud Datastore?

在 Google Cloud Datastore 与 Google Cloud Bigtable 中存储用户事件历史记录

从 google appengine 数据存储迁移到 google cloud bigtable 的最佳方法是啥?

Google Cloud Bigtable 备份和恢复

Google Cloud Bigtable HBase shell 连接挂起

到 Cloud Bigtable 的 Google Cloud Dataflow 管道中的异常