大数据-Hbase

Posted

技术标签:

【中文标题】大数据-Hbase【英文标题】:Big Data - Hbase 【发布时间】:2014-02-14 10:36:58 【问题描述】:

我最近开始研究大数据 - Hadoop 技术。我一直在研究 Hbase 命令。我开始在 cloudera virtualbox 平台上工作。我无法执行“快照”命令。

hbase> snapshot 'users','users_snapshot'

我遇到了一个错误

错误: java.io.IOExecption:java.lang.unsupportedOperationException: 要使用快照,必须在 Hbase Master 的 hbase-site.xml 中添加:'hbase.snapshot.enabled' 属性,值为 'true'

其实我加了以下几行

<property>
  <name>hbase.snapshot.enabled</name>
  <value>true</value>
</property>

在/etc/hbase/conf文件夹中获取并保存的hbase-site.xml中。 我已经在 cloudera 管理器中重新启动了 hbase 实例。但仍然得到同样的错误。当我查看 hbase-master 时,它没有在 hbase 配置文件中显示此属性。请任何机构都可以帮助我解决这个问题。

谢谢 双头

【问题讨论】:

请任何人告诉我“快照”命令在 Hbase (Big Data-hadoop) 中的工作原理。我需要知道运行此命令所需的配置...谢谢 【参考方案1】:

如果是 CDH,HBase 配置配置文件,'etc/hbase/conf' 中的 'hbase-site.xml' 不是由 hbase 服务器进程使用,而是由 HBase shell 等 hbase 客户端使用。来自Cloudera Manager Manual,

管理员有时会惊讶于修改 /etc/hadoop/conf 然后重新启动 HDFS 没有效果。这是因为由 Cloudera Manager 启动的服务实例不会从默认位置读取配置。以 HDFS 为例,当不由 Cloudera Manager 管理时,每个主机通常会有一个 HDFS 配置配置,位于 /etc/hadoop/conf/hdfs-site.xml。服务器端守护进程和客户端运行在相同的主机都将使用相同的配置。

Cloudera Manager 区分服务器和客户端配置。对于 HDFS ,文件 /etc/hadoop/conf/hdfs-site.xml 仅包含与 HDFS 客户端相关的配置。也就是说,默认情况下,如果您运行需要与 Hadoop 通信的程序,它将从该目录中获取 NameNode 和 JobTracker 的地址以及其他重要配置。 /etc/hbase/conf 和 /etc/hive/conf 采用了类似的方法

由于您使用的是Cloudera VM,建议您使用“Cloudera Manager”修改hbase的相应配置。这个已经讨论过了here

【讨论】:

以上是关于大数据-Hbase的主要内容,如果未能解决你的问题,请参考以下文章

学习笔记大数据原理与技术 —— HBase大数据数据库

大数据-Hbase

大数据技术之HBaseHBase简介HBase快速入门HBase进阶

大数据存储- Hbase 基础

大数据—— HBase 常见面试题整理

2021年大数据HBase(十三):HBase读取和存储数据的流程