HBase sqoop 导入冻结

Posted

技术标签:

【中文标题】HBase sqoop 导入冻结【英文标题】:HBase sqoop import freezes 【发布时间】:2014-02-18 20:25:57 【问题描述】:

在 cloudera 集群上: 我尝试在 HBase 中成功导入 100k 行 mysql 表作为测试。 现在我正在尝试导入一个 264M 行的 postgre 表。起初我让映射器的默认数量(没有“-m”选项)但是,在 35 或 100 行之后,sqoop 作业的控制台给了我这个错误:“org.apache.hadoop.client.RetriesExhaustedWithDetails:Failed XXX actions: servers with问题:XXXXXXXXXXXXX”在完美运行的机器上,我的所有服务在 Cloudera 上都是绿色的。 为了避免这种情况,我尝试设置一个映射器(“-m 1”)。没有更多的错误,但是在 100-110 行之后,sqoop 停止添加新行,并且 cloudera 的日志中没有任何内容......我试图让导入连续运行 3 天。 一些信息:我让 sqoop 选择了行 ID。原始表是 3 列键控(使用 varchars)。 我想我有一些错误配置,但我不知道是哪一个......

【问题讨论】:

【参考方案1】:

好的,我想通了。 Hbase 基于表的 3 个主键之一采用默认的单键。结果是:它使用相同的第一个主键重新写入前一行。它不会冻结。我现在已经指定了他必须使用哪些列来存储在 HBase 中。

【讨论】:

以上是关于HBase sqoop 导入冻结的主要内容,如果未能解决你的问题,请参考以下文章

04 使用Sqoop将mysql数据导入hbase

使用sqoop将MySQL数据库中的数据导入Hbase

Sqoop_具体总结 使用Sqoop将HDFS/Hive/HBase与MySQL/Oracle中的数据相互导入导出

sqoop命令,oracle导入到hdfs、hbase、hive

使用 talend 或 sqoop 将数据从 hbase 导入 hdfs

Sqoop将mysql数据导入hbase的血与泪