Sqoop 增量追加模式不为 --check-column 导入空行,该列是时间戳,具有空值

Posted

技术标签:

【中文标题】Sqoop 增量追加模式不为 --check-column 导入空行,该列是时间戳,具有空值【英文标题】:Sqoop Incremental append mode not importing null rows for --check-column, This columns is timestamp and has null value 【发布时间】:2019-10-09 18:59:17 【问题描述】:

我最初尝试使用以下命令进行增量导入。

sqoop import --connect jdbc:oracle:thin:@orau20:1555:XXX --username XXXX --password XXXX --table emp -fields-terminated-by '\001' --escaped-by '\' --input-null-string "\\N" --input-null-non-string "\\N" --target-dir /user/xxx/Test/emp --incremental append --check-column dttm_stamp_sec -米 1

在这里我发现一些记录丢失,其中 dttm_stamp_sec 为空记录。此列有一些空记录,这些记录没有从 oracle 导入到 hadoop。任何帮助表示赞赏。

【问题讨论】:

【参考方案1】:

我们应该指定 --check-column 总是有一个值 init

【讨论】:

以上是关于Sqoop 增量追加模式不为 --check-column 导入空行,该列是时间戳,具有空值的主要内容,如果未能解决你的问题,请参考以下文章

sqoop导入增量数据

Sqoop增量导入

hive增量抽取方案

怎么用sqoop增量从hive往oracle数据库导数据

通过 oozie 从 sqoop 作业增量导入不会更新 sqoop 元存储中的 incremental.last.value

Sqoop 带有 Epoch 时间戳的增量负载