Sqoop 增量追加模式不为 --check-column 导入空行,该列是时间戳,具有空值
Posted
技术标签:
【中文标题】Sqoop 增量追加模式不为 --check-column 导入空行,该列是时间戳,具有空值【英文标题】:Sqoop Incremental append mode not importing null rows for --check-column, This columns is timestamp and has null value 【发布时间】:2019-10-09 18:59:17 【问题描述】:我最初尝试使用以下命令进行增量导入。
sqoop import --connect jdbc:oracle:thin:@orau20:1555:XXX --username XXXX --password XXXX --table emp -fields-terminated-by '\001' --escaped-by '\' --input-null-string "\\N" --input-null-non-string "\\N" --target-dir /user/xxx/Test/emp --incremental append --check-column dttm_stamp_sec -米 1
在这里我发现一些记录丢失,其中 dttm_stamp_sec 为空记录。此列有一些空记录,这些记录没有从 oracle 导入到 hadoop。任何帮助表示赞赏。
【问题讨论】:
【参考方案1】:我们应该指定 --check-column 总是有一个值 init
【讨论】:
以上是关于Sqoop 增量追加模式不为 --check-column 导入空行,该列是时间戳,具有空值的主要内容,如果未能解决你的问题,请参考以下文章
通过 oozie 从 sqoop 作业增量导入不会更新 sqoop 元存储中的 incremental.last.value