1.11-1.12 Sqoop导入数据时两种增量方式导入及direct
Posted weiyiming007
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了1.11-1.12 Sqoop导入数据时两种增量方式导入及direct相关的知识,希望对你有一定的参考价值。
一、增量数据的导入
1、两种方式
## query 有一个唯一标识符,通常这个表都有一个字段,类似于插入时间createtime where createtime => 20150924000000000 and createtime < 20150925000000000 ##sqoop参数 Incremental import arguments: --check-column <column> Source column to check for incremental change --incremental <import-type> Define an incremental import of type ‘append‘ or ‘lastmodified‘ --last-value <value> Last imported value in the incremental check column
2、用sqoop参数增量导入的方式
##
bin/sqoop import --connect jdbc:mysql://hadoop-senior.ibeifeng.com:3306/test --username root --password 123456 --table my_user --target-dir /user/root/sqoop/imp_my_incr --num-mappers 1 --incremental append --check-column id --last-value 4
#--incremental append //追加方式
#--check-column //检查的字段
#--last-value //最后的值,不包含这个值,从这个值后面的开始导入
##
[[email protected] hadoop-2.5.0-cdh5.3.6]# bin/hdfs dfs -text /user/root/sqoop/imp_my_incr/part-m-00000
5,test,test
6,pudong,pudong
7,qiqi,qiqi
二、direct参数
直接导出模式(优化速度);
使用的是关系数据库自带的导入导出工具;
##
bin/sqoop import --connect jdbc:mysql://hadoop-senior.ibeifeng.com:3306/test --username root --password 123456 --table my_user --target-dir /user/root/sqoop/imp_my_incr --num-mappers 1 --delete-target-dir --direct
以上是关于1.11-1.12 Sqoop导入数据时两种增量方式导入及direct的主要内容,如果未能解决你的问题,请参考以下文章