大数据--sqoop数据增量导入

Posted jeff190812

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据--sqoop数据增量导入相关的知识,希望对你有一定的参考价值。

1、在mysql中新建表stu,插入一些数据

-------------------------------------------------------

技术图片

 

 2、将MySQL表的stu中的数据导入到hive中

----------------------------------------------------------

[root@bigdata113 ~]# sqoop import --connect jdbc:mysql://bigdata113:3306/mysqlhdfs --username root --password 000000 --table stu --delete-target-dir --num-mappers 1 --hive-import --fields-terminated-by "\\t" --hive-overwrite --hive-table stu_hive

hive (default)> select * from stu_hive;
OK
stu_hive.id stu_hive.name
1 zhangsan
2 isi
3 wangwu
4 yiliu
5 lisa
Time taken: 0.491 seconds, Fetched: 5 row(s)

----------------------------------------------------------------

3、往MySQL表stu中添加新数据

----------------------------------------------

技术图片

 

 

4、将MySQL表stu新增的数据追加到hive的stu_hive中

-------------------------------------------

[root@bigdata113 ~]# sqoop import --connect jdbc:mysql://bigdata113:3306/mysqlhdfs --username root --password 000000 --table stu --num-mappers 1 --fields-terminated-by "\\t" --target-dir /user/hive/warehouse/stu_hive --check-column id --incremental append --last-value 5

hive (default)> select * from stu_hive;
OK
stu_hive.id stu_hive.name
1 zhangsan
2 isi
3 wangwu
4 yiliu
5 lisa
6 xiaohei
Time taken: 0.091 seconds, Fetched: 6 row(s)

以上是关于大数据--sqoop数据增量导入的主要内容,如果未能解决你的问题,请参考以下文章

大数据(3j)Sqoop生产经验

大数据高级开发工程师——大数据相关工具之一 Sqoop

如何实现交易数据到大数据平台的实时同步

大数据离线业务场景中的增量技术

sqoop导入增量数据

大数据--sqoop数据导入导出