Kettle 入门笔记1

Posted 微微一笑很倾城1

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Kettle 入门笔记1相关的知识,希望对你有一定的参考价值。

 
 
 
 
 
一,KETTLE介绍
Kettle是 Extract, Transform and Load抽取、转换、加载)一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。其中,Spoon是Kettle中的一个组件,其他组件有PAN,CHEF,Encr和KITCHEN等。
Spoon通过图形化的页面,方便直观的让你完成数据转换的操作。
 
二、Kettle下载
      可到开源官网(https://community.hds.com)下载;
  Data Integration(or Kettle) 8版本下载: pdi-ce-8.0.0.0-28
三、java JDK 安装与部署
      1)首先到官网下载对应JDK包,JDK1.8或以上版本就行;
      2)安装JDK;
      3)配置环境变量。
具体步骤请百度
 
 
四:Kettle环境配置
      1)因Kettle是开源工具,下载的压缩包直接解压到本地路径即可。
      2)打开环境变量的设置窗口。右击“我的电脑”,在弹出的快捷菜单中选择“属性”选项,进入“系统属性”对话框。选择“高级”标签,进入“高级”选项卡,再单击“环境变量”按钮,进入“环境变量”对话框。
     3)在“系统变量”栏“新建”系统变量,变量名输入:KETTLE_HOME;变量值输入Kettle解压路径(...\\data-integtation)。点击“确定”完成环境变量设置。
五:Kettle运行
     进入到Kettle目录,双击运行spoon.bat文件,出现如下界面及说明kettle成功部署。
 
六:出现问题
1)若kettle启动spoon提示 A Java Exception has occurred,则说明jdk与当前kettle版本不匹配。(注:jdk1.8版本可支持Kettle7.0以后版本,1.7版本不支持
 
 

7、建立转换
  在文件->新建装换。
  新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:
 

建立数据库连接的过程与其他数据库管理软件连接数据库类似。
  注意:在数据库链接的过程中,可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,别忘记在链接数据库时先将数据库驱动包放入Spoon的lib文件夹下。
 
 
简单的数据表插入\\更新
  (1)新建表插入
  在左边的面板中选择“核心对象”,在核心对象里面选择“输入->表输入”,用鼠标拖动到右边面板。如图所示:
 
双击拖过来的表,可以编辑表输入。
  选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。
 
(2)通过插入\\更新输出到表。
  在左边面板中选择核心对象、选择“输出->插入\\更新”如图所示:
编辑插入更新:
  首先:表输入连接插入更新。
    选中表输入,按住shift键,拖向插入更新

然后:双击插入更新,编辑它。

到这里基本上,这个转换就要做完了,可以点击运行查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。

检查数据库表test1是否已有数据:

无数据的原因是:

 

再次执行转换:

 

 

9, 使用作业控制上面装换执行。
 
  使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。
 

双击start可以编辑,可以设置执行时间等等

 
点开转换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr
 
开始 连接 转换  
选中START ,按住shift键,拖向转换。
 
 

由于之前单独执行测试公转换是否设置正确,先删除表test1的数据:

 

执行作业:

 

 

 执行成功。查看数据库表test1是否有数据:
 

 

 
 
 
 
 
 
 
 
 
 
 
 

以上是关于Kettle 入门笔记1的主要内容,如果未能解决你的问题,请参考以下文章

Python编程入门到实践 - 笔记(1,2章)

KettleKettle入门解析

LearnOpenGL 笔记 - 入门 03 你好,窗口

数字信号入门笔记1 — 离散时间信号

Elasticsearch入门笔记

Elasticsearch入门笔记