如何使用kettle进行数据导入.csv

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用kettle进行数据导入.csv相关的知识,希望对你有一定的参考价值。

参考技术A

    在kettle中新建一个转换,再保存,再点击新建一个DB连接

2.    Csv文件内容

3.    按住shift连接两个图标,只能连接出错的红线。

4.    点击连线上的红叉(不是太容易点,多试试),出现下面的窗口,将启用错误处理后的框去掉,点击ok

5.      再编辑表输出,浏览目标表并选择。勾选指定数据库字段,可以在右边的列映射中配置,或自己输入。表字段就是输出表的对应字段,同一行对应的流字段是输入的字段。

6.    执行转换,转换完成

参考技术B 果你用的是INNODB数据库,有一个最简单有效的调整,就是将INI文件里面的下面参数调整: 原始: innodb_flush_log_at_trx_commit=1 调整为: innodb_flush_log_at_trx_commit=2 具体什么意思就不解释了

ETL工具kettle的csv输入和excel输入

实际工作中我们可能回经常将excel或者csv的数据导入到数据库中,这里讲下怎么通过kettle进行导入;
首先说下这两种格式的区别:CSV是文本文件,用记事本就能打开,XLS是二进制的文件只有用EXCEL才能打
同时CSV (*.csv) 文件格式只能保存活动工作表中的单元格所显示的文本和数值。工作表中所有的数据行和字符都将保存。数据列以逗号分隔,每一行数据都以回车符结束。如果单元格中包含逗号,则该单元格中的内容以双引号引起。
如果单元格显示的是公式而不是数值,该公式将转换为文本方式。所有格式、图形、对象和工作表的其他内容将全部丢失。
若只是保存一点文本信息用 .csv文件就可以了 但是若有设定公式,冻结列等其他东西则用xls;
接下来说下两者的具体用法:
csv输入
打开一个转换,点击程序左边的核心对象,在输入中就可以看到,当然你也可以在左上方的步骤搜索中进行搜索;如图:
技术分享图片
将csv文件输入组件拖到转换中需要的位置;双击打开
技术分享图片
点击浏览添加文件,其他选项用默认就好,接下来点击获取字段,那么就会获取到相应的字段,也可以删除自己不需要的字段,需要注意下类型,特别是涉及到number和date格式的时候注意下,还有右边的去除空格,有时候csv中会存在大量的空格,你根据实际情况自己选择;同时你也可以点击预览看下效果;最后点击确定就好;还有一点文件编码要选择正确的,不然会出现中文乱码;

excel输入
前面步骤和csv输入一样,双击打开,如图
技术分享图片
首先选择合适的表格类型,然后点击浏览,选项文件,然后千万记得点击增加,记住;点击增加后会在下面的选中的文件中可以看到,如果选错了首先要在选中的文件中将它删除;接下来点击工作表,这是为了选中某一个sheet(一个表格可能会有多个sheet)
技术分享图片
然后点击字段,接下来步骤和csv输入一样了

以上是关于如何使用kettle进行数据导入.csv的主要内容,如果未能解决你的问题,请参考以下文章

ETL工具kettle的csv输入和excel输入

kettle 文本文件导入 没有表头

实战使用 Kettle 工具将 mysql 数据增量导入到 MongoDB 中

kettle导入的数据变成?

kettle入库乱码问题

python如何导入数据