Kettle是一款国外开源的ETL工具,纯Java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定
1、以XML形式存储
2、以资源库方式存储(数据库资源库和文件资源库)
1)官网地址
https://community.hitachivantara.com/docs/DOC-1009855
2)下载地址
https://sourceforge.net/projects/pentaho/files/Data%20Integration/
在实际企业开发中,都是在本地环境
下进行Kettle的Job
和Transformation
开发的,可以在本地运行,也可以连接远程机器运行
Spoon.bat
,启动图形化界面工具,就可以直接使用了(第一次启动可能有点慢,属于正常现象)案例一
:把MySQL中stu1的数据按id
同步到stu2,stu2有相同id则更新数据create database kettle;
use kettle;
create table stu1(id int,name varchar(20),age int);
create table stu2(id int,name varchar(20));
insert into stu1 values(1001,‘zhangsan‘,20),(1002,‘lisi‘,18), (1003,‘wangwu‘,23);
insert into stu2 values(1001,‘wukong‘);
案例二
:使用Job作业方式调度转换操作,并使用SQL插入数据到stu2truncate table stu1
truncate table stu2
insert into stu1 values(1001,‘zhangsan‘,20),(1002,‘lisi‘,18), (1003,‘wangwu‘,23);
insert into stu2 values(1001,‘wukong‘);
案例三
:把HDFS中的数据插入到HBase中的表中原文:https://www.cnblogs.com/Main8/p/13847801.html