使用Kettle实现数据库同步

 时间:2024-10-14 10:55:50

1、下载pdi-ce-4.4.0-stable.zip,解压到文件夹,打开data-integration中的Spoon.bat

2、出现欢迎界面后来到Repository Connection窗口,选择建立一个新的repository,随后出现“资源库信息”窗口:

使用Kettle实现数据库同步

3、在“资源库信息”窗口中选择新建一个数据库连接,弹出“Database Connection”窗口:

使用Kettle实现数据库同步

4、在其中输入Connection Name, Host Name, Database Name, Port Number, User Name,Password信息即可建立连接,完成之后在Repository Connection窗口以admin用户名登陆。

5、新建一个名为cscgTransTest的Transformation,从“核心对象”中将两个“表输入”和一个“插入/更新”拖入到cscgTransTest中,并建立它们之间的连接,如下图所示:

使用Kettle实现数据库同步

6、在cscgTransTest中建立一个新的数据库连接ttt,通过表输入“max_createtime”从目标数据库ttt中获取某个表中最新数据的建立时间:SELECT max(trunc(createtime)) FROMumdata.toeventmedia

7、在cscgTransTest中建立一个新的数据库连接testdb,以表输入“max娄多骋能_createtime”的查询结果替代表输入“umdata.toeventmedia”中的变量,执行SQL语句瞀闩程狨从数据库testdb中获取需要插入或者更新到ttt数据库的数据SELECT * FROMumdata.toeventmedia where trunc(createtime) >= trunc(?)

8、在“插入/更新”中选择“数据库连接”、“目标模式”、“目标表”等信息,“用来查询的蔡龇呶挞关键字”中的字段用来查询某条记录是否在目标表中存在,不台仵瑕噤存在则插入记录;如果存在,则继续比较其他字段是否与流里的字段值相同,如果相同则不执行任何操作,如果不同则更新“更新字段”中所列字段。“用来查询的关键字”所列字段是该表的primarykey,从而可以唯一标识一条记录。

使用Kettle实现数据库同步

9、分别为每一个表建立一个如上模式的转换步骤。

10、新建一个名为“cscgJobTest”的Job,在核心对象中将“START”和“Transformation”拖入cscgJobTest中,并建立两者之间的连接。

使用Kettle实现数据库同步

11、选中START中的“重复执行”,类型为“不需要定时”;在Transformation中将转换名设置为之前建立的“cscgTransTest”.

12、点击“Run this Job”运行。Job和Transformation的执行结果如如下:

使用Kettle实现数据库同步
使用Kettle实现数据库同步
  • excel之单元格合并筛选
  • 如何从EXCEL表中获取多列和多行
  • excel如何自动求除0以外的最小值
  • 表格在一个区域内自动随机选取数据,比如抽奖
  • wps表格怎么设置快捷键?
  • 热门搜索
    抗震救灾手抄报 安全手抄报版面设计图 敬廉崇洁手抄报内容 文明旅游手抄报 英语中秋节手抄报 爱国手抄报内容资料 我爱阅读手抄报内容 反对邪教崇尚科学手抄报 宣传普通话手抄报 喜迎国庆手抄报图片