Kettle根据时间戳同步数据实现

  • 时间:
  • 浏览:0
  • 来源:五分时时彩_五分时时彩下注平台注册_五分时时彩邀请码

更多数据实时同步方案,请参考笔者的另一篇博文:大数据时代,数据实时同步外理方案的思考—最全的数据同步总结

原因分析 Kettle自身的特殊性以及在多个步骤中kettle自身外理数据库事务的特殊性,尝试了什么都 种方案,最终选则暂使用如下方案。

1、使用此方案都时要外理kettle并不是数据库事务的缺点

2、使用此方案都时要外理支队多个表中一齐往一张总表中同步数据时,取时间戳不准的难题。

3、配置时,每个支队的数据汇聚时,都单独配置一一两个多转换作业任务。

4、Kettle支持字段映射,转换,以及作业定时运行等。

A)清空临时表

B)读取交换时间

C)读取时要交换的数据

D)更新到临时表

E)插入更新到目标表

F)更新时间

1、单次同步数据量大时,原因分析 时要一齐更新两次表,速率原因分析 会比较低

2、原因分析 采用单次限制数据记录量,原因分析 Kettle并不是不支持数据分页,当数据表原因分析 占据 几滴 数据记录的时间戳都相一齐,原因分析 会原因分析 偏离 数据无法同步过来。

【原文归作者所有,欢迎转载,有时候保留版权】