开源异构数据库同步工具收集
SymmetricDS 太麻烦,而且是每张表都要配置触发器,性能影响太大了。 其他类型数据库到GP: 转自:https://blog.csdn.net/inrgihc/article/details/103739629 一、背景 开源MPP数据库Greenplum是一种基于PostgreSQL的分布式数据库,其采用shared-nothing架构,其架构专门用于管理大规模分析数据仓库,Greenplum主要定位在OLAP领域,利用Greenplum MPP数据库做大数据计算或分析平台非常适合,典型的就是数据仓库系统。 虽然Greenplum支持JDBC 、libpg、copy、gpfdist等多种方式加载数据。但是通常的业务系统中的数据存储往往是MySQL、Oracle、SQLServer、PostegreSQL等数据库。要想把这些数据库中的数据导入至Greenplum数据库中,需要借助一定的(离线同步)工具,典型的工具包括: (1)利用kettle+gpload工具 优点:工具开源且现成,导入速度快,kettle支持表结构同步和表数据同步; 缺点:gpload配置过于复杂,kettle功能多,学习成本高,每张表都需要单独配置,不适用于大批量表的操作; (2)使用Greenplum工具gpfdist或外部表方式 优点:导入速度快 缺点:需要先将MySQL、Oracle