1.支持多种数据库在平台创建数据源,包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源
2.能够简单高效地配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错、限速、并发)等
3.实现可视化功能,通过任务配置,降低用户用户研发成本,实现数据同步
基于datax框架插件化集成多种数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源,实现来源数据同步到目标数据,消除数据壁垒。
dataxZ执行流程:
启动Job → 切分Task → 调度执行 → 数据传输 → 结果统计
↓ ↓ ↓ ↓ ↓
Job Split Scheduler Channel Statistics