DataX — это инструмент автономной синхронизации для разнородных источников данных, предназначенный для достижения стабильных и эффективных функций синхронизации данных между различными разнородными источниками данных, включая реляционные базы данных (MySQL, Oracle и т. д.), HDFS, Hive, ODPS, HBase, FTP и т. д.
Чтобы решить проблему синхронизации разнородных источников данных, DataX превращает сложные каналы синхронизации сетки в звездные каналы передачи данных. DataX служит промежуточной несущей передачи и отвечает за соединение различных источников данных. Когда вам нужно получить доступ к новому источнику данных, вам нужно всего лишь подключить источник данных к DataX, чтобы обеспечить плавную синхронизацию данных с существующим источником данных.
https://www.jianshu.com/p/f5f0dc99d5ab ***** https://tech.youzan.com/datax-in-action/ https://github.com/alibaba/DataX //Алибаба