Yunque(云雀):数据集成工具,实现异构数据源的整合,帮助企业构建数据仓库、数据湖等应用架构。其框架设计采用 client 端和 server 端分布式架构,master-slave 的架构模型。master 负责接受用户的请求,通过轮询的方式,将任务转发给 slave 进行数据处理,其中 server 端一个 thread 负责一个 task 进行任务处理。server 端的架构分为 reader、channel、writer 三部分。reader 作为数据源,可以通过实现共同的 reader 接口,以 sql 的方式对数据进行抽取操作;channel 作为队列,可选的队列有默认的 linkedblockingqueue,也可使用 kafka,通过使用 kafka 做到一次写入多次读取;writer 作为目标数据源,可以通过实现共同的 writer 接口,以 sql 的方式对数据进行下沉操作。