当前位置:网站首页>Flink CDC 2.0及其他数据同步工具对比
Flink CDC 2.0及其他数据同步工具对比
2022-08-10 02:43:00 【贾斯汀玛尔斯】
CDC 的全称是 Change Data Capture ,在广义的概念上,只要是能捕获数据变更的技术,我们都 可以称之为 CDC 。
- 基于查询的 CDC:
离线调度查询作业,批处理。依赖表中的更新时间字段,每次执行查询去获取表中最新的数据;
无法捕获删除事件,从而无法保证数据一致性;
无法保障实时性,基于离线调度存在天然的延迟。 - 基于日志的 CDC:
实时消费日志,流处理。例如 MySQL 的 binlog 日志完整记录了数据库中的变更,可以把 binlog 文件当作流的数据源;
保障数据一致性,因为 binlog 文件包含了所有历史变更明细;
保障实时性,因为类似 binlog 的日志文件是可以流式消费的,提供的是实时数据。
应用场景
- 数据迁移:常用于数据库备份、容灾等;
- 数据分发:将一个数据源分发给多个下游,常用于业务解耦、微服务;
- 数据采集:将分散异构的数据源集成到数据仓库中,消除数据孤岛,便于后续的分析。
工具对比

- DataX 不支持增量同步,Canal 不支
边栏推荐
猜你喜欢
随机推荐
2022.8.8 exam sweeps the horse (sweeper) antithesis
二维空间下的向量旋转
NFG电商系统在元宇宙趋势下做什么?
官宣出自己的博客啦
2022.8.9考试游记总结
驱动程序开发:按键中断之异步通知
flex 的 三个参数:flex-grow、flex-shrink、flex-basis
yolov5+usb相机
ArcGIS Advanced (1) - Install ArcGIS Enterprise and create an sde library
plsql 查询数据库操作历史记录(Ctrl + e)
当我操作dms客户端的时候,我要操控好几个阿里云账号下的数据库,但是这边每次切换都会把我的登录记录删
【语义分割】2022-HRViT CVPR
Arcgis进阶篇(1)——安装Arcgis Enterprise,创建sde库
论文理解:“PIAT: Physics Informed Adversarial Training for Solving Partial Differential Equations“
Example 044: Matrix Addition
单体架构应用和分布式架构应用的区别
2020.11.22 Exam Goldbach Conjecture Solution
Difference Between Data Mining and Data Warehousing
PostgreSQL相关语法及指令示例
量化交易策略介绍及应用市值中性化选股








