当前位置:网站首页>Flink CDC 2.0及其他数据同步工具对比
Flink CDC 2.0及其他数据同步工具对比
2022-08-10 02:43:00 【贾斯汀玛尔斯】
CDC 的全称是 Change Data Capture ,在广义的概念上,只要是能捕获数据变更的技术,我们都 可以称之为 CDC 。
- 基于查询的 CDC:
离线调度查询作业,批处理。依赖表中的更新时间字段,每次执行查询去获取表中最新的数据;
无法捕获删除事件,从而无法保证数据一致性;
无法保障实时性,基于离线调度存在天然的延迟。 - 基于日志的 CDC:
实时消费日志,流处理。例如 MySQL 的 binlog 日志完整记录了数据库中的变更,可以把 binlog 文件当作流的数据源;
保障数据一致性,因为 binlog 文件包含了所有历史变更明细;
保障实时性,因为类似 binlog 的日志文件是可以流式消费的,提供的是实时数据。
应用场景
- 数据迁移:常用于数据库备份、容灾等;
- 数据分发:将一个数据源分发给多个下游,常用于业务解耦、微服务;
- 数据采集:将分散异构的数据源集成到数据仓库中,消除数据孤岛,便于后续的分析。
工具对比
- DataX 不支持增量同步,Canal 不支
边栏推荐
- 2022.8.9 Exam Travel Summary
- flutter 每天一背,需要掌握
- 2022.8.9考试排列变换--1200题解
- 【Image Classification】2022-ConvMixer ICLR
- 【红队】ATT&CK - 自启动 - 注册表运行键、启动文件夹
- QT modal dialog and non-modal dialog learning
- How to write a high-quality test case?
- 将信号与不同开始时间对齐
- 实例048:数字比大小
- [8.8] Code Source - [Non-falling subarray game] [Longest rising subsequence count (Bonus)] [Substring (data enhanced version)]
猜你喜欢
Instance 042: Variable scope
MySQL:日志系统介绍 | 错误日志 | 查询日志 | 二进制日志:bin-log数据恢复实践 | 慢日志查询
The Evolutionary History of the "Double Gun" Trojan Horse Virus
HRnet
Example 048: Number ratio size
Difference Between Data Mining and Data Warehousing
想要避免After Effects渲染失败的问题,5个小技巧必看
实例044:矩阵相加
Example 046: Breaking the Cycle
【Image Classification】2022-CycleMLP ICLR
随机推荐
将信号与不同开始时间对齐
flutter 每天一背,需要掌握
2022.8.9考试立方和--1100题解
Research on IC enterprises
量化投资学习——在FPGA上运行高频交易策略
What is a Cross-Site Request Forgery (CSRF) attack?How to defend?
Example 047: Functions Swap Variables
【8.8】代码源 - 【不降子数组游戏】【最长上升子序列计数(Bonus)】【子串(数据加强版)】
yolov5+usb相机
2022.8.8 Exam area link (district) questions
湖仓一体电商项目(四):项目数据种类与采集
【Image Classification】2022-CycleMLP ICLR
【图像分类】2022-CycleMLP ICLR
2022.8.9 Exam Travel Summary
实例046:打破循环
2022.8.9考试排列变换--1200题解
what is eabi
2022.8.9 Remainder of Exam Balance--1000 Question Solutions
从滑动标尺模型看企业网络安全能力评估与建设
实例043:作用域、类的方法与变量