当前位置:网站首页>Flink CDC 2.0及其他数据同步工具对比
Flink CDC 2.0及其他数据同步工具对比
2022-08-10 02:43:00 【贾斯汀玛尔斯】
CDC 的全称是 Change Data Capture ,在广义的概念上,只要是能捕获数据变更的技术,我们都 可以称之为 CDC 。
- 基于查询的 CDC:
离线调度查询作业,批处理。依赖表中的更新时间字段,每次执行查询去获取表中最新的数据;
无法捕获删除事件,从而无法保证数据一致性;
无法保障实时性,基于离线调度存在天然的延迟。 - 基于日志的 CDC:
实时消费日志,流处理。例如 MySQL 的 binlog 日志完整记录了数据库中的变更,可以把 binlog 文件当作流的数据源;
保障数据一致性,因为 binlog 文件包含了所有历史变更明细;
保障实时性,因为类似 binlog 的日志文件是可以流式消费的,提供的是实时数据。
应用场景
- 数据迁移:常用于数据库备份、容灾等;
- 数据分发:将一个数据源分发给多个下游,常用于业务解耦、微服务;
- 数据采集:将分散异构的数据源集成到数据仓库中,消除数据孤岛,便于后续的分析。
工具对比
- DataX 不支持增量同步,Canal 不支
边栏推荐
猜你喜欢
flex 的 三个参数:flex-grow、flex-shrink、flex-basis
从8k到13k,我全靠这本《接口自动化测试——从入门到精通》
T5: Text-to-Text Transfer Transformer
Anchor_generators.py analysis of MMDetection framework
NFG电商系统在元宇宙趋势下做什么?
【Kali安全渗透测试实践教程】第8章 Web渗透
【Kali安全渗透测试实践教程】第6章 密码攻击
Example 043: Scope, class methods and variables
【Image Classification】2022-ResMLP
[Kali Security Penetration Testing Practice Tutorial] Chapter 6 Password Attack
随机推荐
HRnet
驱动程序开发:按键中断之异步通知
GDB之指令基础参数
Kettle 裁剪表详解(truncate)
NFG电商系统在元宇宙趋势下做什么?
Robust Real-time LiDAR-inertial Initialization(实时鲁棒的LiDAR惯性初始化)论文学习
flutter 创建可增型列表和列表排序
PostgreSQL相关语法及指令示例
Anchor_generators.py analysis of MMDetection framework
Meteor accelerator Trojan analysis and disposal plan
【Kali安全渗透测试实践教程】第7章 权限提升
二维空间下的向量旋转
网页挖矿溯源?浏览器浏览历史查看工具Browsinghistoryview
Little rookie Hebei Unicom induction training essay
2022.8.8考试从记忆中写入(memory)题解
6 common plugin recommendations in Pycharm
2022.8.8考试摄像师老马(photographer)题解
一文教会你快速上手 Vim
How to write a high-quality test case?
QT模态对话框及非模态对话框学习