当前位置:网站首页>关于ETL的两种架构(ETL架构和ELT架构)
关于ETL的两种架构(ETL架构和ELT架构)
2022-08-09 21:54:00 【微服务 spring cloud】
ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。
ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
ETL在转化的过程中,主要体现在以下几方面:
- 空值处理:可捕获字段空值,进行加载或替换为其他含义数据,并可根据字段空值实现分流加载到不同目标库。
- 规范化数据格式:可实现字段格式约束定义,对于数据源中时间、数值、字符等数据,可自定义加载格式。
- 拆分数据:依据业务需求对字段可进行分解。例,主叫号 861082585313-8148,可进行区域码和电话号码分解。
- 验证数据正确性:可利用Lookup及拆分功能进行数据验证。例如,主叫号861082585313-8148,进行区域码和电话号码分解后,可利用Lookup返回主叫网关或交换机记载的主叫地区,进行数据验证。
- 数据替换:对于因业务因素,可实现无效数据、缺失数据的替换。
- Lookup:查获丢失数据 Lookup实现子查询,并返回用其他手段获取的缺失字段,保证字段完整性。
- 建立ETL过程的主外键约束:对无依赖性的非法数据,可替换或导出到错误数据文件中,保证主键唯一记录的加载。
ETL架构的优势:
- ETL可以分担数据库系统的负载(采用单独的硬件服务器)
- ETL相对于EL-T架构可以实现更为复杂的数据转化逻辑
- ETL采用单独的硬件服务器。.
- ETL与底层的数据库数据存储无关.
ELT
在ELT架构中,ELT只负责提供图形化的界面来设计业务规则,数据的整个加工过程都在目标和源的数据库之间流动,ELT协调相关的数据库系统来执行相关的应用,数据加工过程既可以在源数据库端执行,也可以在目标数据仓库端执行(主要取决于系统的架构设计和数据属性)。当ETL过程需要提高效率,则可以通过对相关数据库进行调优,或者改变执行加工的服务器就可以达到。一般数据库厂商会力推该种架构,像Oracle和Teradata都极力宣传ELT架构。
ELT架构的优势:
- ELT主要通过数据库引擎来实现系统的可扩展性(尤其是当数据加工过程在晚上时,可以充分利用数据库引擎的资源)
- ELT可以保持所有的数据始终在数据库当中,避免数据的加载和导出,从而保证效率,提高系统的可监控性。
- ELT可以根据数据的分布情况进行并行处理优化,并可以利用数据库的固有功能优化磁盘I/O。
- ELT的可扩展性取决于数据库引擎和其硬件服务器的可扩展性。
- 通过对相关数据库进行性能调优,ETL过程获得3到4倍的效率提升一般不是特别困难。
边栏推荐
- 【软考 系统架构设计师】案例分析④ 软件架构风格
- 重装系统后新建文本文档打不开怎么办
- Flask之路由(app.route)详解
- README_Albumentations
- 5个 Istio 访问外部服务流量控制最常用的例子,你知道几个?
- 宝塔实测-搭建LightPicture开源图床系统
- Arcgis工具箱无法使用,显示“XML包含错误“的解决方法
- Let's talk about what DDL, DML, DQL and DCL are in SQL statements
- In programming languages, the difference between remainder and modulo
- 简单问题窥见数学
猜你喜欢
一本通2074:【21CSPJ普及组】分糖果(candy)
从产品角度看 L2 应用:为什么说这是一个游乐场?
CVPR22 Oral | shunt through multi-scale token polymerization from attention, code is open source
【微服务~Nacos】Nacos服务提供者和服务消费者
《强化学习周刊》第57期:DL-DRL、FedDRL & Deep VULMAN
Chatting embarrassing scenes, have you encountered it?Teach you to get the Doutu emoticon package with one click, and become a chat expert
This article lets you quickly understand implicit type conversion [integral promotion]!
How do task flow executors work?
Domestic mobile phone manufacturers once fought for it, but now it is the first to collapse...
Evolution of MLOps
随机推荐
Js fifteen interview questions (with answers)
POWER SOURCE ETA ETA Power Repair FHG24SX-U Overview
JSON 基本使用
JS解混淆-AST还原案例
【GORM】模型关系-HasMany关系
SecureCRT background color
级联下拉菜单的实现「建议收藏」
Technology Sharing | How to use the JSON Schema mode of interface automation testing?
AI Knows Everything: Building and Deploying a Sign Language Recognition System from Zero
leetcode 刷题日记 计算右侧小于当前元素的个数
Solution: Edu Codeforces 109 (div2)
【EF】 更新条目时出错。有关详细信息,请参见内部异常。[通俗易懂]
Kubernetes Service对象
万字总结:分布式系统的38个知识点
navicat 快捷键
This article lets you quickly understand implicit type conversion [integral promotion]!
CVPR22 Oral|通过多尺度token聚合分流自注意力,代码已开源
abstract class or interface
AI Knows Everything: Building and Deploying a Sign Language Recognition System from Zero
【微服务~Nacos】Nacos服务提供者和服务消费者