当前位置:网站首页>kettle庖丁解牛第16篇之输入组件周边讲解
kettle庖丁解牛第16篇之输入组件周边讲解
2022-04-23 13:19:00 【飞哥大数据】
引言
上一篇文章中,我们介绍了:XML input stream (StAX)组件的各种详细设置,最后实战演示了如何操作它来读取磁盘上的xml文件、还有清洗数据的操作。
在本篇文章中,我们接着介绍:kettle中的输入组件,前面我们介绍了一些常用的输入组件。本篇文章再扩展的讲解一些不常用的组件,这些组件操作起来非常简单,所以我只演示如何操作,不再像之前那样详细讲解选项了,大家一看就能明白如何使用。
转换
转换(transaformation)是ETL解决方案中最主要的部分,它处理抽取、转换、加载各种对数据行的操作。
创建转换
我们要做的ETL操作,全是在转换中设计的,所以我们要先创建一个转换。
保存转换
给你新建的转换,起个名字,并保存
生成记录
简介
需要将一部分文本数据变成数据行,每个字段作为一个数据行的一个列,那么就可以利用这个组件
预览记录
生成随机数
简介
在使用Kettle进行数据入库的时候,经常会涉及到为ID字段生成唯一标识,而UUID通常是我们生成唯一表示的选择,这个时候就需要使用到“生成随机数”功能算子,通过“生成随机数”可以生成UIID。
日常工作中,有时只想用些数据测试,但又不想从数据库或Excel输入,这时就可以生成随机数。
预览记录(执行多次)
可以看到,每次运行的结果是不同的,因为每一次都是产生的随机数。
自定义常量数据
简介
自定义常量数据,就是生成key-value形式的常量数据。
预览记录
获取系统信息
简介
系统信息是指Kettle系统环境的信息,包括计算机系统的日期,星期等时间类型的信息,计算机名称、IP地址、转换或者作业的开始结束时间(用于数据增量处理)、上一个作业完成情况和命令行参数等等信息等等。
通过获取系统信息组件,我们就可以获取到这些数据。
选择 系统信息的类型
列出 Kettle支持的所有信息类型
自定义几个系统变更量
预览记录
结束语
本篇文章主要讲解了:生成记录组件、生成随机数组件、自定义常量数据组件、获取系统信息组件。
到这篇文章为止,kettle的输入组件,常用的基本就全介绍完了。后续主要讲解的是:kettle的输出组件。
兄弟,其实想和作是有一段距离的,你想着想着就没有了,可是你做着做着,它就落地了。
啥都别说了,兄弟们后面跟着我干就完了,我们依然掰开揉碎的方式去说。后续的内容更精彩,敬请期待,感谢兄弟们的关注!!
版权声明
本文为[飞哥大数据]所创,转载请带上原文链接,感谢
https://blog.51cto.com/51power/5248455
边栏推荐
- mysql 基本语句查询
- 缘结西安 | CSDN与西安思源学院签约,全面开启IT人才培养新篇章
- Machine learning -- naive Bayes
- Machine learning -- PCA and LDA
- Xi'an CSDN signed a contract with Xi'an Siyuan University, opening a new chapter in IT talent training
- MySQL 8.0.11 download, install and connect tutorials using visualization tools
- 基于uniapp异步封装接口请求简介
- AUTOSAR from introduction to mastery 100 lectures (52) - diagnosis and communication management function unit
- 超40W奖金池等你来战!第二届“长沙银行杯”腾讯云启创新大赛火热来袭!
- LeetCode_DFS_中等_695.岛屿的最大面积
猜你喜欢
Esp32 vhci architecture sets scan mode for traditional Bluetooth, so that the device can be searched
9419页最新一线互联网Android面试题解析大全
How do ordinary college students get offers from big factories? Ao Bing teaches you one move to win!
[wechat applet] flex layout usage record
100 GIS practical application cases (52) - how to keep the number of rows and columns consistent and aligned when cutting grids with grids in ArcGIS?
普通大学生如何拿到大厂offer?敖丙教你一招致胜!
MySQL 8.0.11 download, install and connect tutorials using visualization tools
Analysis of the latest Android high frequency interview questions in 2020 (BAT TMD JD Xiaomi)
nodeJs + websocket 循环小案例
[untitled] PID control TT encoder motor
随机推荐
Is Hongmeng system plagiarism? Or the future? Professional explanation that can be understood after listening in 3 minutes
AUTOSAR from introduction to mastery lecture 100 (84) - Summary of UDS time parameters
MySQL5.5安装教程
AUTOSAR from introduction to mastery 100 lectures (52) - diagnosis and communication management function unit
[point cloud series] relationship based point cloud completion
你和42W奖金池,就差一次“长沙银行杯”腾讯云启创新大赛!
100 lectures on practical application cases of Excel (VIII) - report connection function of Excel
C语言之字符串与字符数组的区别
innobackupex增量备份
[quick platoon] 215 The kth largest element in the array
Hbuilderx + uniapp packaging IPA submission app store stepping on the pit
基于uniapp异步封装接口请求简介
The first lesson is canvas, showing a small case
AUTOSAR from introduction to mastery 100 lectures (50) - AUTOSAR memory management series - ECU abstraction layer and MCAL layer
100 GIS practical application cases (34) - splicing 2020globeland30
uniapp image 引入本地图片不显示
在 pytorch 中加载和使用图像分类数据集 Fashion-MNIST
The difference between string and character array in C language
ESP32 VHCI架构传统蓝牙设置scan mode,让设备能被搜索到
Kernel error: no rule to make target 'Debian / canonical certs pem‘, needed by ‘certs/x509_ certificate_ list‘