当前位置:网站首页>GP如何进行数据比对?
GP如何进行数据比对?
2022-08-10 03:55:00 【MyySophia】
数据差异明细比对开发流程
需求:根据输入的时间区间,搜寻A B两库的数据同一时间的数据差异
可能使用到的linux命令 diff psql脚本
issue1 :这个时间区间可以存储在表中?
Step1 两库group by 站点比对差异
先将A库的数据根据传入的条件group by 并将结果输出到file1 再将B库的数据根据传入的条件group by 并将结果输出到file2 select ope_id,count(1) from eda.wpp_asht_ope_his_n where logof_timestamp between '2021-04-12 05:00:00' and '2021-04-12 06:00:00' group by ope_id order by ope_id
变量为: ope_id, logof_timestamp ,table_name 时间区间
将 使用linux 命令将file1和file2的差集输出到 并集:cat file1.txt file2.txt | sort | uniq > file.txt 交集: cat file1.txt file2.txt | sort | uniq -d >file.txt 差集:求file1.txt相对于file2.txt的差集,可先求出两者的交集temp.txt,然后在 file1.txt中除去temp.txt即可。 cat file1.txt file2.txt | sort | uniq -d >temp.txt cat file1.txt temp.txt | sort | uniq -u >file.txt
差集的结果能得到站点和数量 A1100 168 此处得到的是file1 和file2 有差异的那一行 ?此处取的是file1 还是file2 都可以 主要是为了获取站点作为参数传入第二段sql
Step2 两库group by 分钟域比对差异
边栏推荐
猜你喜欢
随机推荐
兴盛优选监控场景的时序数据库选型与落地实践
@Autowired注解 --required a single bean, but 2 were found出现的原因以及解决方法
TCP协议之《发送缓存控制tcp_notsent_lowat》
ZZULIOJ:1028: I love 闰年!
【Verilog数字系统设计(夏雨闻)5-------模块的结构、数据类型、变量和基本运算符号1】
数据仓库建模实践
数据库中数据的正确性和相容性是什么
一种能让大型数据聚类快2000倍的方法,真不戳
TCP协议之《延迟ACK策略》
TCP协议之《自动阻塞CORK控制》
结构体的内存对齐问题
mysqldump和XBK备份
长沙:借网红的风,铺长红的路
请问mindspore支持l1范数归一化吗
JVM类加载机制
Flutter 如何安装 pub.dev 上的 package
golang gin 框架读取无法用 body 传递的表单参数
智能锁控板的主要功能有哪些?如何使用?
质量小议13 -- 侥幸
域名DNS解析工具ping/nslookup/dig/host









