当前位置:网站首页>GP如何进行数据比对?
GP如何进行数据比对?
2022-08-10 03:55:00 【MyySophia】
数据差异明细比对开发流程
需求:根据输入的时间区间,搜寻A B两库的数据同一时间的数据差异
可能使用到的linux命令 diff psql脚本
issue1 :这个时间区间可以存储在表中?
Step1 两库group by 站点比对差异
先将A库的数据根据传入的条件group by 并将结果输出到file1 再将B库的数据根据传入的条件group by 并将结果输出到file2 select ope_id,count(1) from eda.wpp_asht_ope_his_n where logof_timestamp between '2021-04-12 05:00:00' and '2021-04-12 06:00:00' group by ope_id order by ope_id
变量为: ope_id, logof_timestamp ,table_name 时间区间
将 使用linux 命令将file1和file2的差集输出到 并集:cat file1.txt file2.txt | sort | uniq > file.txt 交集: cat file1.txt file2.txt | sort | uniq -d >file.txt 差集:求file1.txt相对于file2.txt的差集,可先求出两者的交集temp.txt,然后在 file1.txt中除去temp.txt即可。 cat file1.txt file2.txt | sort | uniq -d >temp.txt cat file1.txt temp.txt | sort | uniq -u >file.txt
差集的结果能得到站点和数量 A1100 168 此处得到的是file1 和file2 有差异的那一行 ?此处取的是file1 还是file2 都可以 主要是为了获取站点作为参数传入第二段sql
Step2 两库group by 分钟域比对差异
边栏推荐
猜你喜欢
随机推荐
2022年P气瓶充装操作证考试题库及模拟考试
郑州轻工业大学OJ合集(C语言)【正在整理】
PID与ADRC
C语言结构体初识
云程发轫,万里可期 | 云扩科技再次入选Gartner《2022年中国ICT技术成熟度曲线报告》
@Autowired注解 --required a single bean, but 2 were found出现的原因以及解决方法
TCP协议之《TSQ控制》
Redis 定长队列的探索和实践
进入Mysql数据库操作
leetcode 283:移动零
TCP协议之《QUICKACK模式》
矛盾的地方
ZZULIOJ:1015: 计算时间间隔
结构体的内存对齐问题
机器学习之聚类——双聚类简介及简单案例
Flink CDC介绍和个人理解
2022/8/9
兴盛优选监控场景的时序数据库选型与落地实践
TCP协议之《TCP_CORK选项》
TCP协议之《对端MSS值估算》