当前位置:网站首页>OOD论文:Revisit Overconfidence for OOD Detection
OOD论文:Revisit Overconfidence for OOD Detection
2022-08-10 00:55:00 【choose_c】
论文全名:Revisit Overconfidence for OOD Detection: Reassigned Contrastive Learning with Adaptive Class-dependent Threshold
论文地址:https://aclanthology.org/2022.naacl-main.307.pdf
代码链接:https://github.com/pris-nlp/NAACL2022-Reassigned_Contrastive_Learning_OOD
论文被NAACL2022接收。
中文名:重新审视OOD检测的过度自信:基于自适应类相关阈值的重分配对比学习
挑战
OOD检测的主要挑战是神经网络模型的过度自信:
1.ood过度自信:ind数据被识别成ood数据,原因是域内的不同类别的样本相似性太高,分散了最置信的类别的分数。
本文方法:重分配的对比学习。
2.ind过度自信:ood数据被识别成ind数据,与域内的样本伪相似
本文方法:自适应的类相关的阈值
现状
ood的大部分工作基于非监督的ood检测,只是基于标注的样本内数据,没有样本外的数据;这样的话缺少了ood的先验知识。
OOD检测
无监督模型只使用ind数据,基于阈值的策略;然后使用验证集中有标签的ood数据微调一个固定的全局阈值参数。
另外的方法使用一部分ood数据和ind数据训练一个N+1的分类器。(熵正则化,对抗增强)
对比学习
无监督对比学习:域内有标签数据的交叉熵损失和无标签数据间的对比损失,需要很多标签的数据并且无法显示区分不同意图类型。
有监督对比学习:只使用有标签ind数据学习区分意图表示。但是类似意图类别之间还是很难区分
方法
对于odd过度自信,构建困难对比对(域内易错分样本),通过有监督对比学习区分域内相似意图表示;重分配对比学习:给易混淆的ind类别更多的惩罚,用来学习区分意图表示,
对比学习样本构建:
普通的对比学习,一个样本的两个不同的view是正对,和其他样本是负对;
监督对比学习,同一个意图的样本作为正例,不同意图样本为负例;
这些方法忽略了类似意图的易混淆关系。
所以提出了重分配的对比学习框架:
1. 训练域内分类器,使用域内数据 交叉熵损失 训练一个分类模型;
2. 混淆类别对数据的对比学习,普通对比学习使用表示的相似性(有偏差)生成对比对,RCL使用分类模型预测结果构建;
3.全局数据的对比学习,避免知识的遗忘。
对于ind过度自信,自适应类相关阈值机制来区分相似的域内意图和域外意图;
调整类相关的局部阈值,相关的ood和ind类有更高的阈值。
自适应类相关局部阈值
之前的方法使用全局的阈值进行ood的检测,但是如果某个ood样本和ind类别很相近,高的置信分会造成错认为是域内数据。
对于每个域内类别我们都生成一个置信分数;
使用存在的检测器,得到所有数据(ood、ind)的域内类别,得到每个意图的局部阈值,没有ood数据的意图类别使用全局阈值。
------------------------------------------------------------------------------
另外再记录一篇ood相关论文:ViM: Out-Of-Distribution with Virtual-logit Matching
该论文认为:
特征是空间是d维的,类别数是k,在最后softmax层会进行降维至k个logits;
降维过程会保留分类相关的特征,ood相关的特征则会损失,所以不能进行准确的ood分类。
最后保留下来的logit维度上的就是特征空间的主成分维度,在这些维度上的score高说明是ind数据,相反在损失的那些维度上score高的则是odd的数据,所以通过特征转换得到主成分空间的正交补空间,通过缩放与logit向量一起进行最后的计算。
边栏推荐
- [LeetCode] Find the sum of the numbers from the root node to the leaf node
- 跳房子游戏
- Pagoda measurement - building LightPicture open source map bed system
- XSS详解及复现gallerycms字符长度限制短域名绕过
- DALL·E-2是如何工作的以及部署自己的DALL·E模型
- 分析 20 个 veToken 生态系统协议 这种代币模型为何受欢迎?
- 为什么字符串一旦创建就不可以改变?
- 开发IM即时通讯容易吗?需要什么技术
- 人际关系不仅要“存”,更要“激活”!
- UI遍历的初步尝试
猜你喜欢
Penetration Testing and Offensive and Defense Confrontation - Vulnerability Scanning & Logic Vulnerability (Part1)
罗彻斯特大学 | 现在是什么序列?蛋白质序列的贝叶斯优化的预训练集成
【无标题】
Experimental support for decorators may change in future releases.Set the "experimentalDecorators" option in "tsconfig" or "jsconfig" to remove this warning
多线程之自定义线程池
数据建模已死,真的吗?
基于设计稿识别的可视化低代码系统实践
【LeetCode】求根节点到叶节点数字之和
初步认识对象
[LeetCode] Find the sum of the numbers from the root node to the leaf node
随机推荐
3438. 数制转换
Mysql database ALTER basic operations
万字总结:分布式系统的38个知识点
DALL·E-2是如何工作的以及部署自己的DALL·E模型
【Grpc】简介
Xi'an biotin-tetrapolyethylene glycol-amide-4phenol light yellow semi-solid
XSS高级 svg 复现一个循环问题以及两个循环问题
Solidity最强对手:MOVE语言及新公链崛起
Not, even the volume of the king to write code in the company are copying and pasting it reasonable?
CVPR22 Oral|通过多尺度token聚合分流自注意力,代码已开源
Fedora 36 dnf 安装ModSecurity和 OWASP 核心规则集
Docker interview question 2--get the number of database connections and docker-compose
XSS详解及复现gallerycms字符长度限制短域名绕过
Solidity最强对手:MOVE语言及新公链崛起
MySQL最大连接数限制如何修改
type-C 边充电边听歌(OTG) PD芯片方案,LDR6028 PD充电加OTG方案
多线程之享元模式和final原理
【LeetCode】求根节点到叶节点数字之和
Qt的pro文件递归搜寻添加文件
浏览器中的history详解