当前位置:网站首页>[论文阅读] Active Class Incremental Learning for Imbalanced Datasets
[论文阅读] Active Class Incremental Learning for Imbalanced Datasets
2022-04-22 02:23:00 【xiongxyowo】
论文地址:https://arxiv.org/abs/2008.10968
发表于:ECCV 20 Workshop
Abstract
增量学习(IL)使人工智能系统能够适应流式数据。大多数现有的算法提出了两个强有力的假设,降低了增量方案的现实性:(1)假设新数据在流式传输时很容易被标注;(2)用平衡的数据集进行测试,而大多数现实生活中的数据集是不平衡的。这些假设被摒弃了,由此产生的挑战将通过主动学习和不平衡学习的结合来解决。我们引入了解决不平衡问题并与增量学习约束兼容的样本获取函数。我们还将增量学习视为一个不平衡学习问题,而不是针对灾难性遗忘的知识提炼的既定用法。在这里,不平衡效应在推理过程中通过类别预测的缩放来减少。用四个视觉数据集进行了评估,并比较了现有的和提出的样本获取功能。结果表明,提出的贡献具有积极的作用,并减少了主动和标准增量学习性能之间的差距。
I. Introduction
本文为第一篇将类增量学习与主动学习相结合的工作。当前的类增量学习有两个问题:1)数据标注简单;2)数据集均衡。而在实际应用中,这两个要求并不总是能满足,而主动学习的任务则是挑选出最有价值的样本,适合用于在尽可能保持性能的情况下,减少标注量并解决数据集不均衡问题。因此,可以将主动学习与增量学习相结合。
本文的算法流程如下:

由于本质上是将主动学习加在类增量学习方法上,因此,模型的初始化方式与类增量学习,都是选择部分类(如50%的类)的所有样本进行标注,然后在此基础上进行全监督训练得到一个初始模型(图中的 M 0 M_0 M0)。之后,如果按照标准类增量学习的流程,则是不断选择部分新类(如10%的类)的所有样本,在此基础上进行finetune,并尽可能保持新旧类的性能。不过,既然是主动学习,那么这里则变成了选择部分新类(如10%的类)的部分样本。
而至于这些部分样本的选择,使用的是主动学习的思路。比方说,假设对于该批数据的标注预算为B,则每次选取1/5 B的数据与示例样本(exemplar)一同进行finetune,而非主动学习中常见的retrain。从这一视角出发,也可以认为是类增量学习改善了主动学习中的一个经典困境(需要反复retrain)。
II. Classical Sample Acquisition Phase
本文的主动学习采取了两阶段的策略。在第一阶段,采用一些经典的主动学习方法进行初始化。本文选择了coreset、random、entropy、margin sampling这四种方法(注意这里甚至有random)。而这些方法是没有考虑类别不均衡问题的,而本文的假设是类不均衡,为此,就诞生了第二阶段。
III. Balancing-Driven Sample Acquisition
第二阶段是为了解决类不均衡问题。不过,解决方法也相当原始,即采用经典的oversample策略:哪些类已标注的样本较少,后序就对这些类多标注一些,文中称这一启发式策略为"Poorest Class First"。
IV. Experiment

注意本文的目标是和全监督的类增量比(也就是倒数第二列的sIL)。不过实验结果也是比较一言难尽,与sIL性能差距依旧较大不说,最优的主动学习方法还基本被random所占据,基本等于没做。
版权声明
本文为[xiongxyowo]所创,转载请带上原文链接,感谢
https://blog.csdn.net/qq_40714949/article/details/124312917
边栏推荐
- 二元交叉熵损失函数
- 2022年物联网安全的发展趋势
- [check which package provides the installed packages and commands]
- Unapp encapsulates a loading animation
- 高级面试题 解析,阿里巴巴发布“限量版”Android零基础宝典
- Analysis of five data structures of redis
- SED and awk tools of shell
- Shit, someone poisoned my code comments?
- Tensorflow 2.x(keras)源码详解之第五章:数据预处理
- Nacos 为什么这么强
猜你喜欢
![[FAQ] Anaconda prompt reports an error. Solving environment: failed](/img/c9/e92a27b4150bcbc5ec1654f75a1b65.png)
[FAQ] Anaconda prompt reports an error. Solving environment: failed

互联网行业为什么能吸引越来越多的年轻人?尤其是程序员……

Profiteering method of blind box project

What do you learn about programming

uniapp实现出生日期/时间选择效果

Leetcode 733, image rendering

编程主要学什么

语义分割之FCN网络详解 全卷积网络

Leetcode-232 - queue implementation with stack
![[timing] reformer: local sensitive hash (LSH) to achieve efficient transformer paper notes](/img/8a/2214bb4f8595ac2d0871cb2c190f00.png)
[timing] reformer: local sensitive hash (LSH) to achieve efficient transformer paper notes
随机推荐
Unity game optimization - third edition reading notes Chapter 1 analyze performance problems
From the DX level, WPF rendering Caton
高级UI都没弄明白凭什么拿高薪,劲爆
Why can the Internet industry attract more and more young people? Especially programmers
49 pages enterprise digital transformation cases and common tools enterprise digital transformation ideas
Header DHCP service configuration
YOLOv3论文翻译
SQLSERVER解析JSON时string value中换行符问题
XSS cross site script attack learning record
详解各类云计算模型,企业如何使用每种模型提高业务生产力?
[timing] reformer: local sensitive hash (LSH) to achieve efficient transformer paper notes
The accuracy of Microsoft's new tools is 80%? Programmer: Thank you
14.系统信息查看
Shell basic syntax
Use Wx The showactionsheet selection box modifies the information in the database. Why does it report an error that data is not defined
(counting line segment tree) lintcode medium 248 · count the number of numbers smaller than a given integer
cv2.drawContours() 的contours自定义格式 是什么样子的
DEJA_VU3D - Cesium功能集 之 012-军事标绘系列六:自定义多边形
Fluent music player audioplayer
cv2. What is the custom format of drawcontours()