当前位置:网站首页>目标检测类间不平衡问题
目标检测类间不平衡问题
2022-08-09 13:10:00 【花椒酱不吃花椒喵】
思路一:
解决方法:
1)数据扩充。这是最简单的解决办法,通过数据扩充是检测的若干类物体达到均衡。
2)种类惩罚。有时候,数据扩充并不能完全解决所有的问题。例如在一张图片中,树和草往往同时出现,这时无论怎么进行数据扩充,草这一类的数量还是远多于树的。这时可以采取种类惩罚的方法,即在loss计算的时候,人为提高数量较少类的loss的权重,从而提高这一类对损失的贡献,从而实现数据均衡的目的
具体方法:
在segnet中,作者采用了Median-frequency-balancing的方法,
同样的,检测中计算该类目标的概率和目标概率的中位数
参考:
https://blog.csdn.net/helloworld1213800/article/details/84203628
https://blog.csdn.net/the_key0/article/details/89889243
思路二:Libra-RCNN
https://www.zhihu.com/question/336055782
搜索Focal loss, balanced L1 loss, Libra-RCNN
(a)Sample level imbalance:
OHEM,能够更多的关注hard samples,但是它们通常对噪音很敏感,并会产生相当大的内存和计算成本;RetinaNet中提出了著名的损失函数Focal loss,应用于one-stage的效果较好,但是,扩展到大部分样本为简单负样本的two-stage模型中,效果一般。
(b)Feature level imbalance
我们知道,底层特征拥有高分辨率信息,随着卷积层数的加深,高层特征拥有更丰富的语义信息。把高分辨率信息和丰富的语义信息结合能显著增强特征表达,FPN,PANet都是这方面的成功案例。
边栏推荐
- NC7 买卖股票的最好时机(一)
- LeetCode 37. Solve Sudoku
- vim常用命令
- Professor Chen Qiang the machine learning and R application course chapter 18 assignments
- Unity3d_API_GPS_LocationService
- 行程和用户[阅读理解法]
- FFmpeg multimedia file processing (FFMPEG logging system)
- TCP三次握手和四次挥手及拥塞控制
- RobotFramework 之 库与关键字
- Uni - app - uview Swiper shuffling figure component, click on the links to jump (click to get the item after the row data, remove data operation)
猜你喜欢
Unity3d_API_Gyroscope 陀螺仪的接口
TCP三次握手和四次挥手及拥塞控制
Oracle Recovery Tools修复空闲坏块
蓝桥杯线上模拟赛——Flex 经典骰子布局
Uni - app - uview Swiper shuffling figure component, click on the links to jump (click to get the item after the row data, remove data operation)
PO、DO、TO、VO、DO、DTO、DAO、POJO都是什么?
GIN文件上传与返回
IDEA Gradle 常遇问题(一)
FFmpeg相机花屏花图问题解决方法
剑指offer,剪绳子2
随机推荐
Q_04_04 Q#类型模型
RTSP协议的实现
X264性能优化
Professor Chen Qiang "application in machine learning and R" course chapter 17
FPGA - Summary of bugs in ISE (in update)
Ledong Fire Rescue Brigade was invited to carry out fire safety training for cadres
javscript基础易错点集合
Draw a histogram with plot_hist_numeric()
Microsoft 10/11 命令行打开系统设置页(WUAP,!WIN32)
IDEA Gradle 常遇问题(二)(持续更新)
技嘉显卡 RGBFusion 不能调光解决方法
FFmpeg multimedia file processing (the basic concept of ffmpeg processing stream data)
NC15 求二叉树的层序遍历
为什么文字不贴合边
GET POST PUT DELETE request in GIN
NC84 完全二叉树结点数
JS动画函数封装
RobotFramework 之 资源文件
NC193 二叉树的前序遍历
LeetCode 37.解数独