当前位置:网站首页>分类、目标检测、语义分割、实例分割的区别
分类、目标检测、语义分割、实例分割的区别
2022-08-08 04:25:00 【期待686】
计算机视觉的任务很多,有图像分类、目标检测、语义分割、实例分割和全景分割等,那它们的区别是什么呢?
1、Image Classification(图像分类)
图像分类(下图左)就是对图像判断出所属的分类,比如在学习分类中数据集有人(person)、羊(sheep)、狗(dog)和猫(cat)四种,图像分类要求给定一个图片输出图片里含有哪些分类,比如下图的例子是含有person、sheep和dog三种。

2、Object detection(目标检测)
目标检测(上图右)简单来说就是图片里面有什么?分别在哪里?(把它们用矩形框框住)
目前常用的目标检测算法有Faster R-CNN和基于YOLO的目标检测的算法
3、semantic segmentation(语义分割)
通常意义上的目标分割指的就是语义分割
语义分割(下图左)就是需要区分到图中每一点像素点,而不仅仅是矩形框框住了。但是同一物体的不同实例不需要单独分割出来。对下图左,标注为人,羊,狗,草地。而不需要羊1,羊2,羊3,羊4,羊5等。
4、Instance segmentation(实例分割)
实例分割(上图右)其实就是**目标检测和语义分割**的结合。相对目标检测的边界框,实例分割可精确到物体的边缘;相对语义分割,实例分割需要标注出图上同一物体的不同个体(羊1,羊2,羊3…)
目前常用的实例分割算法是Mask R-CNN。
Mask R-CNN 通过向 Faster R-CNN 添加一个分支来进行像素级分割,该分支输出一个二进制掩码,该掩码表示给定像素是否为目标对象的一部分:该分支是基于卷积神经网络特征映射的全卷积网络。将给定的卷积神经网络特征映射作为输入,输出为一个矩阵,其中像素属于该对象的所有位置用 1 表示,其他位置则用 0 表示,这就是二进制掩码。
一旦生成这些掩码, Mask R-CNN 将 RoIAlign 与来自 Faster R-CNN 的分类和边界框相结合,以便进行精确的分割:
5、Panoramic segmentation(全景分割)
全景分割是语义分割和实例分割的结合。跟实例分割不同的是:实例分割只对图像中的object进行检测,并对检测到的object进行分割,而全景分割是对图中的所有物体包括背景都要进行检测和分割。
边栏推荐
- Risk control strategy must be learned | This method of mining rules with decision trees
- KD树应用汇总
- 手把手教你手撕SPF生成树(OSPF区域内防环)
- New ToDesk Enterprise Edition | Ten new features to make enterprise remote control safer, more convenient and smoother
- Heterogeneous on the Graph paper to share 】 【 small sample learning: HG - Meta: Graph Meta - learning over Heterogeneous Graphs
- 数据库篇复习篇
- Basic introduction to NLP
- sessionStorage在不同页签中的数据是否共享问题及解决思路
- 【直播回顾】昇思MindSpore易用性SIG2022上半年回顾总结
- The effect of base 0 or base 1 on the number of image iterations
猜你喜欢
随机推荐
KMP和EXKMP(Z函数)
一行代码统计文本中指定字符串出现的次数
LeetCode_485_最大连续1的个数
类似Bugfree的9大在线缺陷管理软件
spark入门学习-3-SparkSQL数据抽象
第4周 一步步搭建多层神经网络以及应用(1 & 2)
06 tp6 的数据更新(改)及删除 《ThinkPHP6 入门到电商实战》
Amazon Cloud Technology Build On Learning Experience
向往的开源之多YOUNG新生 | 从开源到就业的避坑指南来啦!
New ToDesk Enterprise Edition | Ten new features to make enterprise remote control safer, more convenient and smoother
L3-007 ladder map (test point 2 is stuck, you can see it)
Awk syntax-03-awk expressions (if statements, while loops, for loops), execute shell commands in awk
The sword refers to Offer 18. Delete the node of the linked list
How does JS use hexadecimal to save 100-bit state
mmedicting的get_flops.py的使用
leetcode: 455. 分发饼干
vulnhub-DC-5靶机渗透记录
The type of block in the database buffer cache
VSCode opens some records of C (embedded) projects
Week 4 Step by step building multi-layer neural network and application (1 & 2)









