当前位置:网站首页>分类、目标检测、语义分割、实例分割的区别
分类、目标检测、语义分割、实例分割的区别
2022-08-08 04:25:00 【期待686】
计算机视觉的任务很多,有图像分类、目标检测、语义分割、实例分割和全景分割等,那它们的区别是什么呢?
1、Image Classification(图像分类)
图像分类(下图左)就是对图像判断出所属的分类,比如在学习分类中数据集有人(person)、羊(sheep)、狗(dog)和猫(cat)四种,图像分类要求给定一个图片输出图片里含有哪些分类,比如下图的例子是含有person、sheep和dog三种。

2、Object detection(目标检测)
目标检测(上图右)简单来说就是图片里面有什么?分别在哪里?(把它们用矩形框框住)
目前常用的目标检测算法有Faster R-CNN和基于YOLO的目标检测的算法
3、semantic segmentation(语义分割)
通常意义上的目标分割指的就是语义分割
语义分割(下图左)就是需要区分到图中每一点像素点,而不仅仅是矩形框框住了。但是同一物体的不同实例不需要单独分割出来。对下图左,标注为人,羊,狗,草地。而不需要羊1,羊2,羊3,羊4,羊5等。
4、Instance segmentation(实例分割)
实例分割(上图右)其实就是**目标检测和语义分割**的结合。相对目标检测的边界框,实例分割可精确到物体的边缘;相对语义分割,实例分割需要标注出图上同一物体的不同个体(羊1,羊2,羊3…)
目前常用的实例分割算法是Mask R-CNN。
Mask R-CNN 通过向 Faster R-CNN 添加一个分支来进行像素级分割,该分支输出一个二进制掩码,该掩码表示给定像素是否为目标对象的一部分:该分支是基于卷积神经网络特征映射的全卷积网络。将给定的卷积神经网络特征映射作为输入,输出为一个矩阵,其中像素属于该对象的所有位置用 1 表示,其他位置则用 0 表示,这就是二进制掩码。
一旦生成这些掩码, Mask R-CNN 将 RoIAlign 与来自 Faster R-CNN 的分类和边界框相结合,以便进行精确的分割:
5、Panoramic segmentation(全景分割)
全景分割是语义分割和实例分割的结合。跟实例分割不同的是:实例分割只对图像中的object进行检测,并对检测到的object进行分割,而全景分割是对图中的所有物体包括背景都要进行检测和分割。
边栏推荐
- CARLA 笔记(05)— Actors and blueprints(创建和修改 Blueprint、生成 Spawning、使用 Handling、销毁 Destruction)
- A line of code counts the number of occurrences of the specified string in the text
- Vulfocus Shooting Range Scenario Mode - Intranet Dead End
- The effect of base 0 or base 1 on the number of image iterations
- The 5 most mainstream project time management systems in China
- 实现Express中间件原理
- Mini Program Optimization Practice
- Personalized use of Qt log module
- leetcode: 455. 分发饼干
- NorFlash的存储原理
猜你喜欢

vulnhub-DC-5靶机渗透记录

Strong Net Cup 2019 - Casual Bet (Stacked Injection)

小程序优化实践

风控策略必学|这种用决策树来挖掘规则的方法

基于MindSpore框架的数字调制信号盲识别研究

响应式pbootcms模板健身器械类网站

2022-08-07 mysql/stonedb慢SQL-子查询-半连接

The fledgling Xiao Li's 115th blog project notes on the creation of the domestic GD32F103RCT6 basic project

新零售项目及离线数仓核心面试,,220807,,

awk语法-03-awk表达式(if语句、while循环、for循环)、awk中执行shell命令
随机推荐
L3-005 垃圾箱分布
失业在家的6个月,我通过外包全款买了房:你看不起的行业,往往很赚钱
How to avoid bugs as much as possible
2022/08/06 学习笔记 (day24) 集合
A line of code counts the number of occurrences of the specified string in the text
y90.第六章 微服务、服务网格及Envoy实战 -- 服务网格基础(一)
32. 你知道Redis的字符串是怎么实现的吗?
实现Express中间件原理
强网杯 2019-随便注 (堆叠注入)
vulnhub-DC-3靶机渗透记录
类似Bugfree的9大在线缺陷管理软件
B. Reverse Binary Strings
Building a High-Performance Platform on AWS Using Presto and Alluxio to Support Real-Time Gaming Services
MySQL从入门到入土【20W字收藏篇】
初出茅庐的小李第115篇博客项目笔记之国产GD32F103RCT6基础工程创建
The sword refers to Offer 17. Print the n digits from 1 to the largest
数据库缓冲区高速缓存中块的类型
内修昇思MindSpore AI框架,外重行业汇聚,华为大模型的不平凡之路
leetcode: 122. 买卖股票的最佳时机 II
unity之粒子特效制作图片拼合文字效果