当前位置:网站首页>End-to-End Lane Marker Detection via Row-wise Classification
End-to-End Lane Marker Detection via Row-wise Classification
2022-08-03 22:51:00 【Recursi】
目录
Lane Marker Vertex Location Loss:
Abstract
在本文中,我们提出了一种以端到端方式进行直接车道标记顶点预测的方法,该方法将车道标记检测问题转化为行分类任务,并且不需要任何后处理步骤。
为提取图像中车道信息,受[8]启发,我们设计了一个新的层
1. Introduction
我们的网络称为E2E-LMD
contribution
1)我们提出了一个新的和直观的框架来检测车道。
2)所提出的方法在两个基准数据集的方法相当或优于最近最先进的方法
3)通过大量的实验和可视化,表明该方法能够有效地捕获车道标记表示。
2. Related Work
除了基于分割的方法外,车道线还可以通过基于gan的方法进行检测。
3. Proposed Method
受最近[8,18]的启发,我们将车道线检测问题视为在图像中寻找每个车道的水平位置的集合。
给定一个输入图像X∈R3×h×w,其中h和w分别为图像的高度和宽度。
![]()
表示每条车道线
目标是找到一个点集

N是X中的车道标记的数量,K是每条车道线点的总数。
3.1. Network Architecture

第一阶段是一个通用的编解码器分割网络,经过编码器和解码器后得到一个输出
但是与标准的语义分割方法相比,我们只恢复分辨率作为输入大小的一半,以降低计算复杂度。
在第二阶段,高不改变,使用hHRM模块压缩。
在最后的第三阶段,我们有两个车道标记li的分支:一个行顶点位置分支和一个顶点置信分支。这些分支对最后一个HRMs特征进行分类化和置信回归,其中空间分辨率只有垂直维度,而通道大小满足目标水平分辨率h0,即h0=h/2。
行顶点位置,分支预测水平位置
顶点方向的置信度分支预测存在置信度vcij(xij,yij)是否有效。
Horizontal Reduction Module:
我们向下采样的水平组件添加了一个具有1×1卷积的水平平均池化层,步距为r,宽度减为W/r。
受[24,32]的像素洗牌层的启发,我们建议重新排列C×H×W输入张量的元素,在残差分支中形成一个形状为
rC×H×W/r的张量,这是对[32]中原始像素洗牌块的反向操作,即所谓的水平像素反洗牌层。
作者说这样可以通过重新排列表示方式,我们可以有效地将空间信息移动到通道中。
然后应用卷积操作将增加的信道rC减少到C,这不仅降低了计算复杂度,而且有助于有效地压缩像素解洗牌
操作中的车道标记空间信息。
最后为了进一步提高不同车道线的区分,作者加了SE模块

![]()

图三:可视化:所提出的体系结构还是成功地压缩了空间车道标记信息。

图四:我们观察到,在SE块后,车道表示变得更明显,很容易彼此分离。
3.2. Training
Lane Marker Vertex Location Loss:
由于我们将车道标记检测定义为对车道标记水平位置的行级分类,因此可以使用任何用于分类的损失函数
KL散度用来衡量两个概率分布之间的差异
4. Experiments
4.1. Results

4.2. Ablation Experiments

在表中评估了SE块的位置和存在性对HRM层的影响
(1)Pre-SE块,其中SE块在水平像素展开层之前移动
(2)标准-SE块,其中SE块是在剩余操作之后
(3)后SE块,其中在标识连接相加之后移动SE块
后SE比其他配置要好得多。似乎残余分支末端的SE块有助于恢复车道标记的独特性,在压缩残余ConvBN层中
的通道时可能会丢失这些信息
The number of shared HRM:

Loss function:


边栏推荐
- How many way of calling a function?
- Lift, Splat, Shoot: Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D 论文笔记
- UVa 437 - The Tower of Babylon(白书)
- FinClip,助长智能电视更多想象空间
- 创建函数报错,提示DECLARE定义语法问题
- Cloud platform construction solutions
- 伴随着元宇宙、web3.0等概念的兴起,数字人、数字场景等诸多数字化的形态开始出现
- Bytebase database schema change management tool
- 为什么我们需要回调
- 走迷宫 BFS
猜你喜欢

易观分析:2022年Q2中国网络零售B2C市场交易规模达23444.7亿元

node连接mysql数据库报错:Client does not support authentication protocol requested by server

关于IDO预售系统开发技术讲解丨浅谈IDO预售合约系统开发原理分析

AOSP CameraLatencyHistogram的原理与使用

Embedded Systems: GPIO

目标检测技术研究现状及发展趋势

Click the icon in Canvas App to generate PDF and save it to Dataverse

win10系统下yolov5-V6.1版本的tensorrt部署细节教程及bug修改

《数字经济全景白皮书》金融数字用户篇 重磅发布!

Fluorescein-PEG-CLS,胆固醇-聚乙二醇-荧光素科研试剂
随机推荐
获国际权威认可 | 云扩科技入选《RPA全球市场格局报告,Q3 2022》
Quickly build a website with static files
授人以渔 - 如何自行查询任意 SAP UI5 控件属性的文档和技术实现细节试读版
3D 语义分割——2DPASS
易观分析:2022年Q2中国网络零售B2C市场交易规模达23444.7亿元
UVa 10003 - Cutting Sticks(白书,区间DP)
软件测试内卷严重,如何提升自己的竞争力呢?
电商秒杀系统
完全二叉树问题
Shell编程的条件语句
Testng监听器
【MySQL进阶】数据库与表的创建和管理
软测人每个阶段的薪资待遇,快来康康你能拿多少?
2022-08-03 oracle执行慢SQL-Q17对比
最小化安装debian11
navicat 连接 mongodb 报错[13][Unauthorized] command listDatabases requires authentication
What is memoization and what is it good for?
如何基于WPF写一款数据库文档管理工具(二)
【bug】汇总Elipse项目中代码中文乱码解决方法!
嵌入式系统:时钟