当前位置:网站首页>蒸馏学习框架小抄(1)
蒸馏学习框架小抄(1)
2022-08-07 00:10:00 【Andy Dennis】
前言
大模型大行其道,但是当实际落地时,需要考虑硬件和运行功耗,因此企业更希望部署的是“小”模型。因此学习一些蒸馏技术就成为一些算法工程师必备的技能点。
蒸馏骨干
TinyViT
论文: TinyViT: Fast Pretraining Distillation for Small Vision Transformers
代码: https://github.com/microsoft/Cream/tree/main/TinyViT

博文: ECCV22|只能11%的参数就能优于Swin,微软提出快速预训练蒸馏方法TinyViT
半监督
DTG-SSOD
22.07
论文 DTG-SSOD: Dense Teacher Guidance for Semi-Supervised Object Detection
博文: DTG-SSOD:最新半监督检测框架,Dense Teacher

数据蒸馏
R2L
2022 ECCV
论文: R2L: Distilling Neural Radiance Field to Neural Light Field for Efficient Novel View Synthesis
博文: ECCV 2022|Snap&东北大学提出R2L:用数据蒸馏加速NeRF
代码: https://github.com/snap-research/R2L

边栏推荐
- What is the matter with several IP addresses of this machine?to analyze
- Commonly used mail servers support ports and encryption methods measured
- 【Day_13 0509】参数解析
- Is it reliable to buy stocks with great wisdom?is it safe?
- 多项式与生成函数教程合集
- (ECCV-2022)GaitEdge:超越普通的端到端步态识别,提高实用性(续)
- Flutter APNS device token not set before retrieving FCM Token for Sender ID
- Uuid 32-bit data processing, 16
- 图注意力机制理解
- Can wechat applet and qq applet be developed on the same cloud?
猜你喜欢

Understanding the Graph Attention Mechanism

复制天猫的宝贝上传到淘宝,SKU自定义属性值没有复制过来是什么原因?

服务端没有 listen,客户端发起连接建立,会发生什么?

leetcode 25. K 个一组翻转链表

布隆过滤器简单实现添加和判断功能

NAT穿越技术详细介绍

【kali-漏洞利用】(3.4)免杀Payload 生成工具(下):Veil后门使用、监听失败原因

A Preliminary Study of Web Development: The Box Model of Web Page Layout

azkaban

vi学习(2)【常用命令包括移动光标/选中文本/撤销和反撤销/删除文本/复制粘贴/查找替换/插入】
随机推荐
买股票用大智慧交易靠谱吗?安全吗?
本机的几个IP地址是怎么回事?来分析分析
Those MP3s that are reluctant to delete--modify the ID3tag of mp3 in batches
leetcode 24. 两两交换链表中的节点
多项式——多项式牛顿迭代
测试工程师转开发希望大吗?
Sql server无法启动
2022.8.4 模拟赛
Public Relations and Interpersonal Skills
2.基于ITIL的IT服务管理基础篇 --- IT服务管理的背景
MySql操作之DDL
php three-dimensional array merge and accumulate their values according to a key
【字符串中处理类String的使用】
记录一起走过的那些日子
Talking about API Gateway
【搜索专题】看完必会的BFS解决最小步数问题攻略
【每日一题】1408. 数组中的字符串匹配
公共关系学知识点整理
数据库查询
js中的原型与原型链