当前位置:网站首页>7.23 ICML直播 | 浙江大学DCD实验室况琨团队:元学习去混杂、多智能体强化学习、因果推理
7.23 ICML直播 | 浙江大学DCD实验室况琨团队:元学习去混杂、多智能体强化学习、因果推理
2022-08-06 05:25:00 【TechBeat人工智能社区】

正在如火如荼展开的ICML 2022即将进入尾声,但是摊儿还得续上!
北京时间7月23日(本周六)上午10点,将门-TechBeat人工智能社区很开心邀请到浙江大学计算机学院数字媒体计算与设计实验室的况琨副教授和3位在读博士生——蒋胤傑、李佳晖、吴安鹏,为大家讲解在本次ICML上的三篇工作,并进行实时Q&A,内容涵盖:
① 元学习中的去混杂方法
② 多智能体强化学习中的去混淆值分解方法
③ 混淆平衡因果工具变量回归法
(本次ICML云际会周日第二场还邀请到 清华叉院智能系统与机器人课题组 哦,欢迎大家及时关注!)
B站直播间地址:TechBeat人工智能社区的个人空间_哔哩哔哩_Bilibili
视频号直播:关注“TechBeat人工智能社区”视频号进行预约
*直播回顾将在视频号、B站、TechBeat(www.techbeat.net)同步上架
活动议程 + 报名

活动福利
活动中将进行互动Q&A,我们将在视频号和B站直播间中抽取3位提问最积极走心的同学送出“夏日运动礼包”(内含:运动头带、运动毛巾、超大容量不锈钢水杯、单肩包)!
团队介绍
▽

团队名称
浙江大学DCD实验室
团队介绍
浙江大学计算机学院数字媒体计算与设计实验室(Digital media Computing & Design Lab,简称为 DCD):初建于 1998年。团队围绕跨媒体计算、人工智能、大数据理论与应用三大方向,以合作承担国家重大(重点)项目为契机,历经将近 20 年建设,形成了优秀研究群体。团队核心成员以中青年人才为主体,年富力强,开拓创新,他们都活跃在教学科研第一线,拥有深厚理论功底和丰富科研经验,具有以国际学科前沿、国家需求和实际应用为导向的社会责任感,也具有充沛时间和精力完成好本团队科研任务。团队研究具有明显跨学科和交叉特色,为研究内容顺利实施奠定了学科交叉人才基础。
团队老师

况琨
况琨,浙江大学计算机学院副教授,博士生导师,人工智能系副主任。2019年获得清华大学计算机科学与技术专业博士学位,2017-2018年访问美国斯坦福大学。获2021年度中国科协青年人才托举工程项目支持,2021年度中国电子学会科学技术奖(科技进步)一等奖,2020年度中国人工智能学会优秀博士学位论文提名奖。主要研究方向包括因果推理、人工智能、因果可信机器学习,关注机器学习的可解释性、稳定性、公平性和可决策性。在数据挖掘和机器学习领域已发表近50余篇顶级会议和期刊文章,包括KDD、ICML、MM、AAAI、TKDE、TKDD、Engineering等。
工作及分享嘉宾
▽
①
元学习中的去混杂方法
(The role of deconfounding in meta-learning)

蒋胤傑
工作介绍
元学习能够在元训练任务中学到的元知识,已经成为快速学习少样本任务的有效手段。然而,最近的证据表明,元知识仅记忆所有元训练任务,这会阻碍特定任务的适应且不具备泛化能力,即在元学习中存在不良的记忆效应。目前已经有几种减轻这种影响的解决方案,包括基于正则化和基于数据增强的方法,但仍然缺乏对这些方法的系统理解。在本文中,我们通过因果理论的视角,发现通用标签空间作为混杂因素是导致记忆效应的因素,并总结出了过去的方法如何对抗记忆效应。此外,我们通过因果理论中的前门调整策略,提出了两种简单但有效的去混杂算法,即通过 Dropout 对元知识的多个版本进行采样,以及将元知识分组到多个箱中。我们所提出的因果观点不仅带来了两种去混杂因素的算法,能够在四个基准数据集中超越了以前的工作,而且还为元学习开辟了一个全新的方向。
分享嘉宾
蒋胤傑,浙江大学博士研究生
个人介绍
蒋胤傑,本科毕业于浙江大学,现就读于浙江大学计算机学院,主要研究大规模预训练,AI for Science,Meta-learning。曾在腾讯AI lab、药明康德实习,相关工作发表于ICML, Engineering等国际顶级期刊会议。
个人主页:
https://github.com/YinjieJ
②
多智能体强化学习中的去混淆值分解方法
(Deconfounded Value Decomposition
for Multi-agent Reinforcement Learning)

李佳晖
工作介绍
多智能体强化学习中, 受限于部分可观察性和通信限制,每个智能体需要根据本地行动观察历史做出自己的决定,这需要去中心化策略的学习。然而,主流的值分解方法在一些困难场景中表现不佳。为了找出限制模型性能的原因,我们将其归纳为因果图,并发现环境成为了混杂因子,从而影响了模型训练过程中credit assignment步骤的直接因果效应。对此,我们提出了一种新的因果结构以及训练方法,可以有效的去除环境这一混杂因子带来的影响,大幅提升模型的性能。
分享嘉宾
李佳晖,浙江大学在读博士生
个人介绍
李佳晖,本科毕业于华南理工大学,硕士毕业于浙江大学软件学院,现就读于浙江大学计算机学院。主要研究方向为多智能体强化学习,神经网络的可解释性。曾在KDD,ACMMM,ICML等顶级会议发表相关研究。
③
混淆平衡因果工具变量回归法
(Instrumental Variable Regression with Confounder Balancing )

吴安鹏
工作介绍
在因果科学中,未观测到的混淆变量将给因果效应估计带来额外的偏倚,为了纠正模型,研究者们提出使用两阶段最小二乘法进行工具变量回归。最近,当研究者开始研究高维和非线性模型时,在结果变量回归阶段错误地引入了来自协变量的不平衡偏倚,为了纠正这种不平衡线性,我们提出了在原始模型两阶段回归的基础上加入了表征平衡模块,使得模型在加性噪声假设乃至更普遍的同质性假设下都能够识别估计因果效应。
分享嘉宾
吴安鹏,浙江大学在读研究生
个人介绍
吴安鹏,浙江工业大学本科毕业,现就读于浙江大学计算机学院直博生二年级,师从况琨副教授和吴飞教授,主要研究方向为因果推理、表征学习以及推荐系统。在TKDD、TKDE、ICML等顶级国际期刊会议上发表过3篇文章。
个人主页:
https://scholar.google.com/citations?view_op=search_authors&mauthors=anpeng+wu&hl=zh-CN&oi=ao
报名+入群
点击链接填写下方报名表:
工作人员将会把你拉入【CVPR2022活动交流群】
▽
7月23日 周六上午10点,直播间见!
-The End-
关于TechBeat人工智能社区
▼
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区
边栏推荐
- MySql data table structure optimization summary
- After the Xiaomi AX3600 router is expanded and flashed OpenWrt, how to flash back to the official system and partition
- The Home Assistant container on the Raspberry Pi uses the command sensor to obtain and display information such as CPU temperature, memory usage, etc.
- R语言实现空间对象可视化--以郑州市为例
- 最深入全面讲解高可用 Redis 服务架构分析与搭建——太厉害了
- 斐波那契序列,数组排序,在数组中查找对应元素Objects类的equals方法的作用,将26个英文字母用逗号分隔,组成字符串打印出来,矩阵的转置,找出1~1000之间的全部同构数,用随机数生成语句
- Haproxy集群负载均衡详解
- 搭建自己的V Rising自建服务器,以及常见的V Rising服务器问题解决方案
- TCP协议理解和用法以及三次握手四次分手
- The six states of a thread
猜你喜欢

MySql data table structure optimization summary

Ad Hoc Query - Kylin

GFS分布式文件系统

利用R处理复杂表格1

geoserver 发布 矢量切片(pbf)并用openlayers 6.14 /leaflet 1.8 加载展示 (三)(小白必备:超详细教程)

Redis数据库(一)——Redis简介、部署及常用命令

即席查询-Kylin

TCP protocol to understand and use four times and three times handshake

geoserver 发布 矢量切片(pbf)并用openlayers 6.14 /leaflet 1.8 加载展示 (一)(小白必备:超详细教程)

Object storage layout, how objects are positioned, how objects are allocated
随机推荐
动态规划之粉刷房子
卷积神经网络手写数字分类
Pearson相关系数R代码实现
即席查询-Kylin
Oracle配置st_geometry
Thread Basics
五分钟看懂shell重定向和变量
Docker 快速安装&搭建 Mysql 环境
Flink 任务到底需要多少个 Slot
基于肌电信号(sEMG) 的深度学习手势分类-2
获取arcgis server 发布的mapserver图例
ELK日志分析系统(一)之ELK原理
After the Xiaomi AX3600 router is expanded and flashed OpenWrt, how to flash back to the official system and partition
pycharm 2018使用记录(界面布局问题)
R语言Logist回归
Redis数据库(一)——Redis简介、部署及常用命令
ClickHouse 物化视图
R爬虫常用的包与用法
When a man knows why he lives, he can endure any kind of life
SSH服务详解