当前位置:网站首页>《深度学习》学习笔记(六)
《深度学习》学习笔记(六)
2022-04-21 11:52:00 【白炎灵】
本篇博客主要是讲自监督学习的(Self-Supervised Learning)
引入
下面是一些自监督学习的models

BERT模型340M parameters
ELMO模型94M parameters
GPT-2模型1542M parameters
GPT-3模型175M parameters
Megatron模型8B parameters
Transformer模型1.6T parameters
…
自监督定义

BERT
BERT输入一行向量,再输出一行向量


BERT要学习mask的地方与“湾”是同一类别的
BERT+Linear一起训练

但是Next Sentence Prediction好像没啥用?

BERT还可以做很多下游任务,后面会介绍
GLUE

为了让NLU(自然语言理解)任务发挥最大的作用,来自纽约大学、华盛顿大学等机构创建了一个多任务的自然语言理解基准和分析平台,也就是GLUE(General Language Understanding Evaluation)GLUE九项任务涉及到自然语言推断、文本蕴含、情感分析、语义相似等多个任务。像BERT、XLNet、RoBERTa、ERINE、T5等知名模型都会在此基准上进行测试。

Case
pre-train即训练学做填空题的BERT

BERT是semi-supervised的。因为在下游任务中,需要有标注的资料;但是做self-supervised的时候,是没有标注的。


case2跟case1不同的点在于,在pre-train的时候,已经初始化了一组参数。






其他相关


Why does BERT work
















GPT series




其他
self-supervised不仅可以用在文本上,还可以用在图像和语音上。





self-supervised

版权声明
本文为[白炎灵]所创,转载请带上原文链接,感谢
https://blog.csdn.net/weixin_43135165/article/details/124288068
边栏推荐
- Chrome开发者工具详解 一
- Filter
- Get and post requests
- Cloud native Daas Service - a brief introduction to distributed object storage
- L2-001 emergency rescue (25 points) (Dijkstra comprehensive application)
- The instruction code for the computer to shut down at a specified time
- asp dotnet core 基于 TestServer 做集成测试
- No supported authentication methods available
- 微信小程序转uniapp
- Applet static attribute assignment and dynamic attribute assignment
猜你喜欢

星汉未来云原生基础治理平台SchedulX V1.1.0 重磅发布,助力企业降本增效

关于 winform GridView 的操作

星环科技基础软件产品全面落地开花,为企业数字化转型带来“星”动能

Redis cluster mode

星汉未来成为FinOps产业推进方阵共建单位

Xinghan will become the co construction unit of finops industry promotion matrix in the future

企业官网有啥用?一定要搭建官方网站吗?

Normalized records in pycharm

宏杉MOFS分布式存储系统斩获“2022分布式存储产品金奖”

sentinelsat包介绍
随机推荐
ASP.NET Core实现JWT授权与认证(1.理论篇)
Redis cluster mode
循环队列的长度「In DataStructure」
No supported authentication methods available
Redis interview questions
华为云MySQL云数据库,轻松助力数据上云
# yyds干货盘点 # 盘点一个网络爬虫中常见的一个错误
Oracle数据库机越极简越可靠,甲骨文11年前埋的“彩蛋”
c语言:指针二(线性表知识+例题详解)
Analyze the future development direction of GPU
3年产品经理,从5k到30k,我是这样成长的(上)
Filter
I18N 国际化
How to carry cookies in cross domain requests?
微信小程序转uniapp
炒股开户安全吗
IDEA的LeetCode力扣插件设置
达梦数据库市场份额增速行业领先,盈利能力大幅提升
剖析GPU未来发展方向
Operation of WinForm GridView