当前位置:网站首页>《论文阅读》PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable
《论文阅读》PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable
2022-08-10 14:07:00 【365JHWZGo】
《论文阅读》PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable
数据集:多轮对话数据集
外加标签:无
模型:预训练模型(在对话语料上)
时间:2019年
本文带来Siqi Bao, Huang He, Fan Wang, Hua Wu and Haifeng Wang共同创作的文章
简介
预训练模型已被证明对广泛的自然语言处理任务有效。受此启发,我们提出了一种新颖的对话生成预训练框架来支持各种对话,包括闲聊、基于知识的对话和对话式问答。在这个框架中,我们采用灵活的注意力机制来充分利用双向上下文和语言生成的单向特性。我们还引入了离散潜在变量来解决响应生成中固有的一对多映射问题。响应生成和潜在行为识别这两个交互任务在共享网络中同时设计和执行。对三个公开可用的数据集的综合实验验证了所提出框架的有效性和优越性。
边栏推荐
猜你喜欢
使用mysq语句操作数据库
高数_证明_曲率公式
“Oracle 封禁了我的账户”
2022年中国软饮料市场洞察
【目标检测】小脚本:提取训练集图片与标签并更新索引
AWS 安全基础知识
ABAP file operations involved in the Chinese character set of problems and solutions for trying to read
普林斯顿微积分读本05第四章--求解多项式的极限问题
系统的安全和应用(不会点安全的东西你怎么睡得着?)
How to describe multiple paragraphs with different font settings in Open Office XML format
随机推荐
黑客入门,从HTB开始
【ECCV 2022|百万奖金】PSG大赛:追求“最全面”的场景理解
面试面到了一个腾讯30k出来的,有见识到何为精通MySQL调优
leetcode 739. Daily Temperatures Daily Temperatures (Moderate)
【量化交易行情不够快?】一文搞定通过Win10 wsl2 +Ubuntu+redis+pickle实现股票行情极速读写
The recursive recursive Fighting_ silver study ah but level 4
【JS高级】ES5标准规范之创建子对象以及替换this_10
学习日记9
汉字检测和关键词检测
A can make large data clustering method of 2000 times faster, don't poke
IT小白怎么系统的php学习
MQTT服务器搭建
2022-08-09: What does the following go code output?A: No, it will panic; B: Yes, it can run correctly; C: Not sure, see the voting result.package main import (“fmt“ “syn
laravel throws the error to Dingding
池化技术有多牛?来,告诉你阿里的Druid为啥如此牛逼!
使用决策树对鸢尾花进行分类
2011年下半年 系统架构设计师 下午试卷 II
recursive recursive function
awk的简单使用
Send a post request at the front desk can't get the data