当前位置:网站首页>《论文阅读》PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable
《论文阅读》PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable
2022-08-10 14:07:00 【365JHWZGo】
《论文阅读》PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable
数据集:多轮对话数据集
外加标签:无
模型:预训练模型(在对话语料上)
时间:2019年
本文带来Siqi Bao, Huang He, Fan Wang, Hua Wu and Haifeng Wang共同创作的文章
简介
预训练模型已被证明对广泛的自然语言处理任务有效。受此启发,我们提出了一种新颖的对话生成预训练框架来支持各种对话,包括闲聊、基于知识的对话和对话式问答。在这个框架中,我们采用灵活的注意力机制来充分利用双向上下文和语言生成的单向特性。我们还引入了离散潜在变量来解决响应生成中固有的一对多映射问题。响应生成和潜在行为识别这两个交互任务在共享网络中同时设计和执行。对三个公开可用的数据集的综合实验验证了所提出框架的有效性和优越性。
边栏推荐
猜你喜欢

Open source SPL wipes out tens of thousands of database intermediate tables

正则表达式(包含各种括号,echo,正则三剑客以及各种正则工具)

SQL学习(基础)

Redis上云迁移实践

【学习笔记】Redis的持久化

2022年五大云虚拟化趋势

Short read or OOM loading DB. Unrecoverable error, aborting now

How to describe multiple paragraphs with different font settings in Open Office XML format

第三方软件测评有什么作用?权威软件检测机构推荐

系统架构系列文章三--解决传统企业核心系统的性能问题
随机推荐
进程和计划任务管理
win2012安装Oraclerac失败
C#实现访问OPC UA服务器
注意力模型---Attention Model
Open source SPL wipes out tens of thousands of database intermediate tables
1W字详解线程本地存储 ThreadLocal
Do not access Object.prototype method ‘hasOwnProperty‘ from target object....
MySQL interview questions
[219] The training course notes of the go engineer with more than 3,000 MOOCs 02 Programming ideas in the go language
SenseTime self-developed robotic arm, the first product is an AI chess-playing robot: Guo Jingjing is also invited as an endorsement
Drive IT Modernization with Low Code
正则表达式(包含各种括号,echo,正则三剑客以及各种正则工具)
【ECCV 2022|百万奖金】PSG大赛:追求“最全面”的场景理解
AWS Security Fundamentals
PEST 分析法
【ECCV 2022|Millions of Prizes】PSG Competition: Pursuing the "Most Comprehensive" Scene Understanding
日志@Slf4j介绍使用及配置等级
tensorflow安装踩坑总结
EVE模拟器的使用-带图超详细(学网络用)「建议收藏」
Import other custom namespaces in C#