当前位置:网站首页>文献阅读_VistaNet:用于多模式情绪分析的视觉方面注意网络
文献阅读_VistaNet:用于多模式情绪分析的视觉方面注意网络
2022-08-08 14:21:00 【zhanlang619】
文献来源:Truong Q T, Lauw H W. Vistanet: Visual aspect attention network for multimodal sentiment analysis[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2019, 33(01): 305-312.
VistaNet: Visual Aspect Attention Network for Multimodal Sentiment Analysis
行文架构
介绍
由用户生成内容(user generated content,UGC)引出了情感分析的重要性。广泛存在的多模态数据(例如:评论、博客等等)使得图片成为影响整体信息的关键部分,并指出了评论中的图片部分与文本部分之间存在着协同作用。
本文的贡献:第一次将图片作为情感分析的一部分;考虑到图像将有助于识别评论中的重要句子,模型在对其情绪进行分类时应更多注意,故构建了VistaNet神经网络模型;构建的模型可以推广到其他类型的Web文档,如博客文章、推文或任何包含图像的文档。
相关工作
之前的情感分析普遍将焦点集中到文本,后来产生了采集图片特征的视觉情感分析模型,本文提出的是图片作为一种增强信息的表示,而并不是独立地作为一种信息特征。
视觉方面注意力网络
实证分析
- 将VistaNet模型与依赖文本和图片信息作为特征的多模态基线模型做对比
- 分析模型各组成部分的贡献
- 研究增量添加图像的影响
结论
- 构建了VistaNet模型,该模型有三层架构,从单词到句子聚合表示,然后到特定于图像的文档表示,最后到最终的文档表示。
- 使用图像作为对齐来指出文档中的重要句子。
- 实验表明,VistaNet在情感分析中优于使用文本和视觉特征的多模态基线,即视觉组件比代表性更具增强性,并且作为一种注意力机制更有效。
补充:
VistaNet模型
VistaNet并不是使用图片的特征来与文本特征融合,而是利用图片信息与文本信息的对齐方式,通过注意力机制来指出文本中的重要句子。
其他情况
当文档中只有一个图像时,通过采集图像、文本特征来获得联合表示。
边栏推荐
- 年初离职,学习半年源码,终于拿到了蚂蚁Offer,分享面试过程
- 【小码匠自习室】让错误成为孩子进步的阶梯
- KMP Media Group South Africa implemented a DMS (Document Management System) to digitize the process, employees can again focus on their actual tasks, providing efficiency
- 代码随想录笔记_动态规划_322零钱兑换
- 跟我一起了解云耀云服务器HECS【华为云至简致远】
- 【LeetCode】761. 特殊的二进制序列
- 【小码匠自习室】ABC084 - D:喜欢这样的大神,超有才华
- 浏览器跨域方案,适用于本地调试接口(超简单)
- logistic regression model - based on R
- H5不同屏幕大小显示不同的文字大小图片大小
猜你喜欢
shell regular expression, Three Musketeers grep command
年初离职,学习半年源码,终于拿到了蚂蚁Offer,分享面试过程
如何成为团队核心?从写出不可维护的代码开始
Review: What is the pre-approval of autumn recruitment?What is an ordinary autumn move?It's all recruitment, why do you need to set these two recruitment time periods?
代码随想录笔记_动态规划_322零钱兑换
「复盘」面试BAMT回来整理398道高频面试题,助你拿高薪offer
基于SCL语言的模拟量平均值滤波FB库功能介绍及创建FB库的具体方法
【Rust—LeetCode题解】1.两数之和
idea中项目呈现树形结构
Shell Three Musketeers-----sed command
随机推荐
logistic regression model - based on R
Full of dry goods, Yu Jingxin class of the Institute of Information Technology, Chinese Academy of Sciences will help you get academic research and thesis writing skills
全网最全的PADS 9.5安装教程与资源包
Shell Three Musketeers-----sed command
pip install xxx 出现 AttributeError: ‘tuple’ object has no attribute ‘read’ 错误
Thesis understanding: "Self-adaptive loss balanced Physics-informed neural networks"
OpenInfra Days China 2022 |StreamNative 翟佳、刘德志受邀分享
接口测试,
【小码匠自习室】 [NOI Online 2022 入门组] 王国比赛
清华|GLM-130B:一个开放的双语预训练模型
基于FPGA的FIR滤波器的实现(1)—采用fir1函数设计
「PHP基础知识」检测数据类型
String转成double等类型注意非空判断
Ingress:比Service更强大的服务暴露与负载均衡
译文推荐|深入解析 BookKeeper 协议模型与验证
【LeetCode】761. Special binary sequence
【SWT】创建自己的SWT组件
LeetCode Daily Question 2022/8/1-2022/8/7
医学图像数据增强-重采样itk
Talking about the underlying data structure of Redis