当前位置:网站首页>文献阅读_VistaNet:用于多模式情绪分析的视觉方面注意网络
文献阅读_VistaNet:用于多模式情绪分析的视觉方面注意网络
2022-08-08 14:21:00 【zhanlang619】
文献来源:Truong Q T, Lauw H W. Vistanet: Visual aspect attention network for multimodal sentiment analysis[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2019, 33(01): 305-312.
VistaNet: Visual Aspect Attention Network for Multimodal Sentiment Analysis
行文架构
介绍
由用户生成内容(user generated content,UGC)引出了情感分析的重要性。广泛存在的多模态数据(例如:评论、博客等等)使得图片成为影响整体信息的关键部分,并指出了评论中的图片部分与文本部分之间存在着协同作用。
本文的贡献:第一次将图片作为情感分析的一部分;考虑到图像将有助于识别评论中的重要句子,模型在对其情绪进行分类时应更多注意,故构建了VistaNet神经网络模型;构建的模型可以推广到其他类型的Web文档,如博客文章、推文或任何包含图像的文档。
相关工作
之前的情感分析普遍将焦点集中到文本,后来产生了采集图片特征的视觉情感分析模型,本文提出的是图片作为一种增强信息的表示,而并不是独立地作为一种信息特征。
视觉方面注意力网络

实证分析
- 将VistaNet模型与依赖文本和图片信息作为特征的多模态基线模型做对比
- 分析模型各组成部分的贡献
- 研究增量添加图像的影响
结论
- 构建了VistaNet模型,该模型有三层架构,从单词到句子聚合表示,然后到特定于图像的文档表示,最后到最终的文档表示。
- 使用图像作为对齐来指出文档中的重要句子。
- 实验表明,VistaNet在情感分析中优于使用文本和视觉特征的多模态基线,即视觉组件比代表性更具增强性,并且作为一种注意力机制更有效。
补充:
VistaNet模型
VistaNet并不是使用图片的特征来与文本特征融合,而是利用图片信息与文本信息的对齐方式,通过注意力机制来指出文本中的重要句子。
其他情况
当文档中只有一个图像时,通过采集图像、文本特征来获得联合表示。
边栏推荐
- 【小码匠自习室】让错误成为孩子进步的阶梯
- egg.js框架的基本设置 及 使用
- PHP —— 用 ThinkPHP5.0 实现微信小程序登陆
- 什么样的程序员在35岁依然被公司抢着要?打破程序员“中年危机”
- 全网最全的AItium Designer 16下载资源与安装步骤
- pip install xxx 出现 AttributeError: ‘tuple’ object has no attribute ‘read’ 错误
- 设计一个跨平台的即时通讯系统(采用华为云ECS服务器作为服务端 )【华为云至简致远】
- shell regular expression, Three Musketeers grep command
- 直播卖货APP——为何能得到商家和用户的喜欢?
- 【小码匠自习室】ABC084 - D:喜欢这样的大神,超有才华
猜你喜欢

全网最全的PADS 9.5安装教程与资源包

开源一夏 | 自己画一块ESP32-C3 的开发板(PCB到手)

a += 1 += 1为什么是错的?

清华|GLM-130B:一个开放的双语预训练模型

Code Casual Recording Notes_Dynamic Programming_322 Change Exchange

See how three years of CRUD programmers solve database deadlocks

pip install xxx 出现 AttributeError: ‘tuple’ object has no attribute ‘read’ 错误

剑指 Offer 66. 构建乘积数组

【系统设计】S3 对象存储

电商秒杀系统架构设计
随机推荐
星起航跨境—当前形势下,突破思维做精细化运营才能提高转化
【os.path】的相关用法(持更)
从零开始,如何拥有自己的博客网站【华为云至简致远】
poj3744 Scout YYF I
客户案例 | 提高银行信用卡客户贡献率
俄驻美大使馆:扎波罗热核电站遭炮击威胁欧洲核安全
Implementation of FIR filter based on FPGA (1) - using fir1 function design
【Redis】redis安装与客户端redis-cli的使用(批量操作)
我凭借这份pdf成功拿到了阿里,腾讯,京东等六家大厂offer
HackTheBox | Previse
彻底了解什么是POE交换机!!!
Harvard University smashes the field: DALL-E 2 is just a "glue monster", and the generation accuracy rate is only 22%
idea中项目呈现树形结构
现在网上开户安全么?接着证券开户选择哪个证券?
无头单向非循环链表(C语言实现)
更改C盘用户目录下的用户名(亲测有效)
初窥门径代码起手,Go lang1.18入门精炼教程,由白丁入鸿儒,首次运行golang程序EP01
【索引】图神经论文之GCN(持更)
【Rust—LeetCode题解】1.两数之和
loj 6038「雅礼集训 2017 Day5」远行