当前位置:网站首页>情感分析SowNLP词库
情感分析SowNLP词库
2022-08-09 10:28:00 【白十月】
中文文本分析,使用SowNLP包,文档为 https://github.com/isnowfy/snownlp
SnowNLP的情感分析取值,表达的是“这句话代表正面情感的概率”。也就是说,对“我今天很愤怒”一句,SnowNLP认为,它表达正面情感的概率很低很低。
有时输入一些明确的负面情绪语句,得到的结果却很正面。原因在于:
首先,许多语句的情感判定需要上下文和背景知识,因此如果这类信息缺乏,判别正确率就会受到影响。这就是人比机器(至少在目前)更强大的地方。
其次,任何一个情感分析工具,实际上都是被训练出来的。训练时用的是什么文本材料,直接影响到模型的适应性。
例如SnowNLP,它的训练文本就是评论数据。因此,你如果用它来分析中文评论信息,效果应该不错。但是,如果你用它分析其他类型的文本 — — 例如小说、诗歌等,效果就会大打折扣。因为这样的文本数据组合方式,它之前没有见过。
解决办法就是用其他类型的文本去训练它。见多识广,自然就“见惯不怪”了。至于该如何训练,请和相关软件包的作者联系咨询。
参考文献
https://medium.com/@wshuyi/%E5%A6%82%E4%BD%95%E7%94%A8python%E5%81%9A%E6%83%85%E6%84%9F%E5%88%86%E6%9E%90-9df4d49acaa3
边栏推荐
- 深度学习--自编码器(AutoEncoder)
- unix环境编程 第十四章 14.8 存储映射I/O
- libavcodec.dll导致游戏不能运行及explorer关闭
- Attentional Feature Fusion
- 今天做了手机播放器的均衡器
- 机器学习--线性回归(Linear Regression)
- 1003 我要通过! (20 分)
- 主从postition变化无法锁定_Slave_IO_Running显示No_Slave_Sql_Running显示No---Mysql主从复制同步002
- ESIM(Enhanced Sequential Inference Model)- 模型详解
- Database connection operations for MySQL and MyEclipse
猜你喜欢
[贴装专题] 贴装流程中涉及到的位置关系计算
今天做了手机播放器的均衡器
开源SPL,WebService/Restful广泛应用于程序间通讯,如微服务、数据交换、公共或私有的数据服务等。
分类预测 | MATLAB实现CNN-GRU(卷积门控循环单元)多特征分类预测
深度学习--神经网络(基础讲解)
[相机配置] 海康相机丢包配置环境
Dialogue with the DPO of a multinational consumer brand: How to start with data security compliance?See you on 8.11 Live!
壁纸
Loop nesting and basic operations on lists
pytorch widedeep文档
随机推荐
unix环境编程 第十五章 15.9 共享存储
OpengGL绘制立方体的三种方法
basic operator
深度学习--生成对抗网络(Generative Adversarial Nets)
主从postition变化无法锁定_Slave_IO_Running显示No_Slave_Sql_Running显示No---Mysql主从复制同步002
【原创】JPA中@PrePersist和@PreUpdate的用法
一天半的结果——xmms on E2
京东物流与五菱将开发联名版定制产品
分类预测 | MATLAB实现CNN-GRU(卷积门控循环单元)多特征分类预测
StratoVirt 中的虚拟网卡是如何实现的?
Unix Environment Programming Chapter 14 14.8 Memory Mapped I/O
Umi Hooks
百度云大文件网页直接下载
壁纸
深度学习--神经网络(基础讲解)
unix环境编程 第十四章 14.4 I/O多路转接
Oracle数据库:for update 和for update nowait的区别
Technology Sharing | How to simulate real usage scenarios?mock technology to help you
TELNET协议相关RFC
机器学习--朴素贝叶斯(Naive Bayes)