当前位置:网站首页>ML18-自然语言处理
ML18-自然语言处理
2022-08-04 00:10:00 【十九岁的花季少女】
自然语言处理
用途

深度学习
深度学习的基础模型就是神经网络。根据模型进行优化,右边就是优化过程`。
为什么要进行深度学习。
相对于普通的机器学习算法来说,它具有下面这些优点。
语言模型
实例

存在问题
N-Gram模型
N的取值就是看这个词的出现依赖钱买你多少词。
第二个表格就是,当i出现时i,want,to…等出现的次数。,由此可以计算出第三个表格中的概率值
参数规模
词向量
相近意思的词用词向量表示应该也是相近的。
对于两种语言构建出来的词向量应该是类似的,右边是西班牙语。
神经网络模型


优势
因为词向量类似,所以会把这几个句子看所是一个句子将所有句子的出现次数加起来,看作是一个句子出现的次数。
Hierarchical Softmax
神经网络两种实现模型。
CBOW就是输入几个词(上下文)然后经过一系列层预测出当前这一个词是什么。
Kkip-gram正好相反,输入是当前这个词,然后预测他的上下文。
CBOW
哈夫曼树。可以将权值看作词语出现的次数。
构造过程。可以进行编码。
逻辑回归-sigmoid函数来决定走哪个分支。
CBOW
输入词向量(每个大小为m维),在投影层将n-1个m维向量合在一起,然后进行求和。
不断更新的是词向量和参数值。

输入上下文,希望得到足球这个结果的概率是最大的。假设往右走是正例,往左走是负例,想要达到足球,要经过负例、正例、正例和负例;然后将这些概率值乘起来。
CBOW求解目标
使用似然函数求解,为了好求结果,使用对数似然函数。使用参数上角标来判断是正例还是负例,d=0时,表示正例,那后面部分就为1。后边的化简就是log(a*b)=log(a)+log(b).
梯度上升
化简得到更新表达式。因为是梯度上升,所以每次加上一个步长。

负采样





边栏推荐
猜你喜欢

关于mnn模型输出的数据杂乱无章问题

Salesforce's China business may see new changes, rumors may be closing

Prometheus监控Harbor(二进制版)

电子邮件安全或面临新威胁!

伦敦银最新均线分析系统怎么操作?

Talking about the future development direction of my country's industrial parks

汉字风格迁移---结合本地和全局特征学习的中文字体迁移

一文参透分布式存储系统Ceph的架构设计、集群搭建(手把手)

Unity intercepts 3D images and the implementation of picture-in-picture PIP

Free自由协议系统开发
随机推荐
Salesforce的中国区业务可能出现新变化,传言可能正在关闭
带你造轮子,自定义一个随意拖拽可吸边的悬浮View组件
win10+cuda11.7+pytorch1.12.0安装
Sqlnet. Ora file with the connection of authentication test
小米--测试开发
FPGA按键消抖+蜂鸣器
ENS域名注册量创历史新高 逆市增长之势?光环之下存在炒作风险
国内首发可视化智能调优平台,小龙带你玩转KeenTune UI
2023年航空航天、机械与机电工程国际会议(CAMME 2023)
YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)
The super perfect layout has shortcut keys and background replacement
手撕Gateway源码,今日撕工作流程、负载均衡源码
R3LIVE论文学习(二):VIO子系统
2023年第六届亚太应用数学与统计学国际会议(AMS 2023)
【性能优化】MySQL常用慢查询分析工具
做项目一定用得到的NLP资源【分类版】
The longest substring that cannot have repeating characters in a leetcode/substring
jav一键生成数据库文档
现货白银需要注意八大事项
vscode插件设置——Golang开发环境配置