当前位置:网站首页>机器学习总结(二)
机器学习总结(二)
2022-08-11 06:40:00 【时代&信念】
独立同分布的意义
在机器学习中很重要的一点:误差是独立同分布的,并且服从均值为0,方差为 ⊖ 2 \ominus^2 ⊖2 的高斯分布。
解释一下:
什么是独立?
就是数据样本之间互相独立(互相不影响),例如:张三来银行贷款,他贷款多少并不影响李四的贷款金额和情况。两个数据是相互独立的。
什么是同分布?
样本数据得满足相同的分布。不能是这个数据满足正太分布,这个数据满足泊松分布。例如:咋们研究的是,根据年龄和月薪,预测能贷款的数额。那咋们就得保证这些数据(年龄、月薪、贷款数额)是来自同一家银行。
什么是高斯分布?
高斯分布也叫正太分布,如上图所示。数值大概率是集中在均值附近,两侧数值的概率很小。
下面是百度百科的解释!!!
若随机变量X服从一个数学期望为μ、方差为 σ 2 σ^2 σ2的正态分布,记为N(μ, σ 2 σ^2 σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
在我们生活中产生和收集到的数据,不可能完全满足误差是独立同分布的,并且服从均值为0,方差为 ⊖ 2 \ominus^2 ⊖2 的高斯分布。
误差项的转化
将式(1)带入式(2)得
式子两边同时取log,不会改变求解的 ⊖ \ominus ⊖,但是可以将问题简化(从乘法变成加法)!!!
未完待续
边栏推荐
猜你喜欢
随机推荐
每日sql-员工奖金过滤和回答率排序第一
Redis测试
【软件测试】(北京)字节跳动科技有限公司二面笔试题
NTT的Another Me技术助力创造歌舞伎演员中村狮童的数字孪生体,将在 “Cho Kabuki 2022 Powered by NTT”舞台剧中首次亮相
SQL sliding window
ssh服务攻防与加固
How Unity programmers can improve their abilities
每日sql-找到每个学校gpa最低的同学(开窗)
详述MIMIC 的ICU患者检测时间信息表(十六)
Find the shops that have sold more than 1,000 yuan per day for more than 30 consecutive days in the past six months
radix-4 FFT principle and C language code implementation
How do you optimize the performance of your Unity project?
pytorch,numpy两种方法实现nms类间+类内
Unity程序员如何提升自己的能力
那些事情是用Unity开发项目应该一开始规划好的?如何避免后期酿成巨坑?
linux 安装mysql服务报错
daily sql - user retention rate for two days
C语言每日一练——Day02:求最小公倍数(3种方法)
进制转换间的那点事
redis + lua实现分布式接口限流实现方案