当前位置:网站首页>机器学习总结(一)
机器学习总结(一)
2022-08-10 14:24:00 【时代&信念】
回归问题
概述
在机器学习的有监督学习中,将问题分为两类:一类是分类,另一类叫回归。
那什么是有监督学习呢?
我的理解就是:利用以往有标签的数据,进行学习的,叫作有监督学习;相反,无监督学习就是在一堆没有标签的数据中,进行学习的,叫作无监督学习。
有监督学习和无监督学习的区别是?
有监督学习分训练集合测试集,在一堆有标签的训练集中“寻找”规律,然后再测试集中使用这种规律;无监督学习只有一组数据,进行寻找规律。
什么是分类问题?
我的理解是,将一堆数据,以某种标准进行分类。最后每个数据都是类别中的一个。以银行贷款结果为例,银行是否贷款给你。最后只有两类结果:贷给你、不贷给你。
分类结果是离散的!
什么是回归问题呢?
我的理解是,通过有监督学习,在训练集中学习到了某种规律,我通过这种规律,对测试集中的数据进行预测。最后的结果是千变万化的,并不像分类问题会有固定的类别,结果取决你训练集中总结的规律和测试集中输入的数据。以银行为例,人们去贷款,到底能贷多少钱呢?有可能贷5210元,也有可能1314521元,这没有固定类别。
回归问题是连续的!
抛出问题
那我们如何处理这个问题呢?
我们可以建立回归方程, Y = X 1 ⊖ 1 + X 2 ⊖ 2 Y=X_1\ominus_1+ X2\ominus_2 Y=X1⊖1+X2⊖2
X 1 、 X 2 、 Y X1、X2、Y X1、X2、Y我们都有了,那么我们这个方程现在需要确定 ⊖ 1 \ominus_1 ⊖1和 ⊖ 2 \ominus_2 ⊖2这两个参数!
我们的目的就是:建立一个回归方程,尽可能的拟合多的数据!!!这样就证明这个方程符合大部分数据,具有一般规律。
误差项定义
拟合平面中核心影响因素是: ⊖ 1 、 ⊖ 2 \ominus_1、\ominus_2 ⊖1、⊖2参数,而
⊖ 0 \ominus_0 ⊖0只是微调。
在AI编程中,我们经常使用矩阵进行处理。就是一项乘上一项的形式。
所以:
X 0 X_0 X0数据全部填充为1
这样我们的回归方程就可以,表示成下面矩阵相乘的这种形式了
建立好回归方程(也可以叫做拟合平面)之后,我们输入 X 1 、 X 2 X_1、X_2 X1、X2之后,Y自然就确定了,Y叫做预测值。但是有时候预测出来的Y值会和真实数据的Y值不一致,他们之间的差距叫做ε。
叫做误差,当然误差ε越小越好,这样证明咋们建立的回归方程预测精准!
边栏推荐
- 符合信创要求的堡垒机有哪些?支持哪些系统?
- Summary of Force Buckle Solution 640 - Solving Equations
- 【MinIO】工具类使用
- 八大排序总是忘?快来这里~
- 第五讲 测试技术与用例设计
- 数据产品经理那点事儿 一
- Unfinished mathematics test paper ----- test paper generator (Qt includes source code)
- 中学数学建模书籍及相关的视频等(2022.08.09)
- 线上线下课程教学培训小程序开发制作功能介绍
- Parallels 将扩展桌面平台产品,以进一步改善在 Mac 上运行 Windows 的用户体验和工作效率
猜你喜欢
第五讲 测试技术与用例设计
关于已拦截跨源请求CORS 头缺少 ‘Access-Control-Allow-Origin‘问题解决
Error: Rule can only have one resource source (provided resource and test + include + exclude)
【有限元分析】异型密封圈计算泄漏量与参数化优化过程(带分析源文件)
池化技术有多牛?来,告诉你阿里的Druid为啥如此牛逼!
领域驱动模型设计与微服务架构落地-从项目去剖析领域驱动
图式图例规范尺寸
[JS Advanced] Creating sub-objects and replacing this_10 in ES5 standard specification
[target detection] small script: extract training set images and labels and update the index
laravel throws the error to Dingding
随机推荐
数据产品经理那点事儿 一
Data product manager thing 2
Existing in the rain of PFAS chemical poses a threat to the safety of drinking water
1W字详解线程本地存储 ThreadLocal
R语言使用gt包和gtExtras包优雅地、漂亮地显示表格数据:gtExtras包的gt_highlight_rows函数高亮(highlight)表格中特定的数据行、配置高亮行的特定数据列数据加粗
静态变量存储在哪个区
[target detection] small script: extract training set images and labels and update the index
epoll学习:思考一种高性能的服务器处理框架
ES5和SE6来实现一个Promise效果
学习MySQL 临时表
A method that can make large data clustering 2000 times faster
使用mysq语句操作数据库
产品使用说明书小程序开发制作说明
Flask框架——MongoEngine使用MongoDB数据库
Do not access Object.prototype method ‘hasOwnProperty‘ from target object....
中学数学建模书籍及相关的视频等(2022.08.09)
【MinIO】Using tools
符合信创要求的堡垒机有哪些?支持哪些系统?
一汽奥迪:持续34年聚焦品质与体验 立足市场需求推进产品迭代
雨水中存在的PFAS化学物质对饮用水安全构成了威胁