当前位置:网站首页>入坑机器学习:二,监督学习
入坑机器学习:二,监督学习
2022-08-06 03:00:00 【喜欢吃豆】
1,回归问题:

然后计算机会根据我认为的“正确答案”,继续预测,得到更多的答案。
2,分类问题:



监督学习中需要注意的问题:
1、偏置方差权衡
第一个问题就是偏置和方差之间的权衡。假设我们有几种不同的,但同样好的演算数据集。一种学习算法是基于一个未知数的输入,在经过这些数据集的计算时,系统会无误的预测到并将正确的未知数输出。一个学习算法在不同的演算集演算时如果预测到不同的输出值会对特定的输入有较高的方差。一个预测误差学习分类器是与学习算法中的偏差和方差有关的。一般来说,偏差和方差之间有一个权衡。较低的学习算法偏差必须“灵活”,这样就可以很好的匹配数据。但如果学习算法过于灵活,它将匹配每个不同的训练数据集,因此有很高的方差。许多监督学习方法的一个关键方面是他们能够调整这个偏差和方差之间的权衡(通过提供一个偏见/方差参数,用户可以调整)。
2、功能的复杂性和数量的训练数据
第二个问题是训练数据可相对于“真正的”功能(分类或回归函数)的复杂度的量。如果真正的功能是简单的,则一个“不灵活的”学习算法具有高偏压和低的方差将能够从一个小数据量的学习。但是,如果真功能是非常复杂的(例如,因为它涉及在许多不同的输入要素的复杂的相互作用,并且行为与在输入空间的不同部分),则该函数将只从一个非常大的数量的训练数据,并使用可学习“灵活”的学习算法具有低偏置和高方差。因此,良好的学习算法来自动调整的基础上可用的数据量和该函数的明显的复杂性要学习的偏压/方差权衡。
3、输入空间的维数
第三个问题是输入空间的维数。如果输入特征向量具有非常高的维数,学习问题是很困难的,即使真函数仅依赖于一个小数目的那些特征。这是因为许多“额外”的尺寸可混淆的学习算法,并使其具有高方差。因此,高的输入维数通常需要调整分类器具有低方差和高偏置。在实践中,如果工程师能够从输入数据手动删除不相关的特征,这是有可能改善该学习功能的准确性。此外,还有许多算法的特征选择,设法确定相关特征,并丢弃不相关的。这是维数降低,其目的是将输入数据映射到较低维空间中运行的监督学习算法之前的更一般的策略的一个实例。
4、噪声中的输出值
第四个问题是在所需要的输出值(监控目标变量)的噪声的程度。如果所希望的输出值,通常是不正确的(因为人为错误或传感器的错误),则学习算法不应试图找到一个函数完全匹配的训练示例。试图以适应数据过于谨慎导致过度拟合。当没有测量误差(随机噪声),如果你正在努力学习功能,是您学习模式太复杂,你甚至可以过度拟合。在这种情况下的目标函数,该函数不能被模拟“腐化”你的训练数据的那部分-这一现象被称为确定性的噪声。当任一类型的噪声存在时,最好是去一个更高的偏见,低方差估计。
边栏推荐
- 服务器安装部署
- 基于Flask框架实现Mock Server
- How to clear the browser cache tutorial
- Freemodbus 移植过程记录
- Removal control of WPF screenshot control (9) "Imitation WeChat"
- CAD一键添加审图批注、AUTOCAD——图形界线怎么设置
- 微信小程序 多选————四选二
- LeetCode Daily 2 Questions 01: Flip word prefixes (both 1200 questions)
- 运维小白成长记——架构第10周
- 在香橙派OrangePi 3 LTS开发板上安装向日葵远程控制软件的操作方法
猜你喜欢

cocos小游戏实战-完结

Soul向港交所递交上市申请,持续发力社交元宇宙赛道

高性能云原生数据对象存储MinIO实战-上

【无标题】

Find the Nth node of the linked list

How to clear the browser cache tutorial

测试6年,从入行月薪6k到现在年薪40w,我总结了这些经验...

UIO & VFIO: DPDK实现PMD的基石

邓晔研究组在微生物功能基因的数据库开发和环境定量方面取得新进展

A tester in 1995, he wouldn't dare to ask for 12K~ Looking at his resume, I have a lot of thoughts...
随机推荐
Wejo joins MONET alliance to further drive innovation in international mobility
mavonEditor 导航目录点击锚点定位功能只有在全屏编辑模式下才有效的问题
网络安全辅助工具:免费MD5解密网站
详解AUTOSAR:AUTOSRA软件架构(理论篇—2)
odoo 15 会员模块的使用
在香橙派OrangePi 3 LTS开发板上安装向日葵远程控制软件的操作方法
【Untitled】
滑动间隔缓存有什么特点呢?
华为设备配置Smart Link负载分担
How to clear the browser cache tutorial
ansible 学习
How to delete duplicate data in a table?
Configuring Smart Link Load Balancing on Huawei Devices
详解AUTOSAR:什么是AUTOSAR?(理论篇—1)
ansible setup 模块
[机缘参悟-61]:《兵者,诡道也》-3-孙子兵法解读-敌战计
测试6年,从入行月薪6k到现在年薪40w,我总结了这些经验...
ansible ping 模块
在靠近客户端的代理上缓存常用数据有什么特点?
测试工程师应该具备什么能力才能拿到30k?