当前位置:网站首页>机器学习可以应用在哪些场景?机器学习有什么用?
机器学习可以应用在哪些场景?机器学习有什么用?
2022-08-11 03:33:00 【程序媛珂珂】
我们在说机器学习分类的时候,简单介绍了一下不同机器学习方法,主要是解决是什么问题,在本节中具体介绍一些常用的应用场景,主要说明这些应用到底怎么用,不对其中的算法以及原理做深入的介绍。
机器学习的应用
1. 分类和聚类
分类和聚类机器学习最常用的应用场景,分类和聚类都是对数据的分组,我们刚接触的时候,很容易混淆这两个应用的概念,觉得分类就是聚类,其实他们有很多的不同。
分类是我们知道有哪些组,然后对数据进行判断,判断这些数据到底是预先知道的那些组。举个很简单的例子,比如我们在军训排队时要求男生一组,女生一组,这就是一种分类,我们提前知道要分那些组,然后通过一种算法对输入的数据判定,来分类到已知的类别下,这个就是分类。
分类从数学函数角度来说:分类任务就是通过学习得到一个目标函数f,把每个属性集x映射到一个预先定义的类标号y中。就是我们根据已知的一些样本(包括属性与类标号)来得到分类模型(即得到样本属性与类标号之间的函数),然后通过此目标函数来对只包含属性的样本数据进行分类。
所以分类属于监督学习方法,比如图像识别,比如我们从一些图像中识别是猫还是狗的照片等,它解决的是“是或否”的问题,就是将需要被分析的数据跟已知的类别结果做判断,看这些数据到底是那个类别数据。
在分类中,对于目标数据中存在哪些类是知道的,要做的就是将每一条记录分别属于哪一类标记出来。但是聚类解决的就是在不知道类的情况下,如何把数据参数做一个划分。
聚类是实现不知道这批数据有哪些类别或标签,然后通过算法的选择,分析数据参数的特征值,然后进行机器的数据划分,把相似的数据聚到一起,所以它是无监督学习;
比如RFM模型中我们通过客户销售数据,通过这些数据对客户分群,然后通过聚类的方法,将相似度高的数据聚类到一起,通过分析出来的数据我们可以对数据特性在定义标签,它解决的是相似度的问题,将相似度高的聚集到一起。
我们举个例子来总结一下分类和聚类都是什么用途:
比如我们有1000张照片,假设我们之前已经定义好猫、狗的照片,做了训练,如果从这1000张照片中区分出来猫、狗的照片,那么这就是分类;
假设我们没做过猫狗的照片,我们只是对1000张照片的数据做一个归类,看看那些照片相似度高,分类完成后,在通过相似度比较高的几类,我们再定义这些类别的是猫、狗或是其他图片什么的。
2. 回归
回归在统计学角度,指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
在大数据分析中,回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。
回归从数学角度来看是一种方程式,是一种解题方法,一种通过一些函数因子的关系的一种学习方法。比如以下简单的一个函数:
回归从算法角度来说,它是对有监督的连续数据结果的预测,比如通过一个人过去年份工资收入相关的影响参数,建立回归模型,然后通过相关的参数的变更来预测他未来工资收入。
当然通过建立回归模型,再结合数学上对方程式的解析,我们也可以倒退出来为了一个预定的结果我们需要对那些参数值做优化。回归最终要的是得到相关的参数和参数的特征值,因此我们通常在做回归分析时通常会做目标参数相关性分析。
只要我们有足够的数据,都可以做一些回归分析帮助我们做预测与决策。比如我们上线了一些功能,可以通过点击率、打开率、分享情况等等跟产生的业务结果做回归分析,如果建立了函数关系,我们就可以预测一些结果,再比如我们通过历史上年龄、体重、血压指标、血脂指标、是否抽烟、是否喝酒等指标跟某种疾病做回归分析,可以预测某一名人员是否有此疾病的风险等。
所以回归的主要目的在于对连续数据产生的规律之后对新数据可能产生某种结果的预测。
3. 降维
降维就是去除冗余的特征,降低特征参数的维度降低,用更加少的维度来表示特征,比如图像识别中将一幅图像转换成高纬度的数据集合,因为高纬度数据处理复杂度很高,我们就需要进行降维处理,降低了计算机处理高维度的图像数据的复杂性,减少了冗余数据造成的识别误差,提高识别经度。
我们从统计学角度在理解一下机器学习的这四大应用,如果我们有一批样本,希望能够预测是都属于某相关属性,如果样本值是离散的,我们就可以使用分类的方法,如果是连续的我们就可以使用回归的方法,如果我们这批样本没有对应的属性,而是想挖掘其中的相关性,那么就用聚类的方式。
如果我们涉及到的参数很多,维度很多,我们就可以用降维的方法去寻找更精准的参数,不管是做分类、聚类还是回归,都能达到更精确的判断和预测。
除此之外,语音识别、图像识别、文本识别、语义分析等都是通过机器学习基本方法的综合利用。
免费分享一些我整理的人工智能学习资料给大家,整理了很久,非常全面。包括一些人工智能基础入门视频+AI常用框架实战视频、图像识别、OpenCV、NLP、YOLO、机器学习、pytorch、计算机视觉、深度学习与神经网络等视频、课件源码、国内外知名精华资源、AI热门论文等。
下面是部分截图,文末扫码加我免费领取(AI技术问题我也可解答一二)
目录
一、人工智能免费视频课程和项目
二、人工智能必读书籍
三、人工智能论文合集
四、机器学习+计算机视觉基础算法教程
五、深度学习机器学习速查表(共26张)
学好人工智能,要多看书,多动手,多实践,要想提高自己的水平,一定要学会沉下心来慢慢的系统学习,最终才能有所收获。
点击下方名片,扫码免费下载文中资料。
边栏推荐
猜你喜欢
Multi-merchant mall system function disassembly 26 lectures - platform-side distribution settings
"Life Is Like First Seen" is ill-fated, full of characters, and the contrast of Zhu Yawen's characters is too surprising
AI+Medical: Using Neural Networks for Medical Image Recognition and Analysis
常用认证机制
二叉树相关代码题【较全】C语言
云平台下ESB产品开发步骤说明
QueryDet:级联稀疏query加速高分辨率下的小目标检测
C语言之自定义类型------结构体
【FPGA】名词缩写
作业8.10 TFTP协议 下载功能
随机推荐
QueryDet: Cascading Sparse Query Accelerates Small Object Detection at High Resolution
Docker 链接sqlserver时出现en-us is an invalid culture错误解决方案
字体反扒
A large horse carries 2 stone of grain, a middle horse carries 1 stone of grain, and two ponies carry one stone of grain. It takes 100 horses to carry 100 stone of grain. How to distribute it?
The most unlucky and the luckiest
EasyCVR接入GB28181设备时,设备接入正常但视频无法播放是什么原因?
[BX] and loop
A brief analysis of whether programmatic futures trading or manual order is better?
En-us is an invalid culture error solution when Docker links sqlserver
音视频开发,为什么要学习FFmpeg?应该怎么入手FFmpeg学习?
QueryDet:级联稀疏query加速高分辨率下的小目标检测
什么是三方支付?
Detailed explanation of VIT source code
【LeetCode】Day112-重复的DNA序列
多商户商城系统功能拆解26讲-平台端分销设置
Leetcode 450. 删除二叉搜索树中的节点
程序化交易的策略类型可以分为哪几种?
Qnet Weak Network Test Tool Operation Guide
2022-08-10 第六小组 瞒春 学习笔记
MYSQLg高级------聚簇索引和非聚簇索引