当前位置:网站首页>Machine Learning Overview
Machine Learning Overview
2022-08-05 04:11:00 【Mika grains】
1.1人工智能概述
达特茅斯会议-人工智能的起点
机器学习是人工智能的一个实现途径
深度学习是机器学习的一个方法发展而来
1.1.2机器学习、深度学习能做些什么
传统预测
图像识别
自然语言处理
1.2什么是机器学习
数据、模型、预测
从历史数据中获得规律?这些历史数据是怎么的格式?
1.2.3数据集构成
特征值+目标值
1.3机器学习算法分类
监督学习
目标值:类别——分类问题
k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归
目标值:连续型的数据-回归问题
线性回归、岭回归
目标值:无-无监督学习
聚类 k-means
1、Predict what the temperature will be tomorrow? 回归
2、预测明天是阴、晴、雨? 分类
3、Face age prediction? 回归/分类
4、人脸识别 ? 分类
2.1数据集
2.1.1可用数据集
公司内部 百度
数据接口 花钱
数据集
学习阶段可以用的数据集:
1、sklearn
2、kaggle
3、UCI
1 Scikit-learn工具介绍
2.1.2sklearn数据集
sklearn.datasets
load_* 获取小规模数据集
from sklearn.datasets import load_iris
def datasets_demo():
"""
sklearn数据集使用
:return:
"""
# 获取数据集
iris = load_iris()
print("鸢尾花数据集:\n",iris)
print("鸢尾花数据集描述:\n", iris["DESCR"])
print("The name of the iris eigenvalue:\n", iris.feature_names)
print("Iris eigenvalues:\n", iris.data.shape)
return None
if __name__ == "__main__":
# 代码1:sklearn数据集使用
datasets_demo()运行如下(数据过多,展示部分)
fetch_* 获取大规模数据集
2 sklearn小数据集
sklearn.datasets.load_iris()
3 sklearn大数据集
sklearn.datasets.fetch_20newsgroups(data_home=None)
4 数据集的返回值
datasets.base.Bunch(继承自字典)
dict["key"] = values
bunch.key = values
思考:Whether the obtained data is used to train a model?
2.1.3数据集的划分
训练数据集:用于训练、构建模型
测试数据:is used in model checking,用于评估模型是否有效
测试集 20%~30%
sklearn.model_selection.train_test_split(arrays,*options)
训练集特征值,测试集特征值,训练集目标值,测试集目标值
x_train, x_test, y_train, y_test
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
def datasets_demo():
"""
sklearn数据集使用
:return:
"""
# 获取数据集
iris = load_iris()
print("鸢尾花数据集:\n",iris)
print("鸢尾花数据集描述:\n", iris["DESCR"])
print("The name of the iris eigenvalue:\n", iris.feature_names)
print("Iris eigenvalues:\n", iris.data.shape)
# 数据集的划分
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)
print("Features of the training dataset:\n", x_train, x_train.shape)
return None
if __name__ == "__main__":
# 代码1:sklearn数据集使用
datasets_demo()部分运行结果如下

边栏推荐
- 将故事写成我们
- Ffmpeg - sources analysis
- Dive into how it works together by simulating Vite
- [TA-Frost Wolf_may-"Hundred Talents Project"] Graphics 4.3 Real-time Shadow Introduction
- [8.3] Code Source - [meow ~ meow ~ meow~] [tree] [and]
- 阿里本地生活单季营收106亿,大文娱营收72亿,菜鸟营收121亿
- UI自动化测试 App的WebView页面中,当搜索栏无搜索按钮时处理方法
- 2022 Hangzhou Electric Multi-School 1st Game
- Android interview question - how to write with his hands a non-blocking thread safe queue ConcurrentLinkedQueue?
- [Geek Challenge 2019]FinalSQL
猜你喜欢
![Spark Basics [Introduction, Getting Started with WordCount Cases]](/img/90/ebe887db0f8c36895691dea05f62cf.png)
Spark Basics [Introduction, Getting Started with WordCount Cases]

炎炎夏日教你利用小米智能家居配件+树莓派4接入Apple HomeKit

特征预处理

iMedicalLIS listener (2)

4T硬盘剩余很多提示“No space left on device“磁盘空间不足

Industry Status?Why do Internet companies prefer to spend 20k to recruit people rather than raise their salary to retain old employees~

flink读取mongodb数据源

UE4 在游戏运行时更改变量 (通过鼠标滑轮来更改第一人称角色的最大行走速度)

How to solve the three major problems of bank data collection, data supplementary recording and index management?

UE4 更改组件变量 (以修改第一人称角色模板的最大行走速度和跳跃高度为例)
随机推荐
Redis1: Introduction to Redis, basic features of Redis, relational database, non-relational database, database development stage
Mysql's redo log detailed explanation
Event parse tree Drain3 usage and explanation
Initial solution of the structure
[TA-Frost Wolf_may-"Hundred Talents Project"] Graphics 4.3 Real-time Shadow Introduction
如何解决复杂的分销分账问题?
iMedicalLIS监听程序(2)
mutillidae下载及安装
【8.1】代码源 - 【第二大数字和】【石子游戏 III】【平衡二叉树】
[8.2] Code Source - [Currency System] [Coins] [New Year's Questions (Data Enhanced Edition)] [Three Stages]
How to wrap markdown - md file
1007 Climb Stairs (贪心 | C思维)
UE4 opens door via interaction (keyboard key)
Walter talked little knowledge | "remote passthrough" that something
Paparazzi: Surface Editing by way of Multi-View Image Processing
银行数据采集,数据补录与指标管理3大问题如何解决?
905. Interval selection
特征预处理
bytebuffer internal structure
【Mysql进阶优化篇02】索引失效的10种情况及原理