当前位置:网站首页>【机器学习】回归树生成过程及举例理解
【机器学习】回归树生成过程及举例理解
2022-08-09 16:16:00 【Better Bench】
1 基本概念
回归树(Regression Tree),就是用树模型做回归问题,每片叶子都输出一个预测值。预测值一般时叶子节点所含训练集元素输出的均值。(除了使用均值可以作为预测值,也可以使用其他方法,例如线性回归)
举例理解,以下是一个打高尔夫球的时间表。根据天气、适度、温度、风来预测打高尔夫的时间长短。
右边的回归树叶子节点值,就是取样本数的均值。
2 回归树分支标准
回归树的选择分支节点的评价指标是标准方差(Standard Deviation)。回归树使用某一种特征将原集合分为多个子集,用标准方差衡量子集中的元素是否相近,越小表示越相近。
第一步:首先计算根节点的标准方差
第二步:计算每个特征的条件标准方差,选择(根节点标准方差-特征的条件标准方差)最大的特征作为下一个分支节点
outlook的条件标准方差计算如下
同理计算其他特征的标准方差
第三步:计算根节点标准方差与特征的条件标准方差的差,选择差值最大的特征为下一个分支节点。重复以上工程,直到满足停止条件。停止条件包括
1、当某个分支的变化系数小于某个值
2、当前节点所包含的元素个数小于某个值
第四步:设定变化系数小于10%和所包含元素个数小于3个为停止条件
1、计算Outlook中Overcat的变化系数及所包含元素个数
Overcat的变化系数为8%。小于10%,即停止继续分支。
2、计算Outlook中Sunny的变化系数及所包含元素个数
从左边的表i个中,知道变化系数为28%,且样本数为5个,则需要继续分支。再来计算下一个特征的(Sunny节点标准方差-特征的条件标准方差),从右边的表格知道,Windy这个特征的差值最大,则以Windy作为Sunny节点之后的新节点。分支得到以下的树结构。
此时Windy的True节点,只有两个样本数了,小于3个。满足了停止的条件。
3、计算Outlook中Rainy的变化系数及所包含元素个数
从左边的表可知,Rainy分支的变化系数CV=22%,需要继续分支。再来计算下一个特征的(Rainy节点标准方差-特征的条件标准方差),从右边的表格知道,Temp这个特征的差值最大,则以Temp作为Rainy节点之后的新节点。分支得到以下的树结构。
使用Temp分支后,三个分支所包含是元素个数小于设定的3。则停止继续分支。叶子节点每条分支样本的均值,即为生成的回归树。
边栏推荐
- Sigrity PowerSI 特征阻抗和耦合度仿真
- B019 - 甲醛甲烷煤气温湿度时间测试仪
- 2.1, pay attention to the network based on parallel context scenario text image super-resolution
- Problems Existing in Hardware Development of Electronic Products
- The Chinese Academy of Sciences slaps Google in the face: ordinary computers catch up with quantum superiority, and can solve calculations that would have taken 10,000 years in a few hours...
- 2019强网杯高明的黑客
- 记一次 .NET 某工控自动化控制系统 卡死分析
- Smart Tool Management System
- 基于ABP和Magicodes实现Excel导出操作
- 论如何提升学习的能力
猜你喜欢
融云 x N 世界:构建无限用户实时交互的「元宇宙会场」
Vim practical skills_2. Normal mode and insert mode
Problems Existing in Hardware Development of Electronic Products
一键生成 API 文档的妙招
B40 - 基于STM32单片机的电热蚊香蓝牙控制系统
基于ABP和Magicodes实现Excel导出操作
What is hardware integrated development?What are the cores of hardware integrated development?
2019强网杯高明的黑客
程序员的专属浪漫——用3D Engine 5分钟实现烟花绽放效果
单片机的优点和单片机开发的流程
随机推荐
产品结构设计优化模具简化结构总结
总结了 110+ 公开专业数据集
论如何提升学习的能力
dichotomy
TMin - TMin是否产生溢出
消防安全培训|暑期“消防课堂”,开讲!
B45 - 基于STM32单片机的家庭防火防盗系统的设计
[ Kitex 源码解读 ] 请求重试
打印星型图「建议收藏」
Account opening requirements and exemptions for special futures such as crude oil
智能工具管理系统
B50 - 基于51单片机的儿童成长管理系统
Now, how to choose a stage rental LED display?
OpenCV image transformation - histogram equalization
margin:auto实现盒子水平垂直居中
【.NET 6】开发minimal api以及依赖注入的实现和代码演示
@AllArgsConstructor 和 @NoArgsConstructor
B40 - 基于STM32单片机的电热蚊香蓝牙控制系统
Redis的那些事:一文入门Redis的基础操作
在 C# 中如何检查参数是否为 null