5. 模型训练和调参(The caret package)

您所在的位置:网站首页 r语言train 5. 模型训练和调参(The caret package)

5. 模型训练和调参(The caret package)

2023-09-22 10:29| 来源: 网络整理| 查看: 265

1. 简介(The caret package ) 2. 可视化(The caret package) 3. 预处理(The caret package) 4. 数据分割(The caret package)

5. 模型训练和调参

内容:

Model Training and Parameter TuningAn ExampleBasic Parameter TuningNotes on ReproducibilityCustomizing the Tuning ProcessPre-Processing OptionsAlternate Tuning GridsPlotting the Resampling ProfileThe trainControl FunctionAlternate Performance MetricsChoosing the Final ModelExtracting Predictions and Class ProbabilitiesExploring and Comparing Resampling DistributionsWithin-ModelBetween-ModelsFitting Models Without Parameter Tuning 5.1 Model Training and Parameter Tuning

caret包有很多函数试图精简构建模型和评估模型的过程。 train 函数能用于: * 评估,应用抽样,模型调参的影响 * 通过参数选择最优模型 * 从训练集中评估模型表现 首先,需要选择一个具体地模型。现在,有233个可以使用;详情请看train Model List 或 train Model By Tag,在这些介绍中,有一个可被优化的参数列表。用户也可以自定义模型。 第一步就是调整模型(算法中的第一行就是选择一系列要估计的参数。例如,如果要拟合一个偏最小二乘模型,需要设定PLS估计的参数。) 这里写图片描述 一旦模型和要调整的参数值被定义,重抽样的类型也就被设定了。现在,在train中可以使用k折交叉验证(一次或重复的),留一交叉验证和自助法等抽样方法。重抽样过后,这个过程将会指导用户选择哪个参数。默认地,函数自动选择具有拥有最佳值的参数,尽管可以使用不同的算法。

5.2 An Example

mlbench包中有一个Sonar数据集,这里,我们载入数据集:

library(mlbench) data(Sonar) str(Sonar[, 1:10]) ## 'data.frame': 208 obs. of 10 variables: ## $ V1 : num 0.02 0.0453 0.0262 0.01 0.0762 0.0286 0.0317 0.0519 0.0223 0.0164 ... ## $ V2 : num 0.0371 0.0523 0.0582 0.0171 0.0666 0.0453 0.0956 0.0548 0.0375 0.0173 ... ## $ V3 : num 0.0428 0.0843 0.1099 0.0623 0.0481 ... ## $ V4 : num 0.0207 0.0689 0.1083 0.0205 0.0394 ... ## $ V5 : num 0.0954 0.1183 0.0974 0.0205 0.059 ... ## $ V6 : num 0.0986 0.2583 0.228 0.0368 0.0649 ... ## $ V7 : num 0.154 0.216 0.243 0.11 0.121 ... ## $ V8 : num 0.16 0.348 0.377 0.128 0.247 ... ## $ V9 : num 0.3109 0.3337 0.5598 0.0598 0.3564 ... ## $ V10: num 0.211 0.287 0.619 0.126 0.446 ...

函数createDataPartition能创建一个分层的随机样本进入训练集和测试集:

library(caret) set.seed(998) inTraining


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3