1、标准化——数据处理
preProcess(x, method = c("center", "scale"),
thresh = 0.95, pcaComp = NULL, na.remove = TRUE, k = 5,
knnSummary = mean, outcome = NULL, fudge = 0.2, numUnique = 3,
verbose = FALSE, freqCut = 95/5, uniqueCut = 10, cutoff = 0.9, ...) predict(object, newdata, ...)
x: 为一个矩阵或数据框,对于非数值型变量将被忽略 method: 指定数据标准化的方法,默认为“center”和“scale”。(必须同时使用这两个,若选一个只能对应中心化或均值化)
其中center表示预测变量值减去均值;scale表示预测变量值除以标准差,故默认标准化方法就是(x-mu)/std(x−mu)/std。如果使用range方法,则数据标准为[0,1]的范围,即(x-min)/(max-min)(x−min)/(max−min)。
ppMethods |