scikit

您所在的位置:网站首页 如何拆分数据集的空间 scikit

scikit

2023-08-05 16:10| 来源: 网络整理| 查看: 265

Leave-One-Out cross-validator

提供训练/测试索引以拆分训练/测试集中的数据。每个样本用作测试集(单例)一次,而其余样本构成训练集。

注意: LeaveOneOut() 等效于 KFold(n_splits=n) 和 LeavePOut(p=1) ,其中 n 是样本数。

由于测试集数量很多(与样本数量相同),这种交叉验证方法的成本可能非常高。对于大型数据集,应该青睐 KFold 、 ShuffleSplit 或 StratifiedKFold 。

阅读更多用户指南。

See also

LeaveOneGroupOut

用于根据数据集的明确的、特定领域的分层来拆分数据。

GroupKFold

具有非重叠组的 K 折迭代器变体。

Examples >>> import numpy as np >>> from sklearn.model_selection import LeaveOneOut >>> X = np.array([[1, 2], [3, 4]]) >>> y = np.array([1, 2]) >>> loo = LeaveOneOut() >>> loo.get_n_splits(X) 2 >>> print(loo) LeaveOneOut() >>> for train_index, test_index in loo.split(X): ... print("TRAIN:", train_index, "TEST:", test_index) ... X_train, X_test = X[train_index], X[test_index] ... y_train, y_test = y[train_index], y[test_index] ... print(X_train, X_test, y_train, y_test) TRAIN: [1] TEST: [0] [[3 4]] [[1 2]] [2] [1] TRAIN: [0] TEST: [1] [[1 2]] [[3 4]] [1] [2] Methods

get_n_splits (X[, y, 组])

返回交叉验证器中的分裂迭代次数

split (X [,y,组])

生成索引以将数据拆分为训练集和测试集。

get_n_splits(X, y=None, groups=None) [来源]

返回交叉验证器中的分裂迭代次数

Parameters Xarray-like of shape (n_samples, n_features)

训练数据,其中 n_samples 是样本数,n_​​features 是特征数。

yobject

总是被忽略,存在是为了兼容性。

groupsobject

总是被忽略,存在是为了兼容性。

Returns n_splitsint

返回交叉验证器中的拆分迭代次数。

split(X, y=None, groups=None) [来源]

生成索引以将数据拆分为训练集和测试集。

Parameters Xarray-like of shape (n_samples, n_features)

训练数据,其中 n_samples 是样本数,n_​​features 是特征数。

yarray-like of shape (n_samples,)

监督学习问题的目标变量。

groupsarray-like of shape (n_samples,), default=None

将数据集拆分为训练/测试集时使用的样本的分组标签。

Yields trainndarray

该拆分的训练集索引。

testndarray

该拆分的测试集索引。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3