scikit |
您所在的位置:网站首页 › 如何拆分数据集的空间 › scikit |
Leave-One-Out cross-validator 提供训练/测试索引以拆分训练/测试集中的数据。每个样本用作测试集(单例)一次,而其余样本构成训练集。 注意: LeaveOneOut() 等效于 KFold(n_splits=n) 和 LeavePOut(p=1) ,其中 n 是样本数。 由于测试集数量很多(与样本数量相同),这种交叉验证方法的成本可能非常高。对于大型数据集,应该青睐 KFold 、 ShuffleSplit 或 StratifiedKFold 。 阅读更多用户指南。 See also LeaveOneGroupOut用于根据数据集的明确的、特定领域的分层来拆分数据。 GroupKFold具有非重叠组的 K 折迭代器变体。 Examples >>> import numpy as np >>> from sklearn.model_selection import LeaveOneOut >>> X = np.array([[1, 2], [3, 4]]) >>> y = np.array([1, 2]) >>> loo = LeaveOneOut() >>> loo.get_n_splits(X) 2 >>> print(loo) LeaveOneOut() >>> for train_index, test_index in loo.split(X): ... print("TRAIN:", train_index, "TEST:", test_index) ... X_train, X_test = X[train_index], X[test_index] ... y_train, y_test = y[train_index], y[test_index] ... print(X_train, X_test, y_train, y_test) TRAIN: [1] TEST: [0] [[3 4]] [[1 2]] [2] [1] TRAIN: [0] TEST: [1] [[1 2]] [[3 4]] [1] [2] Methodsget_n_splits (X[, y, 组]) 返回交叉验证器中的分裂迭代次数 split (X [,y,组]) 生成索引以将数据拆分为训练集和测试集。 get_n_splits(X, y=None, groups=None) [来源]返回交叉验证器中的分裂迭代次数 Parameters Xarray-like of shape (n_samples, n_features)训练数据,其中 n_samples 是样本数,n_features 是特征数。 yobject总是被忽略,存在是为了兼容性。 groupsobject总是被忽略,存在是为了兼容性。 Returns n_splitsint返回交叉验证器中的拆分迭代次数。 split(X, y=None, groups=None) [来源]生成索引以将数据拆分为训练集和测试集。 Parameters Xarray-like of shape (n_samples, n_features)训练数据,其中 n_samples 是样本数,n_features 是特征数。 yarray-like of shape (n_samples,)监督学习问题的目标变量。 groupsarray-like of shape (n_samples,), default=None将数据集拆分为训练/测试集时使用的样本的分组标签。 Yields trainndarray该拆分的训练集索引。 testndarray该拆分的测试集索引。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |