scikit

您所在的位置：网站首页 › 如何拆分数据集的空间 › scikit

scikit

2023-08-05 16:10| 来源: 网络整理| 查看: 265

Leave-One-Out cross-validator

提供训练/测试索引以拆分训练/测试集中的数据。每个样本用作测试集（单例）一次，而其余样本构成训练集。

注意： LeaveOneOut() 等效于 KFold(n_splits=n) 和 LeavePOut(p=1) ，其中 n 是样本数。

由于测试集数量很多（与样本数量相同），这种交叉验证方法的成本可能非常高。对于大型数据集，应该青睐 KFold 、 ShuffleSplit 或 StratifiedKFold 。

阅读更多用户指南。

See also

LeaveOneGroupOut

用于根据数据集的明确的、特定领域的分层来拆分数据。

GroupKFold

具有非重叠组的 K 折迭代器变体。

Examples >>> import numpy as np >>> from sklearn.model_selection import LeaveOneOut >>> X = np.array([[1, 2], [3, 4]]) >>> y = np.array([1, 2]) >>> loo = LeaveOneOut() >>> loo.get_n_splits(X) 2 >>> print(loo) LeaveOneOut() >>> for train_index, test_index in loo.split(X): ... print("TRAIN:", train_index, "TEST:", test_index) ... X_train, X_test = X[train_index], X[test_index] ... y_train, y_test = y[train_index], y[test_index] ... print(X_train, X_test, y_train, y_test) TRAIN: [1] TEST: [0] [[3 4]] [[1 2]] [2] [1] TRAIN: [0] TEST: [1] [[1 2]] [[3 4]] [1] [2] Methods

get_n_splits (X[, y, 组])

返回交叉验证器中的分裂迭代次数

split （X [，y，组]）

生成索引以将数据拆分为训练集和测试集。

get_n_splits(X, y=None, groups=None) [来源]

返回交叉验证器中的分裂迭代次数

Parameters Xarray-like of shape (n_samples, n_features)

训练数据，其中 n_samples 是样本数，n_features 是特征数。

yobject

总是被忽略，存在是为了兼容性。

groupsobject

总是被忽略，存在是为了兼容性。

Returns n_splitsint

返回交叉验证器中的拆分迭代次数。

split(X, y=None, groups=None) [来源]

生成索引以将数据拆分为训练集和测试集。

Parameters Xarray-like of shape (n_samples, n_features)

训练数据，其中 n_samples 是样本数，n_features 是特征数。

yarray-like of shape (n_samples,)

监督学习问题的目标变量。

groupsarray-like of shape (n_samples,), default=None

将数据集拆分为训练/测试集时使用的样本的分组标签。

Yields trainndarray

该拆分的训练集索引。

testndarray

该拆分的测试集索引。

【本文地址】

scikit

scikit

今日新闻

推荐新闻