【scikit

2024-01-13 22:30| 来源: 网络整理| 查看: 265

【scikit-learn】01：使用案例对sklearn库进行简单介绍【scikit-learn】02：使用sklearn库进行统计学习【scikit-learn】03：将sklearn库用于非监督性学习聚类【scikit-learn】04：sklearn库下进行文本数据分析【scikit-learn】05：sklearn文本分类及评价指标【scikit-learn】06：make_blobs聚类数据生成器【scikit-learn】07：数据加载，数据归一，特征选择，逻辑回归，贝叶斯，k近邻，决策树，SVM

make_blobs聚类数据生成器简介

scikit中的make_blobs方法常被用来生成聚类算法的测试数据，直观地说，make_blobs会根据用户指定的特征数量、中心点数量、范围等来生成几类数据，这些数据可用于测试聚类算法的效果。

make_blobs方法:

sklearn.datasets.make_blobs(n_samples=100, n_features=2,centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)[source]

其中：

n_samples是待生成的样本的总数。 n_features是每个样本的特征数。 centers表示类别数。 cluster_std表示每个类别的方差，例如我们希望生成2类数据，其中一类比另一类具有更大的方差，可以将cluster_std设置为[1.0,3.0]。

例：生成3类数据用于聚类（100个样本，每个样本有2个特征）

from sklearn.datasets import make_blobs from matplotlib import pyplot data,target=make_blobs(n_samples=100,n_features=2,centers=3) # 在2D图中绘制样本，每个样本颜色不同 pyplot.scatter(data[:,0],data[:,1],c=target); pyplot.show()

这里写图片描述

为每个类别设置不同的方差，只需要在上述代码中加入cluster_std参数即可：

from sklearn.datasets import make_blobs from matplotlib import pyplot data,target=make_blobs(n_samples=100,n_features=2,centers=3,cluster_std=[1.0,3.0,2.0]) #在2D图中绘制样本，每个样本颜色不同 pyplot.scatter(data[:,0],data[:,1],c=target); pyplot.show()

这里写图片描述

【本文地址】

【scikit

【scikit

今日新闻

推荐新闻