数据样本,特征值,目标值,按比例划分

您所在的位置:网站首页 什么是大数据4v和5v的特征值 数据样本,特征值,目标值,按比例划分

数据样本,特征值,目标值,按比例划分

2023-11-17 02:08| 来源: 网络整理| 查看: 265

横着的一行叫数据样本,如

竖着的每一列叫特征值:颜色,形状等列

想要的分类结果,叫目标值,如类别这一列,A,B,C,有3个目标值

#!usr/bin/env python #-*- coding:utf-8 _*- ''' @author:Administrator @file: test.py https://blog.csdn.net/qq_41797451/article/details/80542060 @time: 2020-02-22 上午 11:23 ''' import pandas as pd from sklearn.model_selection import train_test_split data=pd.read_excel("../data/yanben.xls"); print(data) print(type(data)) #iloc只能用数字索引,不能用索引名 #print(data.iloc[:,0:4]) ##loc只能通过index和columns来取,不能用数字 #print(data.loc[0:1,["序号","颜色","形状","重量"]]) #print(data['类别']) x_data=data.iloc[:,0:4]; x_target=data['类别']; print(x_data) print(x_target) #print(data.descirbe) # x_train,x_test,y_train,y_test=train_test_split(x_data,x_target,test_size=0.2) print("训练集特征值:\n",x_train); print("训练集目标值:",y_train); print("====================") print("测试集特征值:\n",x_test); print("测试集目标值:",y_test);

   序号 颜色  形状  重量 类别 0   1  红   圆  50  A 1   2  蓝   长  20  B 2   3  黄  椭圆   2  C 3   4  红   方  20  A 4   5  黄   长  23  B    序号 颜色  形状  重量 0   1  红   圆  50 1   2  蓝   长  20 2   3  黄  椭圆   2 3   4  红   方  20 4   5  黄   长  23 0    A 1    B 2    C 3    A 4    B Name: 类别, dtype: object 训练集特征值:     序号 颜色 形状  重量 3   4  红  方  20 0   1  红  圆  50 4   5  黄  长  23 1   2  蓝  长  20 训练集目标值: 3    A 0    A 4    B 1    B Name: 类别, dtype: object ==================== 测试集特征值:     序号 颜色  形状  重量 2   3  黄  椭圆   2 测试集目标值: 2    C Name: 类别, dtype: object



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3