python数据分析 |
您所在的位置:网站首页 › 学生成绩统计分析图 › python数据分析 |
目标:分析学生成绩的影响因素 1.导入原始数据,以及需要用到的库 import pandas as pd import numpy as np df = pd.read_csv('StudentsPerformance.csv')(数据来源于kaggle) 2.查看文件
3.数据处理 根据目标,删除一些不需要的列(使用drop) df.drop(['gender','race/ethnicity'],axis=1) #参数axis默认值为0,指行,要删除列的话将axis设为1 df_1 = df.drop(['gender','race/ethnicity'],axis=1)
以下,用相关系数分析父母学历对哪科成绩影响最大 先按照父母学历高低将表中数据替换为数值 df_1.replace({'some high school':1, 'high school':2,'some college':3,"associate's degree":4,"bachelor's degree":5,"master's degree":6},inplace = True) #inplace = True是为了改变文档的源数据
5.结论 通过以上分析,可以初步得出以下的结论: 1.父母学历越高,学生成绩越好(对写作成绩的影响最大) 2.午餐吃的好的同学成绩较高 3.考试准备充分的同学成绩较高 4.某科成绩好的学生其他科成绩也较好(其中写作与阅读成绩相关性最强) |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |