概率论课程的作业要求编写python程序实现对数据集的特征图形化分析 从阿里云天池里down了一个疫苗流向的数据集 拿到手,打开jupyter notebook 导入 pandas down的数据集有多个csv文件,因此首先把多个csv文件合并为一个
import pandas as pd
import os
# 将该文件夹下的所有文件名存入列表
csv_name_list = os.listdir('E:\jupyternotebook_space\yimiaodatas')
# 获取列表的长度
length = len(csv_name_list)
# 读取第一个CSV文件并包含表头,用于后续的csv文件拼接
f= open(csv_name_list[0],encoding = "utf-8")
df = pd.read_csv( f)
# 读取第一个CSV文件并保存
df.to_csv( "E:\jupyternotebook_space\Alldatas.csv",index=False)
# 循环遍历列表中各个CSV文件名,并完成文件拼接
for i in range(0,length):
f= open(csv_name_list[i],encoding = "utf-8")
df = pd.read_csv( f )
df.to_csv("E:\jupyternotebook_space\Alldatas.csv",index=False, header=False, mode='a+')
接下来就是对合并的csv文件进行数据分析
|