用Python Pandas合并多个excel(.xlsx)文件

您所在的位置:网站首页 批量合并excel文件至一个表 用Python Pandas合并多个excel(.xlsx)文件

用Python Pandas合并多个excel(.xlsx)文件

2023-09-26 10:20| 来源: 网络整理| 查看: 265

有时候需要将多个表头一致的文件合并成一个(注意要表头一致,不一致的话,合并之后内容会错开),手动打开所有表一个一个复制 粘贴到总表中,繁琐且容易出错,写个简单代码,一键将所有的excel(.xlsx)文件合并

""" Created on Wednesday, March 25, 2020 at 11:14:56 @author: qinghua mao """ import os,time import pandas as pd start_time=time.time() dir = r'D:\python脚本\合并excel\日常指标' #设置工作路径 #新建列表,存放每个文件数据框(每一个excel读取后存放在数据框,依次读取多个相同结构的Excel文件并创建DataFrame) DFs = [] for root, dirs, files in os.walk(dir): #第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。 for file in files: file_path=os.path.join(root,file) #将路径名和文件名组合成一个完整路径 df = pd.read_excel(file_path,encoding="gbk") #excel转换成DataFrame DFs.append(df) #合并所有数据,将多个DataFrame合并为一个 alldata = pd.concat(DFs) #sort='False' # alldata.to_csv(r'D:\python脚本\csv合并结果.csv',sep=',',index = False,encoding="gbk") alldata.to_excel(r'D:\python脚本\excel合并结果.xlsx',index = False,encoding="gbk") end_time=time.time() times=round(end_time-start_time,2) print('合并完成,耗时{}秒'.format(times)) #如果要将合并结果写入到csv文件中,就使用 to_csv,如果要将合并结果写入到excel文件中,就使用 to_excel #如果是合并带有数字的excel,最好写入到csv文件中(个人建议),写入到excel中还需要将数字单元格进行转换,但是如果有日期,需要手动转换 #如果写入结果,中文有乱码,就指定写入格式,这里指定的是gbk

与合并csv相比,同一样的合并方法,合并.xlsx文件时不会出现多余的表头,只有首行



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3