首页 > 其他 > 详细

利用Pandas合并多个csv文件并去重【转】

时间:2021-01-29 11:37:08      阅读:37      评论:0      收藏:0      [点我收藏+]
 1 import os
 2 import pandas as pd
 3 
 4 path = c:/1   #设置csv所在文件夹
 5 files = os.listdir(path)  #获取文件夹下所有文件名
 6 
 7 df1 = pd.read_csv(path + / + files[0],encoding=gbk)  #读取首个csv文件,保存到df1中
 8 
 9 for file in files[1:]:     
10   df2 = pd.read_csv(path +/ +  file,encoding=gbk)  #打开csv文件,注意编码问题,保存到df2中
11   df1 = pd.concat([df1,df2],axis=0,ignore_index=True)  #将df2数据与df1合并
12 
13 df1 = df1.drop_duplicates()   #去重
14 df1 = df1.reset_index(drop=True) #重新生成index
15 df1.to_csv(path + / + total.csv) #将结果保存为新的csv文件

【转自】https://www.jianshu.com/p/0ee48403983b

利用Pandas合并多个csv文件并去重【转】

原文:https://www.cnblogs.com/niuniu238/p/14343789.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!