首页 > 其他 > 详细

8.Pandas对缺失值的处理(Excel表清洗格式异常的数据)

时间:2020-07-21 00:01:06      阅读:131      评论:0      收藏:0      [点我收藏+]

`#读取目标excel表,忽略前面2行
df=pd.read_excel(r‘F:\人工智能_优学\Pandas-learn-code\pandas-learn-code\datas\student_excel\student_excel.xlsx‘,skiprows=2)

去掉所有为NaN的列,how是全部,inplace是否替换掉

df.dropna(axis=‘columns‘,how=‘all‘,inplace=True)

去掉所有为nana的行

df.dropna(axis=‘index‘,how=‘all‘,inplace=True)

将分数为NaN的值,改为0分

df.fillna({‘分数‘:0})

也可以

df.loc[:,‘分数‘]=df[‘分数‘].fillna(0)

使用前面的有效值填充用ffill;forward fill,利用后面的有效值填充则bfill,即backword fill

df.loc[:,‘姓名‘]=df[‘姓名‘].fillna(method=‘ffill‘)

将清洗后的Excel表进行保存

df.to_excel(r‘F:\人工智能_优学\Pandas-learn-code\pandas-learn-code\datas\student_excel\student_excel_clean_2.xlsx‘,index=False)`

8.Pandas对缺失值的处理(Excel表清洗格式异常的数据)

原文:https://www.cnblogs.com/hisweety/p/13347513.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!