首页 > 其他 > 详细

【pandas】数据去重

时间:2020-05-18 12:31:21      阅读:61      评论:0      收藏:0      [点我收藏+]

 

现在有一列数据,列名demo

该列中存在重复数据,现在要对数据去重

利用pandas的drop_duplicates方法,subset指列名,keep指只保留遇到的第1个结果

import pandas as pd
data={demo:[1,1,2,2,1,2,2,3,4,5,6,98,4,2,4,5,2,5,6,7]}
df=pd.DataFrame(data)

a=df.drop_duplicates(subset=[demo],keep=first)
print(a)

效果:

demo列中重复的数据就已经没有了

技术分享图片

 

 

 

参考文档:

pandas 筛选去除重复的数据

【pandas】数据去重

原文:https://www.cnblogs.com/kaerxifa/p/12909580.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!