扣丁学堂Python培训简述Python对多属性的重复数据去重方法

2018-10-10 17:49:56 398浏览

从事Python开发工作的小伙伴在工作的过程中应该都会遇到Python对多属性的重复数据去重,那么在遇到这个问题的时候你是怎么操作的呢?本篇文章小编就和大家分享一下Python对多属性的重复数据去重的方法,对Python开发感兴趣或者想参加扣丁学堂Python培训班的小伙伴可以来了解一下哦。


扣丁学堂Python培训简述Python对多属性的重复数据去重方法


Python中的pandas模块中对重复数据去重步骤:


1、利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;


2、再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。



释:


如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['state']),则指定部分列(state列)进行重复项的判断。


具体实例如下:


>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>> 


想要了解更多关于Python开发技术方面内容的小伙伴,请关注扣丁学堂Python培训官网、微信等平台,扣丁学堂IT职业在线学习教育平台为您提供权威的Python开发环境搭建视频,Python培训后的前景无限,行业薪资和未来的发展会越来越好的,扣丁学堂老师精心推出的Python视频直播课定能让你快速掌握Python从入门到精通开发实战技能。扣丁学堂Python技术交流群:279521237。


扣丁学堂微信公众号 


关注微信公众号获取更多学习资料 


 

查看更多关于"Python开发资讯"的相关文章>


标签: 扣丁学堂Python培训 Python对多属性的重复数据去重方法 Python培训 Python视频教程 Python基础教程 python安装教程 Python核心编程 Python在线教程 Python在线视频 Python在线学习

热门专区

暂无热门资讯

课程推荐

微信
微博
15311698296

全国免费咨询热线

邮箱:codingke@1000phone.com

官方群:148715490

北京千锋互联科技有限公司版权所有   北京市海淀区宝盛北里西区28号中关村智诚科创大厦4层
京ICP备12003911号-6   Copyright © 2013 - 2019

京公网安备 11010802030908号