2018-07-12 10:35:38 371浏览
在现如今,在处理数据基础操作上大多时候采用awk以及java程序即可。但突然有百万级数据需要处理,通过awk则发生无法匹配,采用java处理很慢,起码在1天以上,当另辟奇径采用采用python来处理时,结果速度有了质的提升,下面就由扣丁学堂python培训老师给大家分享下如何快速使用python处理大数据。
defreadData(fileName): result="" count=0 withopen(fileName,'r')asf: forlineinf.readlines(): result+=line count+=1 printcount returnresult """写入文件""" defwriteData(fileName,data): withopen(fileName,'a+')asf: f.write(data)
importIoUtils fileName1='D:\\works\\pythons\\files\\userids.txt' userIds=IoUtils.readData(fileName1).split('\n') fileName2='D:\\works\\pythons\\files\\records.txt' records=IoUtils.readData(fileName2).strip() recordsArr=records.split('\n') count=0; fordatainrecordsArr: count+=1 ifdata.split('\t')[2]inuserIds: IoUtils.writeData('D:\\works\\pythons\\files\\20180604.txt',data+'\n') printcount
以上就是扣丁学堂剖析如何快速使用python处理大数据的详细介绍,希望对小伙伴们有所帮助,想要了解更多内容的小伙伴可以登录扣丁学堂官网咨询。扣丁学堂有专业的Python视频教程供大家在线学习,不仅有时俱进的课程体系还有专业的老师授课,定能让你轻松学习,高薪就业。扣丁学堂Python技术交流群:279521237。
【关注微信公众号获取更多学习资料】