2018-06-08 11:06:03 520浏览
在先如今,随着互联网科技飞速的发展和进步,目前python尤为火热,Python的应用场景还是web快速开发、爬虫、自动化运维:写过简单网站、写过自动发帖脚本、写过收发邮件脚本、写过简单验证码识别脚本。Python爬虫在开发过程中也有很多复用的过程,这里总结一下,以后也能省些事情。
get方法 Python importurllib2 url"http://www.codingke.com/" respons=urllib2.urlopen(url) printresponse.read() post方法 importurllib importurllib2 url='http://www.codingke.com/' form={'name':'abc','password':'1234'} form_data=urllib.urlencode(form) request=urllib2.Request(url,form_data) response=urllib2.urlopen(request) printresponse.read()
importurllib2 proxy=urllib2.ProxyHandler({'http://www.codingke.com/'}) opener=urllib2.build_opener(proxy) urllib2.install_opener(opener) response=urllib2.urlopen('http://www.codingke.com/') printresponse.read()
importurllib2,cookielib cookie_support=urllib2.HTTPCookieProcessor(cookielib.CookieJar()) opener=urllib2.build_opener(cookie_support) urllib2.install_opener(opener) content=urllib2.urlopen('http://www.codingke.com/').read()
cookie="PHPSESSID=91rurfqm2329bopnosfu4fvmu7;kmsign=55d2c12c9b1e3;KMUID=b6Ejc1XSwPq9o756AxnBAg=" request.add_header("Cookie",cookie)
importurllib2 headers={ 'User-Agent':'Mozilla/5.0(Windows;U;WindowsNT6.1;en-US;rv:1.9.1.6)Gecko/20091201Firefox/3.5.6' } request=urllib2.Request( url='http://www.codingke.com/python/', headers=headers ) printurllib2.urlopen(request).read()
5importurllib2,httplib request=urllib2.Request('http://www.codingke.com/') request.add_header('Accept-encoding','gzip')1 opener=urllib2.build_opener() f=opener.open(request)
importStringIO importgzip compresseddata=f.read() compressedstream=StringIO.StringIO(compresseddata) gzipper=gzip.GzipFile(fileobj=compressedstream) printgzipper.read()
fromthreadingimportThread fromQueueimportQueue fromtimeimportsleep #q是任务队列 #NUM是并发线程总数 #JOBS是有多少任务 q=Queue() NUM=2 JOBS=10 #具体的处理函数,负责处理单个任务 defdo_somthing_using(arguments): printarguments #这个是工作进程,负责不断从队列取数据并处理 defworking(): whileTrue: arguments=q.get() do_somthing_using(arguments) sleep(1) q.task_done() #forkNUM个线程等待队列 foriinrange(NUM): t=Thread(target=working) t.setDaemon(True) t.start() #把JOBS排入队列 foriinrange(JOBS): q.put(i) #等待所有JOBS完成 q.join()
以上八个阶段内容就是扣丁学堂Python培训之Python基础教程Python环境搭建的具体介绍,很多学习完Python培训课程的学员都已高薪就业,并且平均薪资达到了13403元,最后想要了解更多内容的小伙伴可以登录扣丁学堂官网咨询。扣丁学堂是专业的Python培训机构,不仅有专业的老师和与时俱进的课程体系,还有大量的Python视频教程供学员观看学习,心动的小伙伴快快行动吧。扣丁学堂Python技术交流群:279521237。
【关注微信公众号获取更多学习资料】