2018-06-25 14:09:54 526浏览
本篇文章扣丁学堂Python培训小编和大家分享一下Python爬虫,使用真实浏览器打开网页的方法,对此感兴趣的小伙伴可以随小编来了解一下。文章中会有代码列出供大家参考,对Python开发感兴趣的小伙伴来了解一下吧。
1、使用系统自带库 os
这种方法的优点是,任何浏览器都能够使用, 缺点不能自如的打开一个又一个的网页
import os os.system('"C:/Program Files/Internet Explorer/iexplore.exe" http://www.baidu.com')
2、使用python 集成的库 webbroswer
python的webbrowser模块支持对浏览器进行一些操作,主要有以下三个方法:
import webbrowser webbrowser.open(url, new=0, autoraise=True) webbrowser.open_new(url) webbrowser.open_new_tab(url)
他们虽然是三个方法, 其实还是一个方法, 只是传递的参数不同
webbrowser.open(url, new=0, autoraise=True) 在系统的默认浏览器中访问url地址,如果new=0, url会在同一个
浏览器窗口中打开;如果new=1,新的浏览器窗口会被打开;new=2 新的浏览器tab会被打开
其他的两个函数 webbrowser.open_new(url),webbrowser.open_new_tab(url)其实都是返回了webbrowser.open() 这个方法
只是他们没有其他的两个参数了。
在调用其他的浏览器的时候需要提前注册, 否则打开页面的是默认浏览器
webbrowser 这个库锁支持的浏览器类型如下:
Type Name Class Name Notes 'mozilla' Mozilla('mozilla') 'firefox' Mozilla('mozilla') 'netscape' Mozilla('netscape') 'galeon' Galeon('galeon') 'epiphany' Galeon('epiphany') 'skipstone' BackgroundBrowser('skipstone') 'kfmclient' Konqueror() (1) 'konqueror' Konqueror() (1) 'kfm' Konqueror() (1) 'mosaic' BackgroundBrowser('mosaic') 'opera' Opera() 'grail' Grail() 'links' GenericBrowser('links') 'elinks' Elinks('elinks') 'lynx' GenericBrowser('lynx') 'w3m' GenericBrowser('w3m') 'windows-default' WindowsDefault (2) 'macosx' MacOSX('default') (3) 'safari' MacOSX('safari') (3) 'google-chrome' Chrome('google-chrome') 'chrome' Chrome('chrome') 'chromium' Chromium('chromium') 'chromium-browser' Chromium('chromium-browser')
以上就是扣丁学堂Python在线学习小编给大家分享的Python爬虫,使用真实浏览器打开网页的两种方法总结,希望对小伙伴们有多帮助,想要了解更多内容的小伙伴可以登录扣丁学堂官网咨询。扣丁学堂是专业的Python培训机构,不仅有专业的老师和与时俱进的课程体系,还有大量的Python在线视频供学员观看学习,想要学好Python开发的小伙伴快快行动吧。扣丁学堂Python技术交流群:279521237。
【关注微信公众号获取更多学习资料】