千锋扣丁学堂Python3培训之简单爬虫抓取网页图片代码实例

2019-08-26 13:32:08 2760浏览

今天千锋扣丁学堂Python培训老师给大家分享一篇关于Python3简单爬虫抓取网页图片代码实例的详细介绍，首先目前网上有很多python2写的爬虫抓取网页图片的实例，但不适用新手（新手都使用python3环境，不兼容python2），所以我用Python3的语法写了一个简单抓取网页图片的实例，希望能够帮助到大家，下面我们一起来看一下吧。

import urllib.request
import re
import os
import urllib
#根据给定的网址来获取网页详细信息，得到的html就是网页的源代码 
def getHtml(url):
  page = urllib.request.urlopen(url)
  html = page.read()
  return html.decode('UTF-8')
 
def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = imgre.findall(html)#表示在整个网页中过滤出所有图片的地址，放在imglist中
  x = 0
  path = 'D:\\test'
  # 将图片保存到D:\\test文件夹中，如果没有test文件夹则创建
  if not os.path.isdir(path): 
    os.makedirs(path) 
  paths = path+'\\'   #保存在test路径下 
 
  for imgurl in imglist: 
    urllib.request.urlretrieve(imgurl,'{0}{1}.jpg'.format(paths,x)) #打开imglist中保存的图片网址，并下载图片保存在本地，format格式化字符串 
    x = x + 1
  return imglist
html = getHtml("http://tieba.baidu.com/p/2460150866")#获取该网址网页详细信息，得到的html就是网页的源代码 
print (getImg(html)) #从网页源代码中分析并下载保存图片

以上就是关于千锋扣丁学堂Python3培训之简单爬虫抓取网页图片代码实例的全部内容，希望对大家的学习有所帮助，想要了解更多关于HTML5开发方面内容的小伙伴，请关注扣丁学堂HTML5培训官网、微信等平台，扣丁学堂IT职业在线学习教育有专业的HTML5讲师为您指导，此外扣丁学堂老师精心推出的HTML5视频教程定能让你快速掌握HTML5从入门到精通开发实战技能。扣丁学堂H5技术交流群：673883249。

【扫码进入HTML5VIP免费公开课】

【关注微信公众号获取更多学习资料】【扫码进入HTML5前端开发VIP免费公开课】

查看更多关于“HTML5开发技术资讯”的相关文章>>

标签: Python培训 Python视频教程 Python在线视频 Python学习视频 Python培训班

上一篇扣丁学堂Python培训分享Python实现的逻辑回归算法示例下一篇扣丁学堂Python培训简述Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算

千锋扣丁学堂Python3培训之简单爬虫抓取网页图片代码实例

热门专区

课程推荐