python如何实现抓取网页中的图片呢?分享一个requests抓取网站页面图片的例子
直接贴代码:
# -*- coding: utf-8 -*-import requests
import re
# 打开网页,获取网页源码
def getHtml(url):
#print(url)
html = requests.get(url)
#print(html.text)
return html.text
def getImag(html):
imagelist = re.findall('src="(.*?)"', html)
i = 1
for url in imagelist:
#获取图片后缀
urlext = url.split('.')[-1]
#获取文件名称
urlname = url.split('.')[-2].split('/')[-1]
#print(urlext)
#return
if urlext=='jpg' or urlext=='png' or urlext=='gif':
print('Downloding:' + url)
else:
continue
# 从图片地址下载数据
try:
image = requests.get(url)
# 在目标路径创建相应文件
f = open('K:/1/' + urlname + '.' + urlext, 'wb')
# 将下载到的图片数据写入文件
f.write(image.content)
print('下载成功', url)
f.close()
except:
print('下载失败',url)
continue
return '结束'
print('获取某站文章上面的图片,lrmb.net设置了防盗链的白名单的无法下载')
url = 'https://www.xiuyixia.com/'
print('正在获取图片')
html = getHtml(url)
print('下载图片中')
print(getImag(html))
print('下载完成')
代码中
f = open('K:/1/' + urlname + '.' + urlext, 'wb')
要换成你的图片保存的本地路径
url = 'https://www.xiuyixia.com/'
url要改成你的网址