欢迎大侠们指正批评
思路:
1、引入相关的python文件(import re import urllib)
2、读取对应网页的html文件(使用 urllib)
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
print html
return html
3、在读取的html文件中使用正则表达式匹配图片路径并保存图片
def getimage(date):
imgR = r‘src="(.*?\.jpg)"‘
cimgR = re.compile(imgR)
imageList = cimgR.findall(date)
x = 0
for image in imageList:
urllib.urlretrieve(image,"%s.jpg"% x)
x = x +1
return imageList[1]
html = getHtml("https://tieba.baidu.com/p/5608328332")