也是刚学的时候写的代码 学会了requests 方便多了

Posted cwkcwk

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了也是刚学的时候写的代码 学会了requests 方便多了相关的知识,希望对你有一定的参考价值。

import requests
import time
import re
import os
i = 0
num = 0
newurl = "/blog/?id=800563506"
for i in range(2):
i += 1
baseurl = "https://www.duitang.com"
baseurl2 = newurl
url = baseurl + baseurl2
rsp = requests.get(url)
#print(type(rsp))
data = rsp.text
#print(type(data))


#获取帖子中间 图片名称 和想要爬取得图片信息块
s =r‘<div class="de-img"(.*?)</div>‘
pattern = re.compile(s,re.S)
keydata = pattern.findall(data)
keydata = "".join(keydata)
#print(type(keydata))
#print(keydata)

#获取下一张图的后半截 url
s1 = r‘<a class="shownext" href="(.*?)" data-nextid=‘
pattern1 = re.compile(s1,re.S)
newurl = pattern1.findall(keydata)[0]
newurl = "".join(newurl)
print(type(newurl))
print(newurl)


#获取名称
s2 =r‘<img alt="(.*?)" id=‘
pattern2 = re.compile(s2,re.S)
mingcheng = pattern2.findall(keydata)[0]
#mingcheng = "".join(mingcheng)
print(mingcheng)

#获取图片地址
s3 =r‘src="(.*?)" style=‘
pattern3 = re.compile(s3,re.S)
tupian = pattern3.findall(keydata)[0]
tupian = "".join(tupian)
print(tupian)

tupiandizhi = requests.get(tupian) #对图片地址发出请求
#print(type(tupiandizhi))

#给名字添加数字 以免被后来者覆盖
num = num + 1
num2 = str(num)
savepng = open("F://"+ mingcheng + num2 +".png","wb").write(tupiandizhi.content) #将图片保存
#open(文件路径,名字+数字+后缀,写入方法) #.content是将数据直接返回bytes类型,这样就可以保存图片 音乐等文件
























































以上是关于也是刚学的时候写的代码 学会了requests 方便多了的主要内容,如果未能解决你的问题,请参考以下文章

我是刚学c#的,老师安排了任务,用c#winformchart画柱状图,折线图和饼图,恳请帮帮忙,

Java线程:线程安全与不安全

SQL sever 中的警告“将截断字符串或二进制数据 语句已终止” 是啥意思啊? 我是刚学这个的?懂的帮帮我

python人脸识别代码怎么写?

刚学的python,练习的代码

[日常摸鱼]字符串相关