python 爬虫 百度贴吧签到小工具

Posted cwkcwk

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 爬虫 百度贴吧签到小工具相关的知识,希望对你有一定的参考价值。

import requests,re,time
header ={
"Cookie":"登陆过账号后的cookie 必须填写",
"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/68.0.3440.106 Safari/537.36"
}
#访问个人帐号下的贴吧主页
url = "百度首页--右上角贴吧--右上角用户名(我的贴吧) 然后把url填到这里"
html = requests.get(url,headers=header)
#print(html.text)

#提取贴吧相关的ID 名称等信息
s1 = r‘"forum_id":(.*?),"forum_name":"(.*?)"‘
tieba_info = re.compile(s1,re.S).findall(str(html.text))
#print(tieba_info)

for i in tieba_info:
time.sleep(3)#访问CD要控制好,否则容易出现验证码,导致签到失败
print(i[1])
print(i[1].encode("latin-1"))
#获取可以签到的全部贴吧名字
#print(i[1].encode("latin-1").decode("unicode_escape"))

#获取tbs 发送签到请求需要获得名为tbs的数据 他在页面信息里面
tieba_name = (i[1].encode("latin-1").decode("unicode_escape"))
tieba_link = "https://tieba.baidu.com/f?kw=" + tieba_name
info = requests.get(tieba_link,headers=header)
#print(info.text)
s2 =r"tbs‘: "(.*?)"" #单双引号都有 注意转义字符
tieba_tbs = re.compile(s2,re.S).findall(str(info.text))[0]
#print(tieba_tbs)

#签到的postdata
qiandao_url = "https://tieba.baidu.com/sign/add"
qiandao_data = {"ie":"utf-8",
"kw":tieba_name,
"tbs":tieba_tbs} #tbs这个数据意义不明 可以在附近相关网页代码中搜索看看 是否能发现关联

#实现签到 是否成功 可以看返回信息
try:
qiandao = requests.post(qiandao_url,data=qiandao_data,headers=header)
#print(qiandao.text)
print(tieba_name,"签到")

except:
print(tieba_name,"异常")
continue













































以上是关于python 爬虫 百度贴吧签到小工具的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫:运用多线程IP代理模块爬取百度图片上小姐姐的图片

python-实现一个贴吧图片爬虫

基于Python3+Requests的贴吧签到助手

Python爬虫实战,破解百度翻译JS加密,制作桌面翻译工具

一篇文章教会你利用Python网络爬虫抓取百度贴吧评论区图片和视频

如何用Python爬虫实现百度图片自动下载?