简单爬取一个影院单个页面的所有电影名称

Posted 悄悄成长

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了简单爬取一个影院单个页面的所有电影名称相关的知识,希望对你有一定的参考价值。

具体代码如下:

import requests
import re
headers = {\'user-agent\':\'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/74.0.3729.131 Safari/537.36\'}#创建头部信息
url = \'https://v.sogou.com/vertical/2w65l6nv47j3bnhtzcv4hyvx2g45xp5u.html\'
resp = requests.get(url,headers=headers)
info = re.findall(r\'<a href=".*" uigs=".*" target="_blank">(.*)</a>\',resp.text)
print( info )
lst=[]  #用于存储拼接后的url
for item in info:
    lst.append(\'https:\'+item) #这样哪些连接的颜色就变了

 

 

比较简单,稍微练练手

以上是关于简单爬取一个影院单个页面的所有电影名称的主要内容,如果未能解决你的问题,请参考以下文章

六月分享主题:爬虫

Python开发简单爬虫之静态网页抓取篇:爬取“豆瓣电影 Top 250”电影数据

即不充值影视Vip,也不去电影院,为何Python爬虫师是这种人?

14-Requests+正则表达式爬取猫眼电影

Requwsts+正则表达式爬取猫眼电影Top100

爬取电影 Top 500 数据