python3爬取网页,报错AttributeError: 'NoneType' object has no attribute 'xpath'?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python3爬取网页,报错AttributeError: 'NoneType' object has no attribute 'xpath'?相关的知识,希望对你有一定的参考价值。
#导入所需要的包import sysimport codecssys.stdout = codecs.getwriter("utf-8")(sys.stdout)import requestsfrom lxml import etreeurl = 'https://movie.douban.com/subject/1292052/'data = requests.get(url).texts=etree.html(data)#获取电影名称、导演、主演、时长信息film=s.xpath('//*[@id="content"]/h1/span[1]/text()')director=s.xpath('//*[@id="info"]/span[1]/span[2]/a/text()')actor=s.xpath('//*[@id="info"]/span[3]/span[2]/a/text()')time=s.xpath('//*[@id="info"]/span[13]/text()')#显示获取的信息内容print('name:',film)print('director:',director)print('actors:',actor)print('duration:',time)求指点!!!
参考技术A headers='User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'data = requests.get(url,headers=headers).text
加一个头部就行了本回答被提问者和网友采纳 参考技术B “NoneType”是找不到标签造成的。
有可能是你写的不对
还有可能是你没更改访问头被网站封ip了
怎么用python爬取一个网站的网页数量
参考技术A 1.这个要根据你的网站地址进行分析,构造网站的url,通过for循环,做统计输出,从而计算出一个网站的网页数量。
2.
由于你未给出具体网站的地址,只能给你说个流程如上。
望采纳,希望能帮到你。。。。。。
以上是关于python3爬取网页,报错AttributeError: 'NoneType' object has no attribute 'xpath'?的主要内容,如果未能解决你的问题,请参考以下文章