python爬runoob目录链接栏

Posted zhuyu123

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬runoob目录链接栏相关的知识,希望对你有一定的参考价值。

import re
import requests
url=https://www.runoob.com/python3/python3.html
response=requests.get(url)
html=response.text
response.encoding=utf-8
dl=re.findall(r<div class="design" id="leftcolumn">.*?</div>,html,re.S)[0]
tree=re.findall(rtitle="(.*?)".*?href="(.*?)",dl)
lst=[]
def get_data(link):
    lst.append(link)
    ht=requests.get(link)
    print(已下载,len(lst),)
for tree_info in tree:
    url=https://www.runoob.com/python3{}
.format(tree_info[1])
    with open(D:Desktop测试html.txt,a) as f:
        f.write(url)
    get_data(url)

以上是关于python爬runoob目录链接栏的主要内容,如果未能解决你的问题,请参考以下文章

python小白学习记录 多线程爬取ts片段

十年老Python程序员:给我一个链接,没有我不能爬的视频,只有我顶不住的视频

scrapy主动退出爬虫的代码片段(python3)

Python爬虫爬取动态网页

大规模数据爬取 -- Python

python 爬起点目录