使用Python从网页中获取链接

Posted Ch4536251

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用Python从网页中获取链接相关的知识,希望对你有一定的参考价值。

从网页中获取链接

import requests as rb           # 导入requests库
from bs4 import BeautifulSoup   #   调用beautifulsoup库

url = input("Enter Link:")      # 获取输入
if ("https" or "http") in url:
    data = rb.get(url)          #获取html网页,对应HTTP的GET
else:
    data = rb.get("https://" + url)         #获取HTML网页,对应HTTP的GET
soup = BeautifulSoup(data.text,"html.parser")       #使用BeautifulSoup解析获取到的数据
links = []          #定义空列表links
for link in soup.find_all("a"):
    links.append(link.get("href"))          #输出网页中的a标签下的href内容到links中;; append()方法用于在列表末尾添加新的对象

# 将输出写入文件(Links.txt)
# 可以将“a”更改为“w”,以便每次都覆盖该文件
with open("Links.txt",'a') as saved:
    print(links[:100],file=saved)

参考:https://github.com/Python-World/python-mini-projects

以上是关于使用Python从网页中获取链接的主要内容,如果未能解决你的问题,请参考以下文章

python来获取网页中的所有链接

如何使用 CSS/Selenium 从网页获取链接

如何使用Selenium从网页获取所有元素?

使用python从网页中提取csv下载链接

python简单爬取静态网页

php中curl爬虫 怎么样通过网页获取所有链接