如何使用python脚本从网站中废弃数据并以层次结构存储在文件夹中?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用python脚本从网站中废弃数据并以层次结构存储在文件夹中?相关的知识,希望对你有一定的参考价值。
我正在尝试使用python从网站获取数据,然后我在本地下载了文本文件,我想从文本文件中的锚标记中获取数据,并将新文件夹重命名为锚标记值。
这里我使用python创建新文件夹但无法从txt文件和进程中获取数据
我能够创建新文件夹,但我想将重命名作为锚标记值
import os
root_path = '/home'
folders = ['folder 01', 'folder 02', 'folder 03']
for folder in folders:
os.mkdir(os.path.join(root_path, folder))
答案
请尝试以下代码。它应该创建锚标记中存在的所有文件夹名称。
from bs4 import BeautifulSoup
import requests
import os
url = 'Url Here'
html = requests.get(url).text
soup = BeautifulSoup(html, 'html.parser')
for folder in soup.find_all('a'):
root_path = '/home'
os.mkdir(os.path.join(root_path, folder.text))
如果这项工作,请告诉我。
以上是关于如何使用python脚本从网站中废弃数据并以层次结构存储在文件夹中?的主要内容,如果未能解决你的问题,请参考以下文章
从 SQL 数据库中检索记录并以 HTML 格式打印(通过 Python)
利用递归层次遍历句法结构树(Stanfordcorenlp及nltk)
如何从网站获取文本数据并使用python存储为excel文件