如何使用python脚本从网站中废弃数据并以层次结构存储在文件夹中?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用python脚本从网站中废弃数据并以层次结构存储在文件夹中?相关的知识,希望对你有一定的参考价值。

我正在尝试使用python从网站获取数据,然后我在本地下载了文本文件,我想从文本文件中的锚标记中获取数据,并将新文件夹重命名为锚标记值。

这里我使用python创建新文件夹但无法从txt文件和进程中获取数据

我能够创建新文件夹,但我想将重命名作为锚标记值

import os

root_path = '/home'    
folders = ['folder 01', 'folder 02', 'folder 03']    
for folder in folders:
    os.mkdir(os.path.join(root_path, folder))
答案

请尝试以下代码。它应该创建锚标记中存在的所有文件夹名称。

from bs4 import BeautifulSoup
import requests
import os
url = 'Url Here'
html = requests.get(url).text
soup = BeautifulSoup(html, 'html.parser')
for folder in soup.find_all('a'):
    root_path = '/home'
    os.mkdir(os.path.join(root_path, folder.text))

如果这项工作,请告诉我。

以上是关于如何使用python脚本从网站中废弃数据并以层次结构存储在文件夹中?的主要内容,如果未能解决你的问题,请参考以下文章

从 SQL 数据库中检索记录并以 HTML 格式打印(通过 Python)

利用递归层次遍历句法结构树(Stanfordcorenlp及nltk)

如何从网站获取文本数据并使用python存储为excel文件

从具有父字段的平面列表构造层次结构树? [复制]

python 使用aria2从EdX下载视频并自动将它们放在干净的文件夹层次结构中的脚本。

使用 Python 从 Gmail 中提取信息