使用 Python 从 FTP 列出所有子目录中的所有文件
Posted
技术标签:
【中文标题】使用 Python 从 FTP 列出所有子目录中的所有文件【英文标题】:List all the files in all subdirectories from an FTP using Python 【发布时间】:2014-10-10 17:27:56 【问题描述】:我是 Python 新手,我正在尝试从 FTP 列出所有子目录中的所有文件。 和往常一样,FTP 就是这种格式。
A
B
C
子目录:
AA
BB
CC
我可以使用ftp.nlist()
列出目录['A', 'B', 'C']
。我想得到['AA', 'BB', 'CC']
作为我的输出。我已经尝试并进行了很多查找以找到解决方案/提示来执行此操作。
【问题讨论】:
你可以使用 FTP.retrlines() - docs.python.org/2/library/ftplib.html#ftplib.FTP.retrlines @shaktimaan 谢谢。但这与 ftp.dir 非常相似。它只是列出目录。我想要子目录的列表。 【参考方案1】:我知道这有点老了,但这里的答案可以为我节省一些精力,所以就在这里。我有点业余,所以这可能不是最有效的方法,但这是我编写的一个程序,用于获取 FTP 服务器上的所有目录。它会列出所有目录,无论它们在树下有多远。
from ftplib import FTP
def get_dirs_ftp(folder=""):
contents = ftp.nlst(folder)
folders = []
for item in contents:
if "." not in item:
folders.append(item)
return folders
def get_all_dirs_ftp(folder=""):
dirs = []
new_dirs = []
new_dirs = get_dirs_ftp(folder)
while len(new_dirs) > 0:
for dir in new_dirs:
dirs.append(dir)
old_dirs = new_dirs[:]
new_dirs = []
for dir in old_dirs:
for new_dir in get_dirs_ftp(dir):
new_dirs.append(new_dir)
dirs.sort()
return dirs
host ="your host"
user = "user"
password = "password"
print("Connecting to ".format(host))
ftp = FTP(host)
ftp.login(user, password)
print("Connected to ".format(host))
print("Getting directory listing from ".format(host))
all_dirs = get_all_dirs_ftp()
print("***PRINTING ALL DIRECTORIES***")
for dir in all_dirs:
print(dir)
【讨论】:
上面的代码很慢,有没有更好的办法来获取所有的子目录?【参考方案2】:我为 Ed Kern 编写了一个类似的解决方案,但使用了“mlsd”命令。 由于 Ed Kern 的 代码会导致没有文件扩展名的文件出错。使用 mlsd 可以避免此错误。请注意,非常旧的 FTP 服务器可能没有 mlsd 命令。
from ftplib import FTP
def get_items_mlsd(folder):
filedatas = []
for file_data in ftp.mlsd(folder):
filedatas.append(file_data)
return filedatas
def get_all_dirs_ftp(folder=""):
items = []
new_items = []
new_items = get_items_mlsd(folder)
while len(new_items) > 0:
old_dirs = new_items
new_items = []
for file_data in old_dirs:
file_name, meta = file_data
file_type = meta.get("type")
if file_type != "dir":
items.append(file_name)
else:
news = get_items_mlsd(file_name)
for new in news:
file_name1 , meta = new
file_type = meta.get("type")
if file_type == "dir":
new = list(new)
directory = new[0]
new[0] = file_name + "/" + directory
new = tuple(new)
new_items.append(new)
else:
file_name1 = file_name + "/" + file_name1
items.append(file_name1)
items.sort()
return items
host = "host"
user = "user_name"
password = "pw"
print("Connecting to ".format(host))
ftp = FTP(host)
ftp.login(user, password)
print("Connected to ".format(host))
print("Getting file listing from ".format(host))
all_items = get_all_dirs_ftp()
print("***PRINTING ALL ITEMS***")
with open('ftp_files.txt', 'w') as f:
for dir in all_items:
print(dir)
【讨论】:
以上是关于使用 Python 从 FTP 列出所有子目录中的所有文件的主要内容,如果未能解决你的问题,请参考以下文章