使用 Python 从 FTP 列出所有子目录中的所有文件

Posted

技术标签:

【中文标题】使用 Python 从 FTP 列出所有子目录中的所有文件【英文标题】:List all the files in all subdirectories from an FTP using Python 【发布时间】:2014-10-10 17:27:56 【问题描述】:

我是 Python 新手,我正在尝试从 FTP 列出所有子目录中的所有文件。 和往常一样,FTP 就是这种格式。

 A
 B
 C

子目录:

 AA
 BB
 CC

我可以使用ftp.nlist() 列出目录['A', 'B', 'C']。我想得到['AA', 'BB', 'CC'] 作为我的输出。我已经尝试并进行了很多查找以找到解决方案/提示来执行此操作。

【问题讨论】:

你可以使用 FTP.retrlines() - docs.python.org/2/library/ftplib.html#ftplib.FTP.retrlines @shaktimaan 谢谢。但这与 ftp.dir 非常相似。它只是列出目录。我想要子目录的列表。 【参考方案1】:

我知道这有点老了,但这里的答案可以为我节省一些精力,所以就在这里。我有点业余,所以这可能不是最有效的方法,但这是我编写的一个程序,用于获取 FTP 服务器上的所有目录。它会列出所有目录,无论它们在树下有多远。

from ftplib import FTP

def get_dirs_ftp(folder=""):
    contents = ftp.nlst(folder)
    folders = []
    for item in contents:
        if "." not in item:
            folders.append(item)
    return folders

def get_all_dirs_ftp(folder=""):
    dirs = []
    new_dirs = []

    new_dirs = get_dirs_ftp(folder)

    while len(new_dirs) > 0:
        for dir in new_dirs:
            dirs.append(dir)

        old_dirs = new_dirs[:]
        new_dirs = []
        for dir in old_dirs:
            for new_dir in get_dirs_ftp(dir):
                new_dirs.append(new_dir)

    dirs.sort()
    return dirs


host ="your host"
user = "user"
password = "password"

print("Connecting to ".format(host))
ftp = FTP(host)
ftp.login(user, password)
print("Connected to ".format(host))

print("Getting directory listing from ".format(host))
all_dirs = get_all_dirs_ftp()
print("***PRINTING ALL DIRECTORIES***")
for dir in all_dirs:
    print(dir)

【讨论】:

上面的代码很慢,有没有更好的办法来获取所有的子目录?【参考方案2】:

我为 Ed Kern 编写了一个类似的解决方案,但使用了“mlsd”命令。 由于 Ed Kern 的 代码会导致没有文件扩展名的文件出错。使用 mlsd 可以避免此错误。请注意,非常旧的 FTP 服务器可能没有 mlsd 命令。

from ftplib import FTP

def get_items_mlsd(folder):
    filedatas = []
    for file_data in ftp.mlsd(folder):
        filedatas.append(file_data)
    return filedatas

def get_all_dirs_ftp(folder=""):
    items = []
    new_items = []

    new_items = get_items_mlsd(folder)

    while len(new_items) > 0:
        old_dirs = new_items
        new_items = []
        for file_data in old_dirs:
            file_name, meta = file_data
            file_type = meta.get("type")
            if file_type != "dir":
                items.append(file_name)
            else:
                news = get_items_mlsd(file_name)
                for new in news:
                    file_name1 , meta = new
                    file_type = meta.get("type")
                    if file_type == "dir":
                        new = list(new)
                        directory = new[0]
                        new[0] = file_name + "/" + directory
                        new = tuple(new)
                        new_items.append(new)
                    else:
                        file_name1 = file_name + "/" + file_name1
                        items.append(file_name1)
    items.sort()
    return items

host = "host"
user = "user_name"
password = "pw"

print("Connecting to ".format(host))
ftp = FTP(host)
ftp.login(user, password)
print("Connected to ".format(host))
print("Getting file listing from ".format(host))

all_items = get_all_dirs_ftp()

print("***PRINTING ALL ITEMS***")
with open('ftp_files.txt', 'w') as f:
    for dir in all_items:
        print(dir)

【讨论】:

以上是关于使用 Python 从 FTP 列出所有子目录中的所有文件的主要内容,如果未能解决你的问题,请参考以下文章

在 R 中列出 HTTP/FTP 服务器上的文件

列出所有子目录中的所有 *.jpg 文件并复制到新文件夹

如何在C#中使用FTP列出目录内容?

如何在 C# 中使用 FTP 列出目录内容?

Python:列出子目录中的导入选项,然后导入其中一个[重复]

使用 Spark 列出 Hadoop HDFS 目录中的所有文件?