在所有子目录中查找具有特定扩展名的文件数

Posted

技术标签:

【中文标题】在所有子目录中查找具有特定扩展名的文件数【英文标题】:Find number of files with a specific extension, in all subdirectories 【发布时间】:2010-09-06 20:30:15 【问题描述】:

有没有一种方法可以找到特定类型的文件数,而不必遍历 Directory.GetFiles() 或类似方法中的所有结果?我正在寻找这样的东西:

int ComponentCount = MagicFindFileCount(@"c:\windows\system32", "*.dll");

我知道我可以创建一个递归函数来调用 Directory.GetFiles ,但如果我可以在不进行所有迭代的情况下执行此操作会更简洁。

编辑:如果不递归和迭代自己就无法做到这一点,那么最好的方法是什么?

【问题讨论】:

【参考方案1】:

您应该使用 Directory.GetFiles() 的 Directory.GetFiles(path, searchPattern, SearchOption) 重载。

Path 指定路径,searchPattern 指定通配符(例如,*、*.format),SearchOption 提供包含子目录的选项。

此搜索的返回数组的 Length 属性将为您的特定搜索模式和选项提供正确的文件计数:

string[] files = directory.GetFiles(@"c:\windows\system32", "*.dll", SearchOption.AllDirectories);

return files.Length;

编辑:或者你可以使用Directory.EnumerateFiles method

return Directory.EnumerateFiles(@"c:\windows\system32", "*.dll", SearchOption.AllDirectories).Count();

【讨论】:

这对大量文件有很大的性能问题。 @Aim - 您(或其他任何人)能否量化您的陈述? “大规模性能问题”有多慢? “大量文件”是多少? Jon 解决方案对我有用,但我想知道它何时/如何会成为问题。 @DavidHAust 原因是GetFiles method 将实现目录中的整个文件列表。现在调用的首选方法是Directory.EnumerateFiles,因为它会将文件流回(通过类似yield 的机制),因为对操作系统的底层调用会返回结果。 OP 的日期为 2008 年……远早于 Directory.EnumerateFiles 甚至在其父亲眼中出现了一丝曙光。不要急于跳到旧帖子中以降低答案,因为有新技术可用。 另外,EnumerateFiles 的速度要慢得多:如果您需要可扩展性,那没关系,但在大多数情况下没有理由接受打击。【参考方案2】:

最巧妙的方法是使用 linq:

var fileCount = (from file in Directory.EnumerateFiles(@"H:\iPod_Control\Music", "*.mp3", SearchOption.AllDirectories)
                    select file).Count();

【讨论】:

为什么不Directory.EnumerateFiles(@"H:\iPod_Control\Music", "*.mp3", SearchOption.AllDirectories).Count()【参考方案3】:

您可以使用 GetFiles 的这个重载:

Directory.GetFiles Method (String, String, SearchOption)

还有这个 SearchOption 的成员:

AllDirectories - 包括当前 目录和所有子目录 在搜索操作中。这个选项 包括像mounted这样的重解析点 驱动器和符号链接 搜索。

GetFiles 返回一个字符串数组,因此您可以获取长度,即找到的文件数。

【讨论】:

【参考方案4】:

我一直在寻找更优化的版本。由于没找到,所以决定打个代码,在这里分享一下:

    public static int GetFileCount(string path, string searchPattern, SearchOption searchOption)
    
        var fileCount = 0;
        var fileIter = Directory.EnumerateFiles(path, searchPattern, searchOption);
        foreach (var file in fileIter)
            fileCount++;
        return fileCount;
    

所有使用 GetFiles/GetDirectories 的解决方案有点慢,因为所有这些对象都需要创建。使用枚举,它不会创建任何临时对象(FileInfo/DirectoryInfo)。

更多信息见备注http://msdn.microsoft.com/en-us/library/dd383571.aspx

【讨论】:

【参考方案5】:

使用递归,您的 MagicFindFileCount 将如下所示:

private int MagicFindFileCount( string strDirectory, string strFilter ) 
     int nFiles = Directory.GetFiles( strDirectory, strFilter ).Length;

     foreach( String dir in Directory.GetDirectories( strDirectory ) ) 
        nFiles += GetNumberOfFiles(dir, strFilter);
     

     return nFiles;
  

虽然Jon's solution 可能更好。

【讨论】:

【参考方案6】:

我有一个应用程序可以生成父目录中的目录和文件计数。一些目录包含数千个子目录,每个子目录有数千个文件。为此,在保持响应式用户界面的同时,我执行以下操作(将路径发送到 ADirectoryPathWasSelected 方法):

public class DirectoryFileCounter

    int mDirectoriesToRead = 0;

    // Pass this method the parent directory path
    public void ADirectoryPathWasSelected(string path)
    
        // create a task to do this in the background for responsive ui
        // state is the path
        Task.Factory.StartNew((state) =>
        
            try
            
                // Get the first layer of sub directories
                this.AddCountFilesAndFolders(state.ToString())


             
             catch // Add Handlers for exceptions
             
        , path));
    

    // This method is called recursively
    private void AddCountFilesAndFolders(string path)
    
        try
        
            // Only doing the top directory to prevent an exception from stopping the entire recursion
            var directories = Directory.EnumerateDirectories(path, "*.*", SearchOption.TopDirectoryOnly);

            // calling class is tracking the count of directories
            this.mDirectoriesToRead += directories.Count();

            // get the child directories
            // this uses an extension method to the IEnumerable<V> interface,
           // which will run a function on an object. In this case 'd' is the 
           // collection of directories
            directories.ActionOnEnumerable(d => AddCountFilesAndFolders(d));
        
        catch // Add Handlers for exceptions
        
        
        try
        
            // count the files in the directory
            this.mFilesToRead += Directory.EnumerateFiles(path).Count();
        
        catch// Add Handlers for exceptions
         
    

// Extension class
public static class Extensions
 
    // this runs the supplied method on each object in the supplied enumerable
    public static void ActionOnEnumerable<V>(this IEnumerable<V> nodes,Action<V> doit)
    

        foreach (var node in nodes)
           
            doit(node);
        
    

【讨论】:

【参考方案7】:

有人必须完成迭代部分。

AFAIK,.NET 中还没有这样的方法,所以我猜一定有人是你。

【讨论】:

以上是关于在所有子目录中查找具有特定扩展名的文件数的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 Python 计算目录中的文件数

C++ 查找指定目录下的文件数

C++ 查找指定目录下的文件数

如何在Python中的目录中查找具有特定文件扩展名的所有文件

如何计算每个目录中的文件数?

python 查找具有特定扩展名的目录中的所有文件