python 按文件大小查找重复项

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 按文件大小查找重复项相关的知识,希望对你有一定的参考价值。

import os

from collections import defaultdict


def find_duplicates_by_size(files):
    """
    Description:
        Find duplicate files based solely on the size per file
    """
    file_sizes = defaultdict(list)
    for path in list(files):
        file_sizes[os.path.getsize(path)].append(path)

    duplicates = [x for x in file_sizes.values() if len(x) > 1]
    return [x for x in file_sizes if x.value in duplicates]

以上是关于python 按文件大小查找重复项的主要内容,如果未能解决你的问题,请参考以下文章

如何按 RDD 中的选定字段数进行分组,以查找基于这些字段的重复项

查找泡菜文件python的字节大小[重复]

Python - 在字典列表中查找重复项并将它们分组

Python - 使用正则表达式查找多个匹配项并将它们打印出来[重复]

sql SQL查询以查找表中的列中的重复项,从而更改列的排序规则以确保重复项检查为大小写

python 删除/查找重复项