如何统计文件重复率

Posted java-ty

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何统计文件重复率相关的知识,希望对你有一定的参考价值。

假设某个目录下有N个文件夹,每个文件夹下是某个人的项目代码,一个人一个文件夹,代码有可能文件名不同,但内容可能相同

程序执行时,通过指定路径,分析出某个人和其他人的重复率,如:

被比较者姓名    比较者姓名1   重复率

张三                   李四               90

张三                   王五               30

重复率是所有文件比较完成后,每个文件的重复率平均值,在分析的过程中,要有分析的过程情况,如:

**************欢迎使用xxx查重系统*************************

此次查重总共需要分析【20】人

开始分析第【1】人张三

正在分析【张三】和【李四】,完成度【30%】,当前重复率【50%】

分析完成【张三】和【李四】,重复率为【90%】

开始分析第【2】人【王五】

。。。

最后输出整体比对结果:

此次查重总共分析【20】人,用时【20分钟】

结果如下:

被比较者姓名    比较者姓名1   重复率

张三                   李四               90

张三                   王五               30

以上是关于如何统计文件重复率的主要内容,如果未能解决你的问题,请参考以下文章

如何将密钥重复率提高到操作系统限制之外?

如何从 Python 中的混淆矩阵中获取精度、召回率和 f 度量 [重复]

ORACLE中,如何使用UPDATE修改重复列

excel统计重复个数

软件工程论文书写设计步骤及如何降低重复率

SQL中如何统计查询结果中某一列重复值的个数?