python 对比两个文件夹 脚本
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 对比两个文件夹 脚本相关的知识,希望对你有一定的参考价值。
参考技术A import hashlibimport os
import sys
if len(sys.argv) < 3: #1
print("You need to specify two directories:") #1
print(sys.argv[0], "<directory 1> <directory 2>") #1
sys.exit() #1
directory1 = sys.argv[1] #2
directory2 = sys.argv[2] #2
print("Comparing:")
print(directory1)
print(directory2)
for directory in [directory1, directory2]:
if not os.access(directory, os.F_OK):
print(directory, "is not a valid directory!")
sys.exit()
def md5(file_path):
if os.path.isdir(file_path):
return '1'
read_file = open(file_path,'r')
the_hash = hashlib.md5()
for line in read_file.readlines():
the_hash.update(line.encode('utf8'))
read_file.close()
return the_hash.hexdigest()
def directory_listing(directory_name):
dir_file_list =
dir_root = None
dir_trim = 0
for path, dirs, files in os.walk(directory_name):
if dir_root is None:
dir_root = path
dir_trim = len(dir_root)
print("dir", directory_name,)
print("root is", dir_root)
trimmed_path = path[dir_trim:]
if trimmed_path.startswith(os.path.sep):
trimmed_path = trimmed_path[1:]
#print "path is", path, " and trimmed_path is", trimmed_path
for each_file in files + dirs:
file_path = os.path.join(trimmed_path, each_file)
dir_file_list[file_path] = True
return (dir_file_list, dir_root)
dir1_file_list, dir1_root = directory_listing(directory1)
dir2_file_list, dir2_root = directory_listing(directory2)
results =
for file_path in dir2_file_list.keys():
if file_path not in dir1_file_list:
results[file_path] = "not found in directory 1"
else:
#print file_path, "found in directory 1 and 2"
file1 = os.path.join(dir1_root, file_path)
file2 = os.path.join(dir2_root, file_path)
if md5(file1) != md5(file2):
results[file_path] = "is different in directory 2"
else:
results[file_path] = "is the same in both"
for file_path, value in dir1_file_list.items():
if file_path not in results:
results[file_path] = "not found in directory 2"
for path, result in sorted(results.items()):
print(path, result)
python-文件内容差异对比
通过difflib模块实现文件内容差异对比,它是Python的标准库模块,不需要单独安装,作用是对比文件之间的差异。而且支持输出HTML文档,我们可以用difflib对比代码和配置文件的差别。
1、对比两个字符串的差别
打印一下运行结果:
理解一下输出的内容:
"-"符号:包含在第一个序列中,但不包含在第二个序列中;
"+"符号:包含在第二个序列中,但不包含在第一个序列中;
""(也就是空):两个序列行一致;
"?"符号:表示两个序列行存在增量差异;
"^"符号:标志出两个序列行存在的差异字符。
1、输出HTML格式的文档(使用HtmlDiff()类的make_file()方法)
在执行此脚本的时候我们把它输出成到一个以.html(python check_str.py > diff.html)结尾的文件中,在浏览器中打开查看。
小例子:比如我们维护多个配置文件时,会比较不同版本配置文件的差异,是我们更加清晰的看到增加或修改的差异配置项。实现思路是读取文件内容,以行作为分割,然后对比生成html文档(这里以passwd文件代替配置文件)
以上是关于python 对比两个文件夹 脚本的主要内容,如果未能解决你的问题,请参考以下文章
使用python实现两个文件夹里文件的对比(包含内容的对比)