python 对比两个文件夹 脚本

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 对比两个文件夹 脚本相关的知识,希望对你有一定的参考价值。

参考技术A import hashlib
import os
import sys

if len(sys.argv) < 3: #1
print("You need to specify two directories:") #1
print(sys.argv[0], "<directory 1> <directory 2>") #1
sys.exit() #1
directory1 = sys.argv[1] #2
directory2 = sys.argv[2] #2
print("Comparing:")
print(directory1)
print(directory2)

for directory in [directory1, directory2]:
if not os.access(directory, os.F_OK):
print(directory, "is not a valid directory!")
sys.exit()

def md5(file_path):
if os.path.isdir(file_path):
return '1'
read_file = open(file_path,'r')
the_hash = hashlib.md5()
for line in read_file.readlines():
the_hash.update(line.encode('utf8'))
read_file.close()
return the_hash.hexdigest()

def directory_listing(directory_name):
dir_file_list =
dir_root = None
dir_trim = 0
for path, dirs, files in os.walk(directory_name):
if dir_root is None:
dir_root = path
dir_trim = len(dir_root)
print("dir", directory_name,)
print("root is", dir_root)
trimmed_path = path[dir_trim:]
if trimmed_path.startswith(os.path.sep):
trimmed_path = trimmed_path[1:]
#print "path is", path, " and trimmed_path is", trimmed_path
for each_file in files + dirs:
file_path = os.path.join(trimmed_path, each_file)
dir_file_list[file_path] = True
return (dir_file_list, dir_root)

dir1_file_list, dir1_root = directory_listing(directory1)
dir2_file_list, dir2_root = directory_listing(directory2)
results =

for file_path in dir2_file_list.keys():
if file_path not in dir1_file_list:
results[file_path] = "not found in directory 1"
else:
#print file_path, "found in directory 1 and 2"
file1 = os.path.join(dir1_root, file_path)
file2 = os.path.join(dir2_root, file_path)
if md5(file1) != md5(file2):
results[file_path] = "is different in directory 2"
else:
results[file_path] = "is the same in both"

for file_path, value in dir1_file_list.items():
if file_path not in results:
results[file_path] = "not found in directory 2"

for path, result in sorted(results.items()):
print(path, result)

python-文件内容差异对比

  通过difflib模块实现文件内容差异对比,它是Python的标准库模块,不需要单独安装,作用是对比文件之间的差异。而且支持输出HTML文档,我们可以用difflib对比代码和配置文件的差别。


1、对比两个字符串的差别

技术分享图片

打印一下运行结果:

技术分享图片技术分享图片

理解一下输出的内容:

"-"符号:包含在第一个序列中,但不包含在第二个序列中;

"+"符号:包含在第二个序列中,但不包含在第一个序列中;

""(也就是空):两个序列行一致;

"?"符号:表示两个序列行存在增量差异;

"^"符号:标志出两个序列行存在的差异字符。


1、输出HTML格式的文档(使用HtmlDiff()类的make_file()方法)

技术分享图片

在执行此脚本的时候我们把它输出成到一个以.html(python check_str.py > diff.html)结尾的文件中,在浏览器中打开查看。

技术分享图片


小例子:比如我们维护多个配置文件时,会比较不同版本配置文件的差异,是我们更加清晰的看到增加或修改的差异配置项。实现思路是读取文件内容,以行作为分割,然后对比生成html文档(这里以passwd文件代替配置文件)

技术分享图片




以上是关于python 对比两个文件夹 脚本的主要内容,如果未能解决你的问题,请参考以下文章

python比较两个文件的差异

Python文件对比

使用python实现两个文件夹里文件的对比(包含内容的对比)

python 文件对比并发送邮件

写个脚本使用perl或shell对比oracle表数据,急啊,高分悬赏!

Python:对比两段文本和两个文件不同的地方