python进行文件对比的方法
时间:2021-04-23 09:29:02|栏目:Python代码|点击: 次
文件对比是否一致,我们一般采用md5值对比,假如一样,代表文件一致,不一样说明不一致
假如想要详细的对比信息内容,difflib库提供了文件对比的详细信息和结果
1、首先我们查看下md5值的使用方法
我们先建立几个示例文件方便我们参考,文件file1,file1_copy,file2

2、file1的内容和file1_copy的内容一致,都为
我是文件hello
为了测试我们的文件一致性

3、file2的内容和file1的文件有所区别,内容为:
我是文件world

4、接下来就是获取md5的方法,我可以了个公共方法,大家直接调用就好
需要导入包
import os
import hashlib
def get_file_md5(filename):
if not os.path.isfile(filename):
return
md5 = hashlib.md5()
f = file(filename,'rb')
while True:
b = f.read(8096)
if not b:
break
md5.update(b)
f.close()
return md5.hexdigest()
然后我们打印下这几个文件的md5值
print 'file1 的md5:%s' % get_file_md5('file1.txt')
print 'file1_copy的md5:%s' % get_file_md5('file1_copy.txt')
print 'file2 的md5:%s' % get_file_md5('file2.txt')

5、运行python结果可以看到,file1和file1_copy文件的md5值是一样的,说明这两个文件是一样的,file2和他们不一样

6、接下来就是使用difflib详细的对比了,写法如下:
import difflib
import sys
file1 = open('file1.txt', 'U').readlines()
file2 = open('file2.txt', 'U').readlines()
diff = difflib.ndiff(file1, file2)
sys.stdout.writelines(diff)

7、运行python结果可以看到,具体两个文件的区别
我是文件
- hello+ world

上一篇:Python爬虫 bilibili视频弹幕提取过程详解
栏 目:Python代码
下一篇:python3编码问题汇总
本文标题:python进行文件对比的方法
本文地址:http://www.codeinn.net/misctech/107102.html






