window/linux下获取文件MD5

Posted 随性者也

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了window/linux下获取文件MD5相关的知识,希望对你有一定的参考价值。

MD5消息摘要算法(英语: MD5 Message-Digest Algorithm), 主要用于确保信息传输过程的一致性校验。
 
首先介绍两个工具:
window: WinMD5Free
Linux: md5sum
这两个工具的作用是验证自己写的程序获取MD5是否正确。
 
先上一段错误代码:
 1 string getFileMd5(const string& file)
 2 {
 3     MD5 md5;
 4     ifstream f(file.c_str(), ios_base::binrary);
 5     char buffer[64 * 1024];
 6     while (!f.eof())
 7     {
 8         f.read(buffer, sizeof(buffer));
 9         size_t length = strlen(buffer);
10         md5.update(buffer, length);
11     }
12     return md5.md5();
13 }

 

逻辑上,看似没有问题的一段代码。
实际验证的情况:
window下获取的MD5与第三方获取的值一致;
linux下获取的MD5与第三方获取的值不一致。
也就是说计算MD5时的输入不一致,导致的结果不一致。
 
问题分析:
上面的代码最有可能出问题的地方在用strlen获取buffer的大小。strlen以‘’标志确定函数读取终止。从文件中读取的二进制数据中间是可能存在‘’的情况,打印每次strlen返回的结果,可以验证这个情况。
 
问题的原因已经找到,那么如何解决这个问题呢?
如果你熟悉C++ IO操作,io库已经考虑过这个问题。获取每次读取的大小,使用fstream.gcount()返回正确读取大小。
 
正确的代码
 1 string getFileMd5(const string& file)
 2 {
 3     MD5 md5;
 4     ifstream f(file.c_str(), ios_base::binrary);
 5     char buffer[64 * 1024];
 6     while (!f.eof())
 7     {
 8         f.read(buffer, sizeof(buffer));
 9         md5.update(buffer, f.gcount());
10     }
11     return md5.md5();
12 }

 

工作中遇到这样的问题,经历过多次尝试才发现这个问题,在此处记录下。

以上是关于window/linux下获取文件MD5的主要内容,如果未能解决你的问题,请参考以下文章

安卓获取文件MD5值

Windows下获取文件的md5码的方法

Mac下Android Studio中获取SHA1和MD5

shell脚本获取MD5值

获取APK/签名文件的SHA1证书,MD5

如何用vba获取文件的MD5 Hash值?