Java:如何在正在保存的流上即时计算sha1摘要?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java:如何在正在保存的流上即时计算sha1摘要?相关的知识,希望对你有一定的参考价值。

我有一个用Java编写的servlet,它接受一个需要保存在MongoDb / GridFS中的多部分形式的发布文件。我已经有了为此工作的代码。

这是一个代码片段,显示了如何使用org.apache.commons.fileupload包完成它。它几乎不消耗任何内存,因为它不会在内存中保留太多数据。

        ServletFileUpload upload = new ServletFileUpload();
        FileItemIterator iter = upload.getItemIterator(req);
        while (iter.hasNext()) {
            FileItemStream item = iter.next();
            String name = item.getFieldName();
            InputStream stream = item.openStream();
            if (item.isFormField()) {
                toProcess.put(name, Streams.asString(stream));
            } else {
                String fileName = item.getName();
                String contentType = item.getHeaders().getHeader("Content-Type");
                GridFSUploadOptions options = new GridFSUploadOptions()
                        // .chunkSizeBytes(358400)
                        .metadata(new Document("content_type", contentType));
                ObjectId fileId = gridFSFilesBucket.uploadFromStream(fileName, stream, options);
                fileIds.add(fileId);
                fileNames.add(fileName);
            }

我还需要计算所有文件的sha1哈希值。 Apache digestutils可用于此目的。它有一个方法可以计算流上的sha1:

https://commons.apache.org/proper/commons-codec/apidocs/org/apache/commons/codec/digest/DigestUtils.html#sha1-java.io.InputStream-

我的问题是这个方法完全消耗了流。我需要将输入流分成两部分。将一部分输入SHA-1计算,将另一部分输入GridFS存储桶。

我怎样才能做到这一点?我正在考虑创建自己的“管道”,它具有输入和输出流,转发所有数据,但动态更新摘要。

我只是不知道如何开始写这样的管道。

答案

你可以使用Java API class DigestInputStream

正如Javadoc所解释的那样,

透明流,使用通过流的位更新关联的消息摘要。

要完成消息摘要计算,请在调用此摘要输入流的读取方法之一后,在相关消息摘要上调用其中一个摘要方法。

在您的代码中,您可以这样做:

InputStream stream = item.openStream();
MessageDigest digest = MessageDigest.getInstance("SHA-256");
stream = new DigestInputStream(stream, digest);

最后你可以得到摘要:

byte[] hash = digest.digest();

以上是关于Java:如何在正在保存的流上即时计算sha1摘要?的主要内容,如果未能解决你的问题,请参考以下文章

SHA1 和 RSA 与 java.security.Signature 对比 MessageDigest 和 Cipher

安全算法之SHA1SHA1摘要运算的C语言源码实现

javascript sha1的解密语句是啥?已经有sha1的js库了,而且加密语句知道了,就差解密语句!!!

如何在没有 Git 的情况下将 Git SHA1 分配给文件?

信息摘要算法之二:SHA1算法分析及实现

Python 3:如何在不保存在磁盘上的情况下将 pandas 数据帧作为 csv 流上传?