istream_iterator 遍历二进制文件中的字节

Posted

技术标签:

【中文标题】istream_iterator 遍历二进制文件中的字节【英文标题】:istream_iterator to iterate through bytes in a binary file 【发布时间】:2016-03-21 21:51:51 【问题描述】:

给定一个包含以下十六进制代码的文件:0B 00 00 00 00 00 20 41

我正在尝试填充 std::vector <:uint8_t>,然后手动检查每个字节。

这是我使用迭代器构造函数从两个 std::istream_iterators 创建向量的代码

using Bytes   = std::vector<std::uint8_t>;
using ByteItr = std::istream_iterator<std::uint8_t>;

Bytes getBytes()

    std::ifstream in;
    in.open("filepath");
    in.seekg(0, std::ios::beg);
    Bytes bytes;
    ByteItr start(in);
    ByteItr end;
    return Bytes(start, end);

这是我试图通过的单元测试:

auto bytes = getBytes();

REQUIRE( bytes.size() == 8 );

CHECK( bytes[0] == 0x0B );
CHECK( bytes[1] == 0x00 );
CHECK( bytes[2] == 0x00 );
CHECK( bytes[3] == 0x00 );
CHECK( bytes[4] == 0x00 );
CHECK( bytes[5] == 0x00 );
CHECK( bytes[6] == 0x20 );
CHECK( bytes[7] == 0x41 );

为什么在这种情况下,它会跳过两个元素并将我的 std::uint8_t 向量隐式转换为无符号字符?

【问题讨论】:

您能否澄清一下“它跳过两个元素并隐式地将我的 std::uint8_t 向量转换为无符号字符”是什么意思? 另外,一旦你打开你的文件,你可以只return ByteItrin, ByteItr;,你不需要seekg开始... @RiaD 我的意思是它只返回 6 个元素,而预期为 8 个。当我调用函数时,我的列表也会转换为 std::vector @Burtonium: uint8_t 是无符号 8 位类型的 typedef。该类型通常(如果不总是)是无符号字符。所以它不会将它从std::vector&lt;std::uint8_t&gt; 转换为std::vector&lt;unsigned char&gt;。两种类型相同,无需转换。 【参考方案1】:

不要使用std::istream_iterator&lt;T&gt;:它用于文本格式的输入。例如,它很可能会跳过空格(您可以使用std::noskipws 禁用跳过空格,但这仍然是错误的做法——改用std::istreambuf_iterator&lt;char&gt;;类型char 是流的字符类型)。

此外,在处理二进制数据时,请确保您的流以二进制模式打开以避免行尾转换(以防您在进行行尾​​转换的平台上尝试这样做)。也就是说,您需要将std::ios_base::binary 添加到打开模式。

【讨论】:

【参考方案2】:

istream_iterator 不应用于读取二进制文件。它使用operator&gt;&gt;,它也不适合读取二进制文件(除非这些文件的格式非常特殊,大多数二进制文件都不适合)。您可以改用istreambuf_iterator。您还需要确保以二进制模式打开文件。

in.open("filepath", std::ios::in | std::ios::binary);

【讨论】:

以上是关于istream_iterator 遍历二进制文件中的字节的主要内容,如果未能解决你的问题,请参考以下文章

istream_iterator && istream_iteratorbuf

为啥在 std::istream_iterator 上使用的 std::find_if 似乎返回最后一个元素?

C++,对自定义的类型用istream_iterator出错!

求教关istream_iterator 与vector 问题

读取二进制文件并遍历每个字节

c++之iostream迭代器用法超详细整理!!!