istream_iterator 遍历二进制文件中的字节
Posted
技术标签:
【中文标题】istream_iterator 遍历二进制文件中的字节【英文标题】:istream_iterator to iterate through bytes in a binary file 【发布时间】:2016-03-21 21:51:51 【问题描述】:给定一个包含以下十六进制代码的文件:0B 00 00 00 00 00 20 41
我正在尝试填充 std::vector <:uint8_t>,然后手动检查每个字节。
这是我使用迭代器构造函数从两个 std::istream_iterators 创建向量的代码
using Bytes = std::vector<std::uint8_t>;
using ByteItr = std::istream_iterator<std::uint8_t>;
Bytes getBytes()
std::ifstream in;
in.open("filepath");
in.seekg(0, std::ios::beg);
Bytes bytes;
ByteItr start(in);
ByteItr end;
return Bytes(start, end);
这是我试图通过的单元测试:
auto bytes = getBytes();
REQUIRE( bytes.size() == 8 );
CHECK( bytes[0] == 0x0B );
CHECK( bytes[1] == 0x00 );
CHECK( bytes[2] == 0x00 );
CHECK( bytes[3] == 0x00 );
CHECK( bytes[4] == 0x00 );
CHECK( bytes[5] == 0x00 );
CHECK( bytes[6] == 0x20 );
CHECK( bytes[7] == 0x41 );
为什么在这种情况下,它会跳过两个元素并将我的 std::uint8_t 向量隐式转换为无符号字符?
【问题讨论】:
您能否澄清一下“它跳过两个元素并隐式地将我的 std::uint8_t 向量转换为无符号字符”是什么意思? 另外,一旦你打开你的文件,你可以只return ByteItrin, ByteItr;
,你不需要seekg
开始...
@RiaD 我的意思是它只返回 6 个元素,而预期为 8 个。当我调用函数时,我的列表也会转换为 std::vectoruint8_t
是无符号 8 位类型的 typedef。该类型通常(如果不总是)是无符号字符。所以它不会将它从std::vector<std::uint8_t>
转换为std::vector<unsigned char>
。两种类型相同,无需转换。
【参考方案1】:
不要使用std::istream_iterator<T>
:它用于文本格式的输入。例如,它很可能会跳过空格(您可以使用std::noskipws
禁用跳过空格,但这仍然是错误的做法——改用std::istreambuf_iterator<char>
;类型char
是流的字符类型)。
此外,在处理二进制数据时,请确保您的流以二进制模式打开以避免行尾转换(以防您在进行行尾转换的平台上尝试这样做)。也就是说,您需要将std::ios_base::binary
添加到打开模式。
【讨论】:
【参考方案2】:istream_iterator
不应用于读取二进制文件。它使用operator>>
,它也不适合读取二进制文件(除非这些文件的格式非常特殊,大多数二进制文件都不适合)。您可以改用istreambuf_iterator
。您还需要确保以二进制模式打开文件。
in.open("filepath", std::ios::in | std::ios::binary);
【讨论】:
以上是关于istream_iterator 遍历二进制文件中的字节的主要内容,如果未能解决你的问题,请参考以下文章
istream_iterator && istream_iteratorbuf
为啥在 std::istream_iterator 上使用的 std::find_if 似乎返回最后一个元素?
C++,对自定义的类型用istream_iterator出错!