将二进制文件读入结构

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了将二进制文件读入结构相关的知识,希望对你有一定的参考价值。

我正在尝试使用C#读取二进制数据。我有关于我想要阅读的文件中数据布局的所有信息。我能够读取数据“chunk by chunk”,即获取前40个字节的数据将其转换为字符串,得到接下来的40个字节。

由于至少有三种略有不同的数据版本,我想将数据直接读入结构中。它只是通过“逐行”阅读它而感觉更加正确。

我尝试了以下方法但无济于事:

StructType aStruct;
int count = Marshal.SizeOf(typeof(StructType));
byte[] readBuffer = new byte[count];
BinaryReader reader = new BinaryReader(stream);
readBuffer = reader.ReadBytes(count);
GCHandle handle = GCHandle.Alloc(readBuffer, GCHandleType.Pinned);
aStruct = (StructType) Marshal.PtrToStructure(handle.AddrOfPinnedObject(), typeof(StructType));
handle.Free();

该流是一个打开的FileStream,我已经开始从中读取。使用AccessViolationExceptio时,我得到了Marshal.PtrToStructuren。

由于我对文件末尾的数据不感兴趣,因此该流包含的信息比我尝试阅读的要多。

结构定义如下:

[StructLayout(LayoutKind.Explicit)]
struct StructType
{
    [FieldOffset(0)]
    public string FileDate;
    [FieldOffset(8)]
    public string FileTime;
    [FieldOffset(16)]
    public int Id1;
    [FieldOffset(20)]
    public string Id2;
}

示例代码从原始代码更改为使此问题更短。

如何将二进制数据从文件读入结构?

答案

问题是结构中的字符串。我发现像byte / short / int这样的编组类型不是问题;但是当你需要编组成一个复杂的类型(如字符串)时,你需要你的结构显式地模仿非托管类型。您可以使用MarshalAs attrib执行此操作。

对于您的示例,以下应该工作:

[StructLayout(LayoutKind.Explicit)]
struct StructType
{
    [FieldOffset(0)]
    [MarshalAs(UnmanagedType.ByValTStr, SizeConst = 8)]
    public string FileDate;

    [FieldOffset(8)]
    [MarshalAs(UnmanagedType.ByValTStr, SizeConst = 8)]
    public string FileTime;

    [FieldOffset(16)]
    public int Id1;

    [FieldOffset(20)]
    [MarshalAs(UnmanagedType.ByValTStr, SizeConst = 66)] //Or however long Id2 is.
    public string Id2;
}
另一答案

这是我正在使用的。 这成功地为我阅读可移植可执行格式。 这是一个通用功能,所以T是你的struct类型。

public static T ByteToType<T>(BinaryReader reader)
{
    byte[] bytes = reader.ReadBytes(Marshal.SizeOf(typeof(T)));

    GCHandle handle = GCHandle.Alloc(bytes, GCHandleType.Pinned);
    T theStructure = (T)Marshal.PtrToStructure(handle.AddrOfPinnedObject(), typeof(T));
    handle.Free();

    return theStructure;
}
另一答案

正如罗尼所说,我会使用BinaryReader并分别读取每个字段。我找不到带有此信息的文章的链接,但据观察,如果struct包含少于30-40个字段,使用BinaryReader读取每个单独的字段可能比Marshal.PtrToStruct更快。当我找到它时,我会发布文章的链接。

该文章的链接位于:http://www.codeproject.com/Articles/10750/Fast-Binary-File-Reading-with-C

当编组结构数组时,PtrToStruct可以更快地获得上风,因为您可以将字段计数视为字段*数组长度。

另一答案

我没有运气使用BinaryFormatter,我想我必须有一个完全匹配文件内容的完整结构。我意识到最后我对文件内容并不感兴趣,所以我选择了将部分流读取到bytebuffer然后使用它转换它的解决方案。

Encoding.ASCII.GetString()

对于字符串和

BitConverter.ToInt32()

对于整数。

我需要能够稍后解析更多的文件,但是对于这个版本,我只需要几行代码就可以了。

另一答案

我没有看到您的代码有任何问题。

只是出于我的想法,如果你试图手动怎么办?它有用吗?

BinaryReader reader = new BinaryReader(stream);
StructType o = new StructType();
o.FileDate = Encoding.ASCII.GetString(reader.ReadBytes(8));
o.FileTime = Encoding.ASCII.GetString(reader.ReadBytes(8));
...
...
...

也试试

StructType o = new StructType();
byte[] buffer = new byte[Marshal.SizeOf(typeof(StructType))];
GCHandle handle = GCHandle.Alloc(buffer, GCHandleType.Pinned);
Marshal.StructureToPtr(o, handle.AddrOfPinnedObject(), false);
handle.Free();

然后在BinaryReader中使用buffer []而不是从FileStream读取数据,看看你是否仍然得到AccessViolation异常。

我没有运气使用BinaryFormatter,我想我必须有一个完全匹配文件内容的完整结构。

这是有道理的,BinaryFormatter有自己的数据格式,与你的完全不兼容。

另一答案

试试这个:

using (FileStream stream = new FileStream(fileName, FileMode.Open))
{
    BinaryFormatter formatter = new BinaryFormatter();
    StructType aStruct = (StructType)formatter.Deserialize(filestream);
}
另一答案

直接阅读结构是邪恶的 - 许多C程序因为不同的字节顺序,字段的不同编译器实现,打包,字大小而落后......

您最好逐字节串行化和反序列化。如果你想要或者只是习惯了BinaryReader,请使用build in stuff。

以上是关于将二进制文件读入结构的主要内容,如果未能解决你的问题,请参考以下文章

Windows C++ API:如何将整个二进制文件读入缓冲区?

将整个二进制文件读入 Python

将二进制文件缓冲区的块读入不同的类型

使用哪个 PHP 函数将二进制文件读入字符串?

VB6.0中如何实现逐行读入文本文件?

将结构转换为 QByteArray?