将二进制文件读入结构
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了将二进制文件读入结构相关的知识,希望对你有一定的参考价值。
我正在尝试使用C#读取二进制数据。我有关于我想要阅读的文件中数据布局的所有信息。我能够读取数据“chunk by chunk”,即获取前40个字节的数据将其转换为字符串,得到接下来的40个字节。
由于至少有三种略有不同的数据版本,我想将数据直接读入结构中。它只是通过“逐行”阅读它而感觉更加正确。
我尝试了以下方法但无济于事:
StructType aStruct;
int count = Marshal.SizeOf(typeof(StructType));
byte[] readBuffer = new byte[count];
BinaryReader reader = new BinaryReader(stream);
readBuffer = reader.ReadBytes(count);
GCHandle handle = GCHandle.Alloc(readBuffer, GCHandleType.Pinned);
aStruct = (StructType) Marshal.PtrToStructure(handle.AddrOfPinnedObject(), typeof(StructType));
handle.Free();
该流是一个打开的FileStream,我已经开始从中读取。使用AccessViolationExceptio
时,我得到了Marshal.PtrToStructure
n。
由于我对文件末尾的数据不感兴趣,因此该流包含的信息比我尝试阅读的要多。
结构定义如下:
[StructLayout(LayoutKind.Explicit)]
struct StructType
{
[FieldOffset(0)]
public string FileDate;
[FieldOffset(8)]
public string FileTime;
[FieldOffset(16)]
public int Id1;
[FieldOffset(20)]
public string Id2;
}
示例代码从原始代码更改为使此问题更短。
如何将二进制数据从文件读入结构?
问题是结构中的字符串。我发现像byte / short / int这样的编组类型不是问题;但是当你需要编组成一个复杂的类型(如字符串)时,你需要你的结构显式地模仿非托管类型。您可以使用MarshalAs attrib执行此操作。
对于您的示例,以下应该工作:
[StructLayout(LayoutKind.Explicit)]
struct StructType
{
[FieldOffset(0)]
[MarshalAs(UnmanagedType.ByValTStr, SizeConst = 8)]
public string FileDate;
[FieldOffset(8)]
[MarshalAs(UnmanagedType.ByValTStr, SizeConst = 8)]
public string FileTime;
[FieldOffset(16)]
public int Id1;
[FieldOffset(20)]
[MarshalAs(UnmanagedType.ByValTStr, SizeConst = 66)] //Or however long Id2 is.
public string Id2;
}
这是我正在使用的。
这成功地为我阅读可移植可执行格式。
这是一个通用功能,所以T
是你的struct
类型。
public static T ByteToType<T>(BinaryReader reader)
{
byte[] bytes = reader.ReadBytes(Marshal.SizeOf(typeof(T)));
GCHandle handle = GCHandle.Alloc(bytes, GCHandleType.Pinned);
T theStructure = (T)Marshal.PtrToStructure(handle.AddrOfPinnedObject(), typeof(T));
handle.Free();
return theStructure;
}
正如罗尼所说,我会使用BinaryReader并分别读取每个字段。我找不到带有此信息的文章的链接,但据观察,如果struct包含少于30-40个字段,使用BinaryReader读取每个单独的字段可能比Marshal.PtrToStruct更快。当我找到它时,我会发布文章的链接。
该文章的链接位于:http://www.codeproject.com/Articles/10750/Fast-Binary-File-Reading-with-C
当编组结构数组时,PtrToStruct可以更快地获得上风,因为您可以将字段计数视为字段*数组长度。
我没有运气使用BinaryFormatter,我想我必须有一个完全匹配文件内容的完整结构。我意识到最后我对文件内容并不感兴趣,所以我选择了将部分流读取到bytebuffer然后使用它转换它的解决方案。
Encoding.ASCII.GetString()
对于字符串和
BitConverter.ToInt32()
对于整数。
我需要能够稍后解析更多的文件,但是对于这个版本,我只需要几行代码就可以了。
我没有看到您的代码有任何问题。
只是出于我的想法,如果你试图手动怎么办?它有用吗?
BinaryReader reader = new BinaryReader(stream);
StructType o = new StructType();
o.FileDate = Encoding.ASCII.GetString(reader.ReadBytes(8));
o.FileTime = Encoding.ASCII.GetString(reader.ReadBytes(8));
...
...
...
也试试
StructType o = new StructType();
byte[] buffer = new byte[Marshal.SizeOf(typeof(StructType))];
GCHandle handle = GCHandle.Alloc(buffer, GCHandleType.Pinned);
Marshal.StructureToPtr(o, handle.AddrOfPinnedObject(), false);
handle.Free();
然后在BinaryReader中使用buffer []而不是从FileStream读取数据,看看你是否仍然得到AccessViolation异常。
我没有运气使用BinaryFormatter,我想我必须有一个完全匹配文件内容的完整结构。
这是有道理的,BinaryFormatter有自己的数据格式,与你的完全不兼容。
试试这个:
using (FileStream stream = new FileStream(fileName, FileMode.Open))
{
BinaryFormatter formatter = new BinaryFormatter();
StructType aStruct = (StructType)formatter.Deserialize(filestream);
}
直接阅读结构是邪恶的 - 许多C程序因为不同的字节顺序,字段的不同编译器实现,打包,字大小而落后......
您最好逐字节串行化和反序列化。如果你想要或者只是习惯了BinaryReader,请使用build in stuff。
以上是关于将二进制文件读入结构的主要内容,如果未能解决你的问题,请参考以下文章