VB.net 读取 Cobol 文件字段(纯二进制、EBCDIC、打包)
Posted
技术标签:
【中文标题】VB.net 读取 Cobol 文件字段(纯二进制、EBCDIC、打包)【英文标题】:VB.net Read Cobol File Fields (Pure Binary, EBCDIC, Packed) 【发布时间】:2021-06-17 13:30:08 【问题描述】:我需要将 Cobol 文件读入 VB.net。以下是文档中对数据类型的描述:
All Magnetic tape files are recorded in 9-track, 8OOBPI mode with odd parity. They are created IBM equipment disk operating system. IBM System 360 Standard.
Binary - Data is coded in pure binary code.
BCD - Data is coded in binary coded decimal format. (Primarily
for files created by the IBM 1401 System).
EBCDIC - Data is coded in extended binary coded decimal interchange code. :(An IBM developed code.)
Packed - Data is coded in packed decimal format.
File Format:
1-2 Record Count [Numeric] (Binary)
3-4 Filler (Binary)
5-5 Record Type [B or R] (EBCDIC)
6-10 Sales Location Numeric [9 digit number] (Packed)
11-13 Sales Identifier (3 character Alpha) (EBCDIC]
etc
所以,我知道我应该将整个文件读入一个字节数组,这大约是我所知道的限制...... A) 我看到另一篇关于 EBCDIC 对话的帖子使用
System.Text.Encoding.GetEncoding(37)
但它适用于整个文件。如果我通过它运行整个文件,我会看到可理解的文本,但其他字段当然是垃圾。我不知道正确解码单个字段的语言。 B)我不知道如何处理纯二进制格式。 C) 我不知道如何阅读 Packed,尤其是作为单个字段
我尝试了 PURE BINARY 的各种解码选项,但我得到的第一个字段的数字与文档中规定的行长度不一致。
【问题讨论】:
您可能会发现 ***.com/questions/2858202/… 很有用,即使它是 C# 而不是 VB。 是的,这有帮助。纯二进制文件正在杀死我。 PACKED 是 BCD,但每个字节有两个数字(即每个数字 4 位)。我不记得 BCD 是大端还是小端。 你知道如何根据system.text.encoding选项解码BCD吗? 不是编码;你必须手动处理它。 【参考方案1】:压缩十进制格式:
对于 s9(5)V9(4) comp-3,123.45 以字节格式表示为
00 12 34 50 0c
每个数字由 4 位表示,末尾有一个 4 位符号 (c),3 之后是假定的小数。
大多数语言都提供了将字节/字节转换为字符串的例程,即 byte x'34' -->> String '34'。所以你可以:
-
将字节转换为字符串表示
添加小数点
从末尾剥离符号字符并将适当的符号添加到前面
还有其他方法:
创建一个翻译数组并进行数组查找。 (例如,请参阅https://github.com/bmTas/JRecord/blob/master/Source/JRecord_Project/JRecord_Common/src/main/java/net/sf/JRecord/Types/smallBin/TypePackedDecimal9.java) 一次处理 4 位其他字段
第一个字段(二进制)可能是一个大端二进制整数或另一个压缩十进制。 .net 中可能内置了一个实用程序来执行此操作。 一次将字符字段从 ebcdic 转换为 ascii 字段在 VBA 中您不需要读取整个文件,您可以逐条读取它。我想你可以在 vb.net 中做同样的事情
实用工具
这些工具可能对测试有用。
RecordEditor 应该能够显示该文件。 布局向导应该能够确定文件的格式。或者使用下面的 Cobol 字帖
Java 程序 CobolToCsv 应该能够将文件转换为 Csv
01 tape-record.
05 record-count pic s9(3) comp.
05 filler pic x(2).
05 record-type pic x.
05 Sales-Location pic s9(9) comp-3.
05 Sales-Identifier pic x(3).
【讨论】:
以上是关于VB.net 读取 Cobol 文件字段(纯二进制、EBCDIC、打包)的主要内容,如果未能解决你的问题,请参考以下文章
用VB.NET和VC.NET编译出来的文件是IL格式还是纯PE(EXE)文件格式?
从 Visual Studio 2010 (VB.NET) 读取访问查询
vb.net 2.0 如何用Configuration.ConfigurationSettings.AppSettings读取配置文件中的内容?