VB.net 读取 Cobol 文件字段(纯二进制、EBCDIC、打包)

Posted

技术标签:

【中文标题】VB.net 读取 Cobol 文件字段(纯二进制、EBCDIC、打包)【英文标题】:VB.net Read Cobol File Fields (Pure Binary, EBCDIC, Packed) 【发布时间】:2021-06-17 13:30:08 【问题描述】:

我需要将 Cobol 文件读入 VB.net。以下是文档中对数据类型的描述:

All Magnetic tape files are recorded in 9-track, 8OOBPI mode with odd parity. They are created IBM equipment disk operating system.  IBM System 360 Standard. 

Binary - Data is coded in pure binary code.

BCD - Data is coded in binary coded decimal format. (Primarily
for files created by the IBM 1401 System).

EBCDIC - Data is coded in extended binary coded decimal interchange code. :(An IBM developed code.)

Packed - Data is coded in packed decimal format. 

File Format:
1-2 Record Count [Numeric] (Binary)
3-4 Filler (Binary)
5-5 Record Type [B or R] (EBCDIC)
6-10 Sales Location Numeric [9 digit number] (Packed)
11-13 Sales Identifier (3 character Alpha) (EBCDIC]
etc

所以,我知道我应该将整个文件读入一个字节数组,这大约是我所知道的限制...... A) 我看到另一篇关于 EBCDIC 对话的帖子使用

System.Text.Encoding.GetEncoding(37) 

但它适用于整个文件。如果我通过它运行整个文件,我会看到可理解的文本,但其他字段当然是垃圾。我不知道正确解码单个字段的语言。 B)我不知道如何处理纯二进制格式。 C) 我不知道如何阅读 Packed,尤其是作为单个字段

我尝试了 PURE BINARY 的各种解码选项,但我得到的第一个字段的数字与文档中规定的行长度不一致。

【问题讨论】:

您可能会发现 ***.com/questions/2858202/… 很有用,即使它是 C# 而不是 VB。 是的,这有帮助。纯二进制文件正在杀死我。 PACKED 是 BCD,但每个字节有两个数字(即每个数字 4 位)。我不记得 BCD 是大端还是小端。 你知道如何根据system.text.encoding选项解码BCD吗? 不是编码;你必须手动处理它。 【参考方案1】:

压缩十进制格式:

对于 s9(5)V9(4) comp-3,123.45 以字节格式表示为

      00 12 34 50 0c

每个数字由 4 位表示,末尾有一个 4 位符号 (c),3 之后是假定的小数。

大多数语言都提供了将字节/字节转换为字符串的例程,即 byte x'34' -->> String '34'。所以你可以:

    将字节转换为字符串表示 添加小数点 从末尾剥离符号字符并将适当的符号添加到前面

还有其他方法:

创建一个翻译数组并进行数组查找。 (例如,请参阅https://github.com/bmTas/JRecord/blob/master/Source/JRecord_Project/JRecord_Common/src/main/java/net/sf/JRecord/Types/smallBin/TypePackedDecimal9.java) 一次处理 4 位

其他字段

第一个字段(二进制)可能是一个大端二进制整数或另一个压缩十进制。 .net 中可能内置了一个实用程序来执行此操作。 一次将字符字段从 ebcdic 转换为 ascii 字段

在 VBA 中您不需要读取整个文件,您可以逐条读取它。我想你可以在 vb.net 中做同样的事情


实用工具

这些工具可能对测试有用。

RecordEditor 应该能够显示该文件。 布局向导应该能够确定文件的格式。或者使用下面的 Cobol 字帖

Java 程序 CobolToCsv 应该能够将文件转换为 Csv

      01  tape-record.
          05 record-count          pic s9(3) comp.
          05 filler                pic x(2).
          05 record-type           pic x.
          05 Sales-Location        pic s9(9) comp-3.
          05 Sales-Identifier      pic x(3).

【讨论】:

以上是关于VB.net 读取 Cobol 文件字段(纯二进制、EBCDIC、打包)的主要内容,如果未能解决你的问题,请参考以下文章

用VB.NET和VC.NET编译出来的文件是IL格式还是纯PE(EXE)文件格式?

关于VB.NET的CSV文件的读取

从 Visual Studio 2010 (VB.NET) 读取访问查询

vb.net怎么从DataSet中读取一行的数据

使用 VB.NET 读取 iOS 驱动器

vb.net 2.0 如何用Configuration.ConfigurationSettings.AppSettings读取配置文件中的内容?