在 z/OS UNIX 文件中替换十六进制字符

Posted 2023-02-16

技术标签:

【中文标题】在 z/OS UNIX 文件中替换十六进制字符【英文标题】：Substitue hex characters in z/OS UNIX File 【发布时间】：2018-09-04 13:34:18 【问题描述】：

我需要使用从 z/OS JCL 步骤调用的 sed 非交互式流编辑器将 z/OS UNIX 文件中的单个 LF (x'0A') 字符转换为耦合 CRLF (x'0D'x'0A') 字符。

在这个网站上闲逛我发现了其他帖子，我已经尝试了这个 JCL 步骤：

//SEDSTEP  EXEC PGM=BPXBATCH,REGION=0M                              
//STDERR   DD SYSOUT=2                                              
//STDOUT   DD SYSOUT=2                                              
//STDPARM  DD *                                                     
SH sed 's/\x0A/\x0Dx0A/g' </u/sftp/zwnmsft/E/wnmcapdf/arxiu_unix.txt
>/u/sftp/zwnmsft/E/wnmcapdf/arxiu_unix_sed.txt                      
/*

不幸的是，它没有按预期工作。

任何帮助将不胜感激。

提前致谢

阅读您的 cmets 后，我添加了这些新信息以澄清问题：

1 - 我尝试转换的文件位于 z/OS UNIX 中，但包含无法识别的 ASCII 字符；不是 EBCDIC。

2- 此文件不包含任何本机 EBCDIC 换行符 X'15'。

3 - 执行 od -cx 命令后，我尝试转换的文件如下所示：

ZXDALMA@CIGC:/u/sftp/zwnmsft/E/wnmcapdf> od -cx arxiu_unix.txt              
0000000000   060 061 062 063 064 065 066 067 070 071 012 071 070 067 066 065
                3031    3233    3435    3637    3839    0A39    3837    3635
0000000020   064 063 062 061 060 012                                        
                3433    3231    300A                                        
0000000026

4 - 如果我执行这样的 awk 替代方案：

//AWK      EXEC PGM=BPXBATCH,REGION=0M                                  
//STDERR   DD SYSOUT=2                                                  
//STDOUT   DD SYSOUT=2                                                  
//STDPARM  DD *                                                         
SH awk 'ORS=""; gsub("\x0A","\x0D\x0A"); print'                       
/u/sftp/zwnmsft/E/wnmcapdf/arxiu_unix.txt >                             
/u/sftp/zwnmsft/E/wnmcapdf/arxiu_unix_bis.txt                           
/*

我得到了想要的结果：

ZXDALMA@CIGC:/u/sftp/zwnmsft/E/wnmcapdf> od -cx arxiu_unix_bis.txt          
0000000000   060 061 062 063 064 065 066 067 070 071  \r 012 071 070 067 066
                3031    3233    3435    3637    3839    0D0A    3938    3736
0000000020   065 064 063 062 061 060  \r 012                                
                3534    3332    3130    0D0A                                
0000000030

5 和最后一个 - 如果我执行 sed 命令，我得到如下：

ZXDALMA@CIGC:/u/sftp/zwnmsft/E/wnmcapdf> od -cx arxiu_unix_sed.txt          
0000000000   060 061 062 063 064 065 066 067 070 071 012 071 070 067 066 065
                3031    3233    3435    3637    3839    0A39    3837    3635
0000000020   064 063 062 061 060 012  \n                                    
                3433    3231    300A    1500                                
0000000027

我希望这些解释有助于了解我所面临的情况。

Hogstrom 发表的评论中新增的信息：

这是 ls -H 命令的输出：

ZXDALMA@CIGC:/u/sftp/zwnmsft/E/wnmcapdf> ls -H arxiu_unix.txt             
-rwxrwxrwx  bin    1 ZWNMSFT  G@PROJ        22 Sep  5 12:17 arxiu_unix.txt

关于环境变量，这里是我执行 env 命令时的输出：

ZXDALMA@CIGC:/u/sftp/zwnmsft/E/wnmcapdf> env                                    
_BPX_TERMPATH=OMVS                                                              
PATH=/bin:/usr/bin:/usr/lib:/usr/lpp/dfsms/bin:/usr/lpp/java/J7.1_64/bin:/u/zxda
lma::/usr/bin:/usr/lib:/usr/lpp/dfsms/bin                                       
SHELL=/bin/sh                                                                   
PS1=$LOGNAME@$SYS:$PWD>                                                         
COLUMNS=80                                                                      
PS2=>>                                                                          
SYS=CIGC                                                                        
_BPX_SPAWN_SCRIPT=YES                                                           
_=/bin/env                                                                      
_BPXK_SETIBMOPT_TRANSPORT=TCPIP                                                 
STEPLIB=none                                                                    
LOGNAME=ZXDALMA                                                                 
TERM=dumb                                                                       
_BPX_SHAREAS=YES                                                                
HOME=/u/zxdalma                                                                 
LINES=20                                                                        
TZ=MET-1DMET-2,M3.5.0/02:00:00,M10.5.0

一个更重要的细节是我最近意识到在我们的 z/OS UNIX 安装中，ESCape 字符是 [，而不是传统的。

我在终端的底部看到了这个细节，我看到了这个：

ZXDALMA@CIGC:/u/sftp/zwnmsft/E/wnmcapdf>                                        
 ===>                                                                           
                                                                          INPUT 
ESC=[   1=Help      2=SubCmd    3=HlpRetrn  4=Top       5=Bottom    6=TSO       
        7=BackScr   8=Scroll    9=NextSess 10=Refresh  11=FwdRetr 12=Retrieve

我也试过我的 sed 命令而不是 \;但不幸的是，我得到了相同的结果

【问题讨论】：

它以何种方式“不按预期工作”？我用一个包含两个 \0x0a 的文件进行了尝试，并运行了您的示例。这是将文件视为 hexdump 的结果。 infile=0a0a outfile=0a0a15 这是你的问题吗？在 sed 命令的替换部分中应该是 \x0D\x0A 吗？我认为问题在于 sed 的 s-command 只替换 within 一行 - 换行符既不是上一行的一部分，也不是下一行的一部分。至少这就是我从***.com/questions/1251999/…的答案中读到的内容@ 如果awk 有效，为什么不直接使用它呢？ 【参考方案1】：

我知道这不能回答使用sed 的原始问题 WRT。我理解你的困境。您正在尝试使用为 EBCDIC 设计的工具将 ASCII UNIX 文本文件转换为大型机上的 Windows 文本文件！用 C 编写自己的过滤器很简单。

#include <stdio.h>
#include <stdlib.h>

static void put_char(int c) 
    if (putchar(c) == EOF) 
        fputs("Error: putchar() failed with unexpected EOF", stderr);
        exit(EXIT_FAILURE);
    


int main()

    int c;
    while ((c = getchar()) != EOF) 
        if (c == '\x0A') put_char('\x0D');
        put_char(c);
    
    return 0;

测试

DOC:/u/doc/src: >printf "hello word\x0ahello again\x0a" | trlf | hexdump
00000000 88859393 9640A696 99840D0A 88859393 |hello word..hell|
00000010 96408187 8189950D 0A                |o again..       |

【讨论】：

谢谢大卫；我确信这应该可以，但在我们的安装中我不能使用它。

以上是关于在 z/OS UNIX 文件中替换十六进制字符的主要内容，如果未能解决你的问题，请参考以下文章

从 z/OS UNIX 系统服务 (USS) 文件系统下载二进制文件

用于替换某些字符的unix实用程序[重复]

如何在 Notepad++ 中替换十六进制级别的字符？

如何用十六进制的其他字符替换char

我如何在linux / unix / bash脚本中搜索文件中的十六进制内容？

使用 sed 替换十六进制字符串