在 Perl 中修改然后切片未知大小的二维数组

Posted

技术标签:

【中文标题】在 Perl 中修改然后切片未知大小的二维数组【英文标题】:Modifying then Slicing 2D Array of Unknown Size in Perl 【发布时间】:2013-04-12 05:31:56 【问题描述】:

我知道这里已经涵盖了类似的主题,但是我遇到了一个问题,我认为这是由于我误解了如何在 foreach 循环的上下文中插入数组切片。我不知道哪里出了问题,所以我正在寻找一些见解。

我有一个行数可变的二维数组。例如目的:

@2DArray = (['str1', 1, 2, 'E', val1, val2, val3]
            ['str2', 3, 4, 'E', val4, val5, val6]
            ['str4', 5, 6, 'F', val7, val8, val9])   

我想构建一个带有附加列的新数组,仅当原始数组的某些行在第 3 列中包含字符串“E”时才包含这些行。此外,对于我确实希望合并到我的行中的行新数组,我只想要列的一个子集,并且我希望该子集以不同的顺序排列。最终目标是生成下游脚本所需的正确格式的输出。

这是我的尝试:

my $projName = 'test';

my $i = 1;
my @Newarray
my @Newarray_element;
     foreach (@2DArray) 
         if  ($$_[3] eq 'E') 
             $$_[3] = $i; 
             $$_[5] = '+'; 
             @Newarray_element = ("$projName$i", @$_[0,1,2,5,3], 'STR', 11, 11);
             $i++;
             push (@Newarray, \@Newarray_element);
         

         next;
     

print (join("\t", @$_), "\n") for @Newarray;

但是,如果我这样做,我得到的是:

#(original) col nums:      0       1    2    5    3

                  test2    str2    3    4    +    2    STR    11    11
                  test2    str2    3    4    +    2    STR    11    11

也就是说,我的新数组将在原始数组中的每一行都有一行,在第 3 列中带有一个“E”,但每一行都填充了要由循环处理的最后一行的值。

我认为问题与在 foreach 循环中切片二维数组有关的原因是,我知道我是否只是循环遍历二维数组,在第 3 列中找到所有带有“E”的行,修改一些值在这些行的其他列中,然后将其返回到一个新数组中,这一切都很好。也就是说,如果我改为这样做:

my @Newarray;
my $i = 1;
foreach (@2Darray) 
    if  ($$_[3] eq "E") 
        $$_[3] = $i;
        $$_[5] = '+';
        $i++;
        push (@Newarray, \@$_);
    
    next;   

print (join("\t", @$_), "\n") for @Newarray;

我得到了我期望的输出:

                  *            &
str1    1    2    1    val1    +    val3
str2    3    4    2    val4    +    val6

其中 * 和 & 标记的列是修改后的第 3 和 5 列。让猛攻开始:我的新手自己哪里出错了?

【问题讨论】:

【参考方案1】:

变量@Newarray_element 指向整个程序中的相同内存空间,因此您在一次迭代中所做的更改会传播到您在分配中使用该变量的先前迭代。

两个可能的修复:

一个。更改变量的范围,使其在每次迭代中使用不同的内存。 改变

my @Newarray_element;
foreach (@2DArray) 
    ...

foreach (@2DArray) 
    my @Newarray_element;
    ...

甚至

foreach (@2DArray) 
    ...
    my @Newarray_element = ("$projName$i", @$_[0,1,2,5,3], 'STR', 11, 11);

两个:重用@Newarray_element,但将其数据的副本分配给@Newarray的每一行。改变

push (@Newarray, \@Newarray_element);

push (@Newarray, [ @Newarray_element ]);

后一个调用创建一个新的匿名数组引用并将其附加到@Newarray

【讨论】:

谢谢。一个非常愚蠢的错误,证明我还没有掌握 Perl 引用。您能否在第二个示例中向我解释 [@New_element] 到底在做什么?如果我没看错,那是否会创建一个匿名数组,其中包含 @Newarray_element 的内容,在循环关闭时会丢失? @MCor: 是的,[ @Newarray_element ] 制作了 @Newarray_element 内容的匿名副本(并返回对该副本的引用),这样当您在下一次迭代时覆盖 @Newarray_element循环,副本仍将保留原始内容。 (但是,通过在循环中移动 my 声明,在每次迭代中创建一个新的本地数组会更简洁。) [ ... ] 生成一个新的匿名数组引用,该引用将被推送到@Newarray。该引用指向的数组的内容将是@Newarray_element 中内容的副本。由于每个都是副本,因此每次循环更改@Newarray_element 都没有关系。但是@mob 的第一个建议是更清晰、更惯用的方法。将变量范围限定在循环内部每次都会创建一个 new \@Newarray_element

以上是关于在 Perl 中修改然后切片未知大小的二维数组的主要内容,如果未能解决你的问题,请参考以下文章

perl二维数组

从 .txt 文件中读取未知大小的整数二维数组的最有效方法是啥?

如何在c / c ++中已知列的时间一次动态地分配一行二维数组

在 D 中切片二维数组

Numpy - 从数组中切片二维行或列向量

怎么用perl 输出一个二维数组?