首页 > 解决方案 > 如何复制和/或重新分配多维数组中的数组元素?

问题描述

代码在循环中的某个地方变得混乱!请帮我解决它。

细节

使用参考元素复制和/或重新分配多维数组中的大部分数组元素。

注意:除了来自 file1 的数组索引外,其余所有索引都将替换为参考线。参考线通常出现在阵列的第一行。
在修改后的数组中,不需要参考线。

文件-1:

ID1    2    E1,E4
ID2    5    E6,E7,E9
ID3    1    E3

文件 2:

ID1.txt

Ref K L M N O P A B C D
E1 S H G U S K R E K K
E2 S L G N O P A B C D
E3 S L G N O P A B C D
E4 U L G G O P A B C D
E5 U L M G O P A J C D
E6 U L M G O P A J C D
E7 U L M G O P A J C D
E8 U L M G O P A J C D
E9 S L M N O P A J C D
E10 S L M N O P A J C D
.
.
.

文件 3:预期输出

new_ID1.txt

E1    K L G N O P A B C D
E2    K L M N O P A B C D
E3    K L M N O P A B C D
E4    K L G N O P A B C D
E5    K L M N O P A B C D
E6    K L M N O P A B C D
E7    K L M N O P A B C D
E8    K L M N O P A B C D
E9    K L M N O P A B C D
E10    K L M N O P A B C D
.
.
.

在预期的输出 (new_ID1.txt) 中,“E1”和“E4”的数组的第二个索引是从原始数组中维护的。其他所有内容都替换为“E2,E3,E5...”中的参考线。

代码

#!/usr/bin/perl 

use strict;
use warnings;

my %HoHoA = ();

open(IN,"ids.txt");
my @ids = <IN>; chomp @ids; close IN;

open(IN2,"indices_and_values.txt");

while(my $l = <IN2>)
{
    chomp $l;
my @tmp = split "\t", $l;
my $lid = $tmp[0];
my $pos = $tmp[1];
my @gps = @tmp[2..$#tmp];

    foreach my $g (@gps)
    {
        push @{$HoHoA{$lid}{$g}}, $pos;
    }
}
close IN2;


foreach my $outer (sort keys %HoHoA)
{
open(IN3,"$outer.txt");
my @rS = <IN3>; chomp @rS; close IN3;

    my @orgArr = (); my @refArr = (); my @newArr = ();
    foreach my $unk (@rS) 
    { 
        @orgArr = split "\t", $unk;
        if($unk =~ /^Ref/)
        { 
            @refArr = split "\t", $unk;
            next;
        }
    foreach my $inner (sort keys %{$HoHoA{$outer}})
    {
        if($inner =~ /^$orgArr[0]/)
        {
            foreach my $ele (sort {$a <=> $b} @{$HoHoA{$outer}{$inner}})
            {
                $refArr[$ele] = $orgArr[$ele];
            }
        }
        #else
        #{
        #}
    }
    print ">$orgArr[0]\t";
    print join("\t",@refArr[1..$#refArr]);
    print "\n";
}
    @rS = ();
    print "\n";

}

标签: perlmultidimensional-arrayreplicate

解决方案


显示的代码是善意的,但有点太复杂了;您可能在嵌套数据结构的操作中迷失了方向。这是另一种更简单的方法。

将“参考”文件 ( File-1) 中的信息解析为哈希(E1 => [2, ...], ..)。我将数据的索引保存在 arrayref 中,以允许一行有多个索引。然后逐行进行,将这些索引处的数据替换为具有键的行,并随时打印输出。

use warnings;
use strict;
use feature 'say';

my ($ref_file, $data_file) = @ARGV;
die "Usage: $0 ref-file data-file\n" if not $ref_file or not $data_file;

open my $fh, '<', $ref_file or die "Can't open $ref_file: $!";
my %rows;
while (<$fh>) {
    my (undef, $idx, $row_id) = split;
    for (split /,/, $row_id) {
        push @{$rows{$_}}, $idx;        # elem => [ indices ]
    }
}

my $outfile = 'new_' . $data_file;
open    $fh,     '<', $data_file  or die "Can't open $data_file: $!";
open my $fh_out, '>', $outfile    or die "Can't open $outfile: $!";

my @ref = split ' ', <$fh>;
shift @ref;                  # toss the first field

while (<$fh>) {
    my ($row_id, @data) = split;

    if (exists $rows{$row_id}) {              # this row needs attention
        my @new_row = @ref;
        foreach my $idx (@{$rows{$row_id}}) { # keep data at these indices
            $new_row[$idx] = $data[$idx];
        }
        say $fh_out join "\t", $row_id, @new_row;
    }
    else {                                    # use whole reference line
        say $fh_out join "\t", $row_id, @ref;
    }
}

新文件(为了便于阅读,用两个空格而不是实际的制表符显示)

E1 KLGNOPABCD
E2 KLMNOPABCD
E3 KLMNOPABCD
E4 KLGNOPABCD
E5 KLMNOPABCD
E6 KLMNOPABCD
E7 KLMNOPABCD
E8 KLMNOPABCD
E9 KLMNOPABCD
E10 KLMNOPABCD

请注意,给定的输入文件恰好具有与参考线相同的条目,用于在许多感兴趣的索引处进行替换——因此我们在上述输出中看不到这些“变化”。(我通过更改输入文件进行测试以便能够看到。)


推荐阅读