Foro - Perl en Español

por **cheferas** » 2014-07-17 14:01 @626

Buenas tardes, mi pregunta es la siguiente:

Tengo el archivo 1 con la siguiente estructura

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

A7YWC4  F6QV99

F1N0G5  G3N1Z8

E1BN63  F1MNS2

E1BAX5  F1N253

E1BG32  G5E586

E1B7W8  E1BG45Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

Y un segundo archivo con una estructura similar

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

A7YWC4  F6QV99

F1N0G5  G3N1Z8

E1BN63  F1MNS2

E1BAX5  F1N253

E1BG32  G5E586

E1B7W8  E1BG45

F1MNS0  F1MY10

E1BE75  E1BNL4Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

Quiero saber cuántas veces se aparece la línea 1 del archivo 1 en el archivo 2 (contar) para esto ya realicé el siguiente script.

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

my $arch=$ARGV[0];
open (ARCH,$arch);
my @array=<ARCH>;
close ARCH;
my $arch2=$ARGV[1];
open (ARCH,$arch2);
my @array2=<ARCH>;
close ARCH;
 
foreach $i (@array){
        chomp ($i);
        $cont=0;
        foreach $t (@array2){
                chomp ($t);
                if ($i eq $t){
                        $cont++;
                }
        }
        print "$i\t$cont\n";
}
Coloreado en 0.001 segundos,  usando GeSHi 1.0.8.4

Sin embargo, debido a que el archivo 1 tiene 2.5 millones de líneas y el archivo 2 tiene 29 millones el tiempo que tarda en ejecutarse el programa es mucho.

La pregunta es si existe alguna forma de modificar el código para reducir el tiempo, o alguna otra forma de contar.

Por su atención, gracias.

Saludos

#!/usr/bin/perl
use strict;
 
## Lectura del archivo 1
my $archivo1 = $ARGV[0];
 
my %archivo1;
open (ARCH1, $archivo1);
while (my $linea = <ARCH1> ) {
    chomp $linea;
    
    $archivo1{$linea} = 0;              # contador
}
close ARCH1;
 
my $archivo2 = $ARGV[1];
 
## Lectura del archivo 2
open (ARCH2, $archivo2);
 
while (my $linea = <ARCH2>) {
    chomp $linea;
    
    if (exists $archivo1{$linea}) {     # si la $linea del archivo 2 está en el archivo 1,
        $archivo1{$linea}++;            # contamos una aparición más
    }
}
close ARCH2;
 
## Salida
for my $linea (keys %archivo1) {
    print "$linea\t$archivo1{$linea}\n";
}
Coloreado en 0.001 segundos,  usando GeSHi 1.0.8.4

Dinos cuánto tarda ahora en ejecutarse.

por **cheferas** » 2014-07-18 10:03 @460

Hola, buen día.

Muchísimas gracias, me fue de gran utilidad su respuesta.

El script tardó aproximadamente 3 horas, pero de haberlo ejecutado con array hubiera tardado meses :oops:

Muchas gracias de nuevo por su ayuda.
Saludos.

por **explorer** » 2014-07-18 16:52 @745

¿¿¿ Tres horas ???

Me parece demasiado...

Bueno, depende de la potencia del ordenador, pero aún así me parece demasiado. ¿No estarás en Windows, verdad?

He cambiado el código, porque había un error menor.

Foro - Perl en Español

Comparar dos archivos

Comparar dos archivos

Publicidad

Re: Comparar dos archivos

Re: Comparar dos archivos

Re: Comparar dos archivos

¿Quién está conectado?