Foro - Perl en Español

por **manuel3180** » 2012-05-10 15:10 @674

¡¡¡Muy buenas tardes a todos, espero puedan ayudarme!!!

Muchas veces, después de un proceso bioinformático obtenemos una gran cantidad de resultados. Estos resultados los llevamos a una hoja Excel para un mejor manejo. Además, no todos los resultados nos interesan, entonces necesitamos realizar una extracción de forma manual; pero esto es una pérdida de tiempo, cuando hablamos de una gran cantidad de datos (más o menos 1000).

Por ejemplo, supongamos que es una hoja Excel, cada columna significa un valor para cada individuo.

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

      A             B            C      D

    Nombre      Apellido       Numero Casilla

 Manuel      Ramirez         123     4

 Hugo        Valdivia        345     7

 David       Requena         567     8

 Michael     Torres          666     9

 Hugo        Valdivia        789     5

 Hugo        Valdivia        987     3

 Roberto     Lozano          434     1

 Manuel      Ramirez         654     2Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

Como verán, algunas veces se repite la primera columna pero los valores restantes son diferentes. Entonces, yendo al grano del asunto... quisiera poder utilizar un script en Perl que me permita extraer las filas que se repitan en la primera columna manteniendo los resultados de las demás columnas, de la siguiente forma:

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

Hugo    Valdivia        345     7

Hugo    Valdivia        789     5

Hugo    Valdivia        987     3

Manuel  Ramirez         123     4

Manuel  Ramirez         654     2Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

¿Es posible? Se los agradecería ya que me ahorraría un montón de tiempo.

P.D. Es para una gran cantidad de datos, es decir puedo tener valores repetidos como los que no... ¿Tendría que eliminar los que no se repiten? ¡¡HELP!!

Un momento, un momento...

¿Que se genera una información y la pasáis a Excel, y ahora queréis sacar información de la hoja Excel?

¿No sería más cómodo sacar a Excel de la ecuación, y extraer la información que nos interesa directamente desde la información generada?

En cuanto a la pregunta, la respuesta es claramente sí.

Supongamos que en vez de Excel tenemos un archivo de texto así:

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

Manuel      Ramirez         123     4

Hugo        Valdivia        345     7

David       Requena         567     8

Michael     Torres          666     9

Hugo        Valdivia        789     5

Hugo        Valdivia        987     3

Roberto     Lozano          434     1

Manuel      Ramirez         654     2Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

#!/usr/bin/perl
my %datos;
 
open my $FH, '<', 'kk.txt';
 
while (my $linea = <$FH>) {
    my($nombre) = split " ", $linea;            # sacamos el $nombre
    push @{ $datos{$nombre} }, $linea;          # guardamos la $linea,
                                                # acumulando según el $nombre
}
 
close $FH;
 
for my $nombre (sort keys %datos) {                   # para cada $nombre encontrado
    my @nombres_repetidos = @{ $datos{$nombre} };     # cuántas veces se repite
    if (@nombres_repetidos > 1) {                     # si es más de 1
        for my $dato_repetido (@nombres_repetidos) {  # para cada una de sus repeticiones
            print $dato_repetido;                     # sacamos la línea en pantalla
        }
    }
}
 
Coloreado en 0.001 segundos,  usando GeSHi 1.0.8.4

sale

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

Hugo        Valdivia        345     7

Hugo        Valdivia        789     5

Hugo        Valdivia        987     3

Manuel      Ramirez         123     4

Manuel      Ramirez         654     2Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

por **manuel3180** » 2012-05-11 11:50 @534

Muchas gracias, explorer, ¡¡¡es cierto lo que dices!!! Creo que la desesperación nubló mis sentidos... Nuevamente muchísimas gracias y RECOMIENDO A TODOS ESTOS FOROS DE Perl EN ESPAÑOL: LAS RESPUESTAS SON CLARAS Y RÁPIDAS.

Foro - Perl en Español

Extraer datos de una tabla Excel

Extraer datos de una tabla Excel

Publicidad

Re: Extraer datos de una tabla Excel

Re: Extraer datos de una tabla Excel

¿Quién está conectado?