Foro - Perl en Español

por **abejonejo** » 2017-12-05 11:06 @504

Hola, estoy comprando los blast de 450 genes de 7 organismos diferentes y quiero agrupar todos los resultados en un único archivo. Tengo dos ficheros para cada organismo, uno con todos los identificadores de los genes que quiero estudiar y otro con los resultados del blast, pero el problema es que si el blast no me da resultado no me pone una línea en blanco y luego agrupar todos los resultados es un poco tedioso si hago cortar y pegar.

Si me podéis dejar un script que me ayude estaría genial. Lo que tengo:

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

Fichero 1       Fichero 2

indet1          Resultado1

ident2          Resultado4

ident3

ident4

Lo que quiero:

ident1       Resultado1

ident2      

ident3

ident4       Resultado4Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

¡Gracias!

Ese es un problema muy común. En estos foros hay docenas de hilos preguntando lo mismo.

La clave es saber cuándo pintar qué cosa a cada lado. Del ejemplo que muestras, ¿cómo sabemos que Resultado4 tiene que ir al lado de ident4? ¿Por que termina en 4?

Una solución es la de meter todos los resultados (archivo 2) en un hash, por ejemplo, y empezar a recorrer las líneas del primer archivo. Para cada línea, imprimimos la primera columna, y luego miramos a ver si existe un resultado en el hash que almacena los resultados, correspondiente a la primera columna. Si es así, imprimimos la segunda columna. Tanto en un caso como en el otro, terminamos el bucle con un carácter de fin de línea.

Algo así (no probado):

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

my %resultados;
 
open my $FILE2, '<', "Fichero 2";
 
while (my $resultado = <$FILE2>) {
    chomp $resultado;
    my ($id) = $resultado =~ /(\d+)$/;          # sacamos el último dígito
    $resultados{$id} = $resultado;              # lo guardamos
}
 
close $FILE2;
 
open my $FILE1, '<', "Fichero 1";
open my $SALIDA,'>', "Salida";
 
while (my $ident = <$FILE1>) {
    chomp $ident;
    my ($id) = $ident =~ /(\d+)$/;              # sacamos el último dígito
 
    print $SALIDA $ident;                       # primera columna
 
    if ( exists $resultados{ $id } ) {          # si existe un resultado correspondiente a ese $id
 
        print $SALIDA "\t   $resultados{$id}";  # segunda columna
    }
 
    print $SALIDA "\n";                         # fin de línea
}
 
close $SALIDA;
close $FILE1;
Coloreado en 0.003 segundos,  usando GeSHi 1.0.8.4

por **abejonejo** » 2017-12-10 16:29 @728

¡Buenas y gracias! Siento la tardanza en responder.

No me ha funcionado, explicaré mejor mi problema.

En el fichero "ID" tengo:

gen2
gen3
gen1
gen4

En el fichero "blast" tengo:

gen1 189 57% 65% 9E-145
gen2 185 59% 69% 9E-45
gen4 181 51% 60% 9E-15

Quiero:

gen2 185 59% 69% 9E-45
gen3 - - - - (los guiones es línea en blanco)
gen1 189 57% 65% 9E-145
gen4 181 51% 60% 9E-15

Básicamente lo que necesito es un grep que me devuelva los resultados en el orden que yo le indico con los identificadores y que si mi identificador no tiene resultado me de una línea en blanco.

por **explorer** » 2017-12-10 17:48 @783

Bueno, solo he cambiado un poco el código, y ya funciona.

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

#!/usr/bin/env perl
#
my %resultados;
 
open my $FILE2, '<', "blast";
 
while (my $resultado = <$FILE2>) {
    chomp $resultado;
    $resultado =~ s/^(\S+)\s+//;                # sacamos el id de la primera columna, y lo quitamos
    my $id = $1;                                # el id lo capturamos antes con los paréntesis
    $resultados{$id} = $resultado;              # guardamos el resto del resultado
}
 
close $FILE2;
 
open my $FILE1, '<', "id";
open my $SALIDA,'>', "Salida";
 
while (my $ident = <$FILE1>) {
    chomp $ident;
 
    print $SALIDA $ident;                       # primera columna
 
    if ( exists $resultados{ $ident } ) {       # si existe un resultado correspondiente a ese $id
 
        print $SALIDA " $resultados{$ident}";   # segunda columna
    }
 
    print $SALIDA "\n";                         # fin de línea
}
 
close $SALIDA;
close $FILE1;
 
Coloreado en 0.002 segundos,  usando GeSHi 1.0.8.4

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

gen2 185 59% 69% 9E-45

gen3

gen1 189 57% 65% 9E-145

gen4 181 51% 60% 9E-15Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

Foro - Perl en Español

Agrupar resultados de dos archivos

Agrupar resultados de dos archivos

Publicidad

Re: Agrupar resultados de dos archivos

Re: Agrupar resultados de dos archivos

Re: Agrupar resultados de dos archivos

¿Quién está conectado?