Foro - Perl en Español

por **mcorraliza** » 2011-12-15 13:06 @588

¡Hola!
Tengo que crear un programa capaz de parsear un fichero EMBL. «El programa construido deberá ser capaz de leer ficheros del tipo EMBL. En la parte final, entre las líneas que contienen al principio "SQ" y "//" tiene la secuencia genómica correspondiente, con la que se deberá trabajar.»

Mi pseudocódigo es algo así como

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

foreach my$line(@array) {
 do {next;}
   until ($line eq 'SQ.');}
Coloreado en 0.002 segundos,  usando GeSHi 1.0.8.4

para saltar las primeras lineas de código y luego quiero almacenarlas todas en una cadena llamada $dna, ¿¿cómo lo hago???

Mi idea es hacer un

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

 do {$dna .= $line}
                        until ($line eq '//')
Coloreado en 0.001 segundos,  usando GeSHi 1.0.8.4

pero me da error =(

¡¡Muchas gracias por la ayuda, un saludo!!

Bienvenido a los foros de Perl en español, mcorraliza.

No nos dices qué error te da.

Una cosa que veo mal es mezclar un bucle foreach() con bucles do{}. Es mejor usar solo uno, y poner condiciones para saber su estás o no dentro de la secuencia, y si estás dentro, lo vas agregando como indicas.

De todas maneras, de forma profesional, no se hace esto, sino que se usa el módulo Bio::SeqIO::embl, como se indica en el Wiki oficial.

De todas maneras, esta es mi versión:

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

#!/usr/bin/perl
use Modern::Perl;       # Somos modernos
use File::Slurp;        # Modo succionador
 
my $fichero_embl = read_file('ejemplo.embl');           # leemos el fichero EMBL
 
my($secuencia) = $fichero_embl =~ m{^SQ.+?$(.+)^//}sm;  # extraemos la secuencia
 
$secuencia =~ tr/actg//dc;                              # le quitamos cualquier cosa que no sea ATCG
 
say "[$secuencia]";                                     # y lo pintamos
 
__END__
Coloreado en 0.001 segundos,  usando GeSHi 1.0.8.4

por **mcorraliza** » 2011-12-16 06:27 @310

¡Hola!

Estoy haciendo un programa para bioinformática que me pide lo que dije antes, pero conozco solo lo más básico.

Gracias por el consejo de no mezclar foreach() con do{} porque antes el error era que no me salía nada en la variable $dna, salía vacía, y ahora con una modificación que he hecho me concatena todo el archivo, así que algo he avanzado.

Necesito que la subrutina me concatene solo la secuencia de DNA, lo que está entre SQ y //, y para ello he hecho el siguiente programa, aunque debe tener algún error =S

use strict;
use warnings;
# Lo primero pedimos al usuario que introduzca las funciones que quiera mediante ARGV
print "Por favor introducir el nombre del fichero deseado\n";
my $fichero = <STDIN>;

#Protegemos la apertura del fichero con unless
unless(open(FICHERO, $fichero))
{print "Error!!!! No se ha podido abrir el fichero\n";
exit;
}
#Asignamos todo el contenido del fichero a un array
my @fichero = <FICHERO>;

#Ahora tenemos que parsear el fichero, lo hacemos con una subrutina
my $sequence = fichero(@fichero);

#Ahora tenemos ya la secuencia de DNA con todo
print $sequence;

#######################
sub fichero{
my @array = @_;
my $dna = '';
foreach my $line(@array) {
{(/ID/.. /SQ/ ) and next; #para saltarme toda la cabecera, no me ha funcionado como quería
}
{if ($line =~ /^SQ/) {
foreach $line(@array) {
$dna .= $line
}
}
}
}
$dna =~s/[\s0-9]//g;
return $dna;
}

¡¡Muchas gracias por la ayuda, un saludo!!

por **explorer** » 2011-12-16 10:36 @483

Más sencillo si solo te quedas con lo que realmente te interesa:

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

sub fichero {
    my @array = @_;
    my $dna;
 
    for my $line (@array) {                  # para todas las líneas del fichero...
        if ($line =~ /^SQ/ .. $line =~ /^\/\//) {     # si estamos dentro del rango interesante...
            next if $line =~ m{^(?:SQ|//)};           # pero no en la primera ni en la última línea...
            $dna .= $line;                            # adjuntamos la línea a la secuencia.
        }
    }
 
    $dna =~ s/[^actg]//gi;                            # quitamos todo lo que no sea ACTG
 
    return $dna;
}
Coloreado en 0.001 segundos,  usando GeSHi 1.0.8.4

Foro - Perl en Español

Interpretar un fichero EMBL

Interpretar un fichero EMBL

Publicidad

Re: Interpretar un fichero EMBL

Re: Interpretar un fichero EMBL

Re: Interpretar un fichero EMBL

¿Quién está conectado?