Foro - Perl en Español

por **Cacho10** » 2013-10-16 12:21 @556

Hola, aquí, aprendiendo Perl y haciendo mi primera pregunta en el foro.

¿Cómo debo interpretar los valores $fi[0], $fi[1], $fi[2] etc., tanto para $f1 y $r1?

Agradezco su ayuda.

while(my $f1=<WF>){
$f1[0]=$f1;
chomp($f1[1]=<WF>);
$f1[2]=<WF>;
chomp($f1[3]=<WF>);
$r1[0]=<WR>;
chomp(my $temp1=<WR>);
$r1[1]=reverse($temp1);
$r1[1]=~s/A/a/g;
$r1[1]=~s/T/t/g;
$r1[1]=~s/C/c/g;
$r1[1]=~s/G/g/g;
$r1[1]=~s/a/T/g;
$r1[1]=~s/t/A/g;
$r1[1]=~s/c/G/g;
$r1[1]=~s/g/C/g;
$r1[2]=<WR>;
chomp(my $temp2=<WR>);
$r1[3]=reverse($temp2);
my $rf1=$f1[1].$c_60.$r1[1];
chomp($f1[0]);
print FILE "$f1[0] $rf1\n";
}

while ( my $f1 = <WF> ) {           # para todas las líneas del archivo asociado a WF, cada línea se mete en $f1
    $f1[0] = $f1;                   # $f1 no se usa en ningún otro sitio más que aquí, haciendo una copia de la línea en $f1[0]
    chomp( $f1[1] = <WF> );         # leemos la siguiente línea de WF, la guardamos en $f1[1] y le quitamos los finales de línea
    $f1[2] = <WF>;                  # leemos la siguiente línea de WF, la guardamos en $f1[2], y no lo usamos más
    chomp( $f1[3] = <WF> );         # leemos la siguiente línea de WF, la guardamos en $f1[3] y le quitamos los finales de línea, y no lo usamos más
    $r1[0] = <WR>;                  # leemos una línea de WR, la guardamos en $r1[0], y no lo usamos más
    chomp( my $temp1 = <WR> );      # leemos la siguiente línea de WR, la guardamos en $temp1 y le quitamos los finales de línea
 
    $r1[1] = reverse($temp1);       # la última línea leída, le damos la vuelta y la guardamos en $r1[1]
    $r1[1] =~ s/A/a/g;              # de la última línea leída, cambiamos todas las 'A' por 'a'
    $r1[1] =~ s/T/t/g;              # de la última línea leída, cambiamos todas las 'T' por 't'
    $r1[1] =~ s/C/c/g;              # de la última línea leída, cambiamos todas las 'C' por 'c'
    $r1[1] =~ s/G/g/g;              # de la última línea leída, cambiamos todas las 'G' por 'g'
    $r1[1] =~ s/a/T/g;              # de la última línea leída, cambiamos todas las 'a' por 'T'
    $r1[1] =~ s/t/A/g;              # de la última línea leída, cambiamos todas las 't' por 'A'
    $r1[1] =~ s/c/G/g;              # de la última línea leída, cambiamos todas las 'c' por 'G'
    $r1[1] =~ s/g/C/g;              # de la última línea leída, cambiamos todas las 'g' por 'C'
    $r1[2] = <WR>;                  # leemos otra línea más y la guardamos en $r1[2], y no la usamos más
 
    chomp( my $temp2 = <WR> );           # leemos otra línea, la guardamos en $temp2 y le quitamos los finales de línea
    $r1[3] = reverse($temp2);            # le damos la vuelta y la guardamos en $r1[3], y no lo usamos más
    my $rf1 = $f1[1] . $c_60 . $r1[1];   # concatenamos $f1[1] (que es la segunda línea leída), con $c_60, con la sexta línea traducida
    chomp( $f1[0] );                     # quitamos los finales de línea de la primera línea
    print FILE "$f1[0] $rf1\n";          # escribimos a un archivo externo la primera línea y el resultado de la concatenación anterior
}
Coloreado en 0.005 segundos,  usando GeSHi 1.0.8.4

Lo que parece es que se leen ciertas líneas, se transforman un par de ellas, y se genera un resultado.

Se nota que quieres sacar la complementaria de una secuencia de ADN.

Esta es mi propia interpretación, reducida:

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

while (my $cabeza = <WF>) {
    chomp $cabeza;
 
    chomp(my $segunda = <WF>);
 
    <WF>; <WF>; <WR>;
 
    chomp(my $seq = <WR>);
    $seq = reverse $seq;
    $seq =~ tr/ATCG/TAGC/;
 
    <WR>; <WR>;
 
    my $cuerpo = $segunda . $c_60 . $seq;
 
    print FILE "$cabeza $cuerpo\n";
}
Coloreado en 0.001 segundos,  usando GeSHi 1.0.8.4

por **Cacho10** » 2013-10-16 15:48 @700

Gracias, explorer. Efectivamente en esta parte se trata de obtener la secuencia complementaria de un DNA. En virtud de que soy completamente nuevo en esto de Perl -y en programación en general- quería saber a que se referían la manera en que están usando dichas variables en el script.

Por cierto, explorer, si los archivos WF y WR tuvieran 100 secuencias cada uno (correspondientes entre sí), en el script, ¿cómo se da la orden que indica en que momento termina el proceso para cada uno de los pares de secuencias?

Agradezco tu apoyo, muy clara tu explicación.

Saludos.

por **explorer** » 2013-10-16 17:39 @777

Para hacerlo un poco más claro, yo agruparía las lecturas de las líneas en una parte del bucle. Si publicas una pequeña parte de los archivos podremos tener más pistas de lo que quieres hacer.

El proceso puede terminar si llegamos a la marca de fin de archivo, si estamos leyendo el archivo más corto, desde luego.

por **Cacho10** » 2013-11-05 15:02 @668

Hola, aquí molestando nuevamente y tratando de aprender sobre el lenguaje Perl.

Se supone que tengo un conjunto de lecturas (secuencias); las que se duplican o repiten se consideran como una sola y se guardan en un archivo denominado select. Las lecturas únicas se guardan en otro archivo nombrado como not_select.

Mi pregunta es en qué momento del siguiente script se le dice que guarde las que se repiten. Y hasta que cantidad de lecturas se pueden considerar como una sola. O mejor dicho: cómo identifico aquí si una lectura es duplicada o no.

Al final envío los resultados obtenidos de los archivos select y not_select

system "sort -k 2 $output >temp01";
system "uniq -c -f 1 temp01 |sort -n -r >temp02";
my @each_line="";
open TEMP02, "temp02"||di("cannot open temp02 file");
open SELECT, ">select"||di("cannot open select file");
open NOT_SELECT, ">not_select"||di("cannot open not_select file");
while(<TEMP02>){
@each_line=split;
print "$each_line[0] $count\n";
if($each_line[0] >= $count){print SELECT "$_";}
else{print NOT_SELECT "$_";}
}
close TEMP02;
close SELECT;
close NOT_SELECT;
system "rm temp01 temp02";

Archivo Select
45 @S210:3:10:11039:15124#0/1 AGCTCCAGCTATCCTGAGGGAAACTTCGGAGGGAACCAGCTACTAGATGGTTCGATTAGTCTTTCGCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCATATATAGAAATAGAAAGAGATAGACTAGAAACGACATCTCTTATGTCAATGACACCAAAGGGATATTA
.
.
2 @S210:3:10:10189:18283#0/1 AGCTCCCACTTATTCTACACCTCTCAAGTCATTTCACAAAGTCGGACTAGAGTCAAGCTCAACAGGGTCTCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCGCAATACCAAACCAAATACGACGAGTAGTGGGGTCCTGAGCTAAGCCTTGGCTAAACCTTGGAAATCTTA

Al inicio supongo que se tiene el número de lecturas que conforman esa secuencia "única"

Archivo not_select
1 @S210:3:9:9998:11094#0/1 AGCTCCAGTCATGCAGCCTGACATCTGGGAGGAGTGGTGGCGTCCTGCATGTGTCCTGGACATGCAGCCACCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCTGAACTGAAACTTGAGCTCTCGATTCCGTGGGATGGCTCAACAAAGCAGCCACCCCGTCCTACCTATTTA
.
.
.
1 @S210:3:10:10006:2894#0/1 AGCTCTCTTCAACTTTCTCACACAACTCTTCAACTTGAACATTCATGAAGGAAGCTATCGTAGGCGGTTTCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCTGTGAATTTCTGACCCGCGATCAATCCCGAATATTTTTCCGCTCCCATTCTGATTCTCTGAATATTTTTA

por **explorer** » 2013-11-05 16:05 @711

Ese código es un poco antiguo, ya que usa comandos externos para realizar su trabajo.

En la primera línea se hace una ordenación de las líneas, necesario para luego hacer la segunda línea.

En la segunda línea se sacan las líneas únicas, junto con el número de veces que se repiten.

Luego viene un bucle en que se lee el resultado de esas operaciones. Si el número de veces que se repite es igual o superior a $count (que no sabemos lo que vale), lo guarda en select, y si no, pues en not_select.

La verdad, se puede hacer todo en Perl, sin depender de herramientas externas.

por **Cacho10** » 2013-11-12 14:06 @629

Perdón por la tardanza, explorer. Agradezco tu atención. He estado revisando esta parte y ya comprendí para qué lo hace. Aún me falta mucho por aprender sobre Perl.

Saludos.

Foro - Perl en Español

Valores de variables

Valores de variables

Publicidad

Re: Valores de variables

Re: Valores de variables

Re: Valores de variables

Re: Valores de variables

Re: Valores de variables

Re: Valores de variables

¿Quién está conectado?