Cambiar de nombre a las cabeceras de un archivo fasta
Publicado: 2011-11-28 00:12 @050
Hola, ¿qué tal?
Me puse a revisar su foro y en primer lugar lo felicito por la forma didáctica que tiene de responder. Soy novato en el uso de los scripts en Perl. La verdad, me gustaría aprender, espero que me informe si pretende hacer algún curso; la verdad, estoy muy interesado.
Mi problema es el siguiente: muchas veces realizo alineamiento de secuencias provenientes del NCBI en formato multifasta; pero los headers son muy largos para ver con qué secuencia o secuencias estoy trabajando.
Ahora en el archivo multifasta puedo trabajar hasta con 50 secuencias a más.
Así que quisiera encontrar la forma de cambiar los nombres de los headers o cambiarlos por el número de accesión de las secuencias. Por ejemplo:
Secuencias en archivo multifasta:
Lo que se desea es un archivo output o de salida de la forma:
De antemano, gracias por la atención prestada y la solución a mi problema.
¡¡¡Gracias!!!
Me puse a revisar su foro y en primer lugar lo felicito por la forma didáctica que tiene de responder. Soy novato en el uso de los scripts en Perl. La verdad, me gustaría aprender, espero que me informe si pretende hacer algún curso; la verdad, estoy muy interesado.
Mi problema es el siguiente: muchas veces realizo alineamiento de secuencias provenientes del NCBI en formato multifasta; pero los headers son muy largos para ver con qué secuencia o secuencias estoy trabajando.
Ahora en el archivo multifasta puedo trabajar hasta con 50 secuencias a más.
Así que quisiera encontrar la forma de cambiar los nombres de los headers o cambiarlos por el número de accesión de las secuencias. Por ejemplo:
Secuencias en archivo multifasta:
Using text Syntax Highlighting
>Mycoplasma synoviae
atgcgatcgatcgatcgatagcatcgatcagcatcgatcgatcgactctgcatacgg
>Mycoplasma gallisepticum
atgcgatcgatcgatcgactcgatcagtcagctacgatcgactatcagctagc
>Mycoplasma enteritidis
atgtttgatgcattattgcatcgacgatcgatatcgagtcgatcgatcgtagctacgatcgatagtcattctagacagtcacg
atgcgatcgatcgatcgatagcatcgatcagcatcgatcgatcgactctgcatacgg
>Mycoplasma gallisepticum
atgcgatcgatcgatcgactcgatcagtcagctacgatcgactatcagctagc
>Mycoplasma enteritidis
atgtttgatgcattattgcatcgacgatcgatatcgagtcgatcgatcgtagctacgatcgatagtcattctagacagtcacg
Coloreado en 0.000 segundos, usando GeSHi 1.0.8.4
Lo que se desea es un archivo output o de salida de la forma:
Using text Syntax Highlighting
>MS
atgcgatcgatcgatcgatagcatcgatcagcatcgatcgatcgactctgcatacgg
>MG
atgcgatcgatcgatcgactcgatcagtcagctacgatcgactatcagctagc
>ME
atgtttgatgcattattgcatcgacgatcgatatcgagtcgatcgatcgtagctacgatcgatagtcattctagacagtcacg
atgcgatcgatcgatcgatagcatcgatcagcatcgatcgatcgactctgcatacgg
>MG
atgcgatcgatcgatcgactcgatcagtcagctacgatcgactatcagctagc
>ME
atgtttgatgcattattgcatcgacgatcgatatcgagtcgatcgatcgtagctacgatcgatagtcattctagacagtcacg
Coloreado en 0.000 segundos, usando GeSHi 1.0.8.4
De antemano, gracias por la atención prestada y la solución a mi problema.
¡¡¡Gracias!!!