Hola, ¿qué tal?
Me puse a revisar su foro y en primer lugar lo felicito por la forma didáctica que tiene de responder. Soy novato en el uso de los
scripts en Perl. La verdad, me gustaría aprender, espero que me informe si pretende hacer algún curso; la verdad, estoy muy interesado.
Mi problema es el siguiente: muchas veces realizo alineamiento de secuencias provenientes del NCBI en formato multifasta; pero los
headers son muy largos para ver con qué secuencia o secuencias estoy trabajando.
Ahora en el archivo multifasta puedo trabajar hasta con 50 secuencias a más.
Así que quisiera encontrar la forma de cambiar los nombres de los
headers o cambiarlos por el número de accesión de las secuencias. Por ejemplo:
Secuencias en archivo multifasta:
Using text Syntax Highlighting
>Mycoplasma synoviae
atgcgatcgatcgatcgatagcatcgatcagcatcgatcgatcgactctgcatacgg
>Mycoplasma gallisepticum
atgcgatcgatcgatcgactcgatcagtcagctacgatcgactatcagctagc
>Mycoplasma enteritidis
atgtttgatgcattattgcatcgacgatcgatatcgagtcgatcgatcgtagctacgatcgatagtcattctagacagtcacg
Coloreado en 0.000 segundos, usando
GeSHi 1.0.8.4
Lo que se desea es un archivo
output o de salida de la forma:
Using text Syntax Highlighting
>MS
atgcgatcgatcgatcgatagcatcgatcagcatcgatcgatcgactctgcatacgg
>MG
atgcgatcgatcgatcgactcgatcagtcagctacgatcgactatcagctagc
>ME
atgtttgatgcattattgcatcgacgatcgatatcgagtcgatcgatcgtagctacgatcgatagtcattctagacagtcacg
Coloreado en 0.000 segundos, usando
GeSHi 1.0.8.4
De antemano, gracias por la atención prestada y la solución a mi problema.
¡¡¡Gracias!!!