• Publicidad

Determinación de la posición de genes en el genoma

Perl aplicado a la bioinformática

Determinación de la posición de genes en el genoma

Notapor Berin » 2013-01-24 09:09 @423

Hola a todos,

Necesito obtener las coordenadas de inicio y fin de los genes (guardados en formato FASTA) en el genoma completo (guardado en otro archivo FASTA). La idea es que vaya tomando la secuencia de los genes una por una, identifique la posición en el genoma y te devuelva las coordenadas de inicio y fin. ¿Alguien sabría guiarme sobre cómo hacerlo con un script en Perl?

Muchas gracias,

Berin
Berin
Perlero nuevo
Perlero nuevo
 
Mensajes: 2
Registrado: 2013-01-24 07:12 @342

Publicidad

Re: Determinación de la posición de genes en el genoma

Notapor explorer » 2013-01-24 10:22 @474

Bienvenido a los foros de Perl en Español, Berin.

La idea sería
  • abrir y leer la secuencia donde vamos a buscar los genes y guardarlo en una variable escalar
  • abrir y leer por secuencias las que queremos buscar
  • para cada una de ellas, usamos la función index() para localizar la posición inicial
  • la posición final es igual a la posición inicial más la longitud de la secuencia que estamos buscando

¿Sabemos si las secuencias a buscar se pueden repetir dentro de la secuencia principal? En ese caso hay que repetir la búsqueda hasta que index() devuelva un -1, indicando que no ha encontrado ninguna más.

Por estos foros hay cuestiones parecidas, con código que puedes examinar.
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14480
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Re: Determinación de la posición de genes en el genoma

Notapor Berin » 2013-01-24 10:48 @492

Hola, explorer.

Las secuencias podrían estar repetidas y además podrían estar en la cadena complementaria a la secuencia dada.

Saludos,

Berin
Berin
Perlero nuevo
Perlero nuevo
 
Mensajes: 2
Registrado: 2013-01-24 07:12 @342

Re: Determinación de la posición de genes en el genoma

Notapor explorer » 2013-01-24 11:32 @522

Bueno, pues a lo comentado antes habría que agregar un nuevo punto que sería repetir la búsqueda de la secuencia pero a lo largo de la complementaria.

La complementaria se podría crear al principio, pues solo es necesario hacerlo una vez.

Por estos foros tienes todas las piezas necesarias para crear el programa. Por ejemplo, para calcular la complementaria:

($complementaria = $secuencia) =~ tr/ATCG/TAGC/;
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14480
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España


Volver a Bioinformática

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 4 invitados

cron