• Publicidad

Fecha actual 2024-12-27 13:56 @622

News News of Bioinformática

Site map of Bioinformática » Foro : Bioinformática

Perl aplicado a la bioinformática

Generar todas las combinaciones de nucleótidos

Estoy haciendo un programa en Perl para contar secuencias de longitud n en un archivo de ADN.

Me gustaría saber cómo puedo hacer una subrutina que devuelva todas las posibles combinaciones de palabras de longitud n, es decir, las 4^n permutaciones. Llevo varios días intentándolo y solo lo consigo para secuencias de n=2.

¿Podrías indicarme una forma sencilla de cómo hacerlo, puesto que llevo poco programando? Quizá alguna subrutina que mute continuamente o algo así...
Read more : Generar todas las combinaciones de nucleótidos | Vistas : 2070 | Respuestas : 3


Interpretar un fichero EMBL

¡Hola!
Tengo que crear un programa capaz de parsear un fichero EMBL. «El programa construido deberá ser capaz de leer ficheros del tipo EMBL. En la parte final, entre las líneas que contienen al principio "SQ" y "//" tiene la secuencia genómica correspondiente, con la que se deberá trabajar.»

Mi pseudocódigo es algo así como
foreach my$line(@array) {
do {next;}
until ($line eq 'SQ.');}
para saltar las primeras lineas de código y luego quiero ...
Read more : Interpretar un fichero EMBL | Vistas : 2147 | Respuestas : 3


Crear multisecuencias

Estimado explorer:

Tengo un problema con respecto a la permutación de secuencias nucleotídicas. Por ejemplo:

Tengo 3 secuencias nucleotídicas o aminoácidos.

INPUT
>multisecuencia
acgtc tgatgc gcatcg

(pueden ser de diferente tamaño y estar en un mismo archivo o en archivos distintos, en formato fasta)

Ahora, necesito realizar la permutación de dicha secuencias, en este caso sería 3!=3x2x1, teniendo lo siguiente:

OUTPUT
>multisecuencia
acgtc tgatgc gcatcg ..... seq1
tgatgc acgtc gcatcg ..... seq2
tgatgc gcatcg acgtc ...
Read more : Crear multisecuencias | Vistas : 1279 | Respuestas : 1


Buscar ORF

¿Cómo podría buscar cada ORF (ATG) hasta un STOP (TAA, TAG, TGA) guardando cada triplete desde ATG hasta STOP en un arreglo? Debido a que es un genoma y necesito sacar los marcos de lecturas.

Llevo esto:
#!/usr/bin/perl
use strict;
use warnings;
my $cadena = '';
my $file = 'archivo.fna'; # archivo .fna que contiene el #genoma de un procariota
if ( -e $file ) {
open IN, "<$file" or die "No pasa nada ...
Read more : Buscar ORF | Vistas : 1144 | Respuestas : 1


Problema con los ORF y expresiones regulares

Hola a todos

Soy alumno de la carrera de Bioinformática en Chile y soy nuevo en el foro :)

Resulta que me dieron una tarea de encontrar todos los ORF de la secuencia de un genoma, usando sólo expresiones regulares.Yo para eso ocupé la siguiente sentencia:

my @orfs = ( $sequence =~ m/(ATG(?:{3})+?(TAA|TAG|TGA))/g);

Esto me resulta bien, pero tiene un puro detalle. Cuando encuentra un codón de ...
Read more : Problema con los ORF y expresiones regulares | Vistas : 1435 | Respuestas : 3


Llenar un arreglo con todas las posibilidades de nucleótidos

Hola. Haciendo un programita, se me presento la siguiente duda.

¿Cómo puedo llenar un arreglo con todas las posibilidades de nucleótidos, según el largo del tipo de nucleótido?

Ejemplo:
El espacio muestral (todas las posibilidades) de un nucleótido de 1, 2 y 3 letras, son 4¹=4, 4²=16 y 4³=64 respectivamente.

Para un nucleótido de 2 letras el espacio muestral es 16, entonces el arreglo debe quedar así:

my @arreglo;
$arre='AA';
$arre='AT';
$arre='AG';
$arre='AC';
$arre='TA'; ...
Read more : Llenar un arreglo con todas las posibilidades de nucleótidos | Vistas : 1438 | Respuestas : 1


Cómo contar y buscar cadenas en secuencias nucleótidas

Hola. Soy estudiante de bioinformática. Tengo una duda en cómo busco y cuento una cadena en un secuencia. Está basado sobre el siguiente problema:

Tengo una secuencia...
GAGTTTTATCGCTTCCATGACGCAGAAGTTAACACTTTCGGATATTTCTAATGAGTCGAAAAATTATCTT

y deseo buscar cuántas veces se repite una cadena de dos letras, vale decir, cuántas veces AT, TA, CG, GC, GT, AC.... (en fin, todas las posibilidades en dos letras de espacio), se encuentran en la secuencia.

Ejemplo:
SECUENCIA= GGGTAGGCTAGGATCGGGTACGTCACGGGTATGCA
STRING=GG
RESULTADO: SE HAN ENCONTRADO 8 VECES ...
Read more : Cómo contar y buscar cadenas en secuencias nucleótidas | Vistas : 2546 | Respuestas : 2


Porcentaje de bases

Buenas, llevo toda la mañana y no me sale, me desespero. Me gusta Perl, pero cuando me salen las cosas, ¡ja,ja!

A ver, tengo este hash de hashes y tengo que sacar de un organismo y de la base que me pida el usuario el porcentaje de la base.

Dadme alguna idea. Gracias.

print "¿Que quieres hacer:\n a)Imprimir todos los organismos por pantalla (pulsa a)\n b)Guardar la tabla en un fichero (pulsa b)\n c)Mostrar ...
Read more : Porcentaje de bases | Vistas : 1144 | Respuestas : 1


Contador de cisteínas en una secuencia Fasta de aminoácidos

Hola a todos.

Voy empezando con Perl. Tengo que hacer un contador de cisteínas (el número de veces que aparece la letra C en la secuencia de aminoácidos) en un archivo múltiple en formato fasta. Tengo varios días y no puedo. ¿Podría alguien darme una idea de cómo puedo hacer esto?

El input sería algo así:
>217618
MHHPILLSAFISIASSLRLNAPTVNKRGSTIAQPGSIKDVIVTSFNTLNSTHHYRIPKAKPHSWNDTIST
HNLSLKLYNNYNGGPINAYIQGLDSNGAIVFITSNGTLIHPRSNNSSSPIEIKDKLAIPLPPKGQSLTLN
ITTSLTSGRVYFSEGNLKFFTINLGAGDGLVQPSVNNLHDPSASLNWGFIELTFLRNGALYANISYVDFV
GLILSMMLSTKDGGTPQITRGLRANAVYDLCEGLFKQTANDGYLWLAMCVVGKTGDPVRVLSPNYYQRVY
AADFEDYWQDYVDTVWEYYSSHTLAIDTQTPLGQVECQVTNDTLYCAEDNRGYAKPTASDIWGCNSGPFG
LQEGDNPVHVAVIPRLCAAFVRSTLLIRGGDVQPRLNSSYHYSVSPTNHYSRIVHELQVDGRGYAFSYDD
VNPNGHEDVSGLVSSGNPDTLTVYVGGPPN*


>161114
MAPSGTLPLAAAILALAGIVTAQQPGTSTPEVHPKLTTYQCTTSGGCVAQDTSVVLDWNYRWMHDANYNS
CTVNGGVNTTICPDEATCGTNCFIEGVNYTASGVTTSGSSLTMNQYMPATTGGYSSVSPRLYLLGADGNY
VLLQLNGKELSFDVDLSALPCGENGSLYLSQMADNGGANQYNTAGANYGSGYCDAQCPVQTWKNGTLNTN
HSGYCCNEMDILEGNSEANALTPHSCTATACDSSGCGLNPYASGFHSYYGPGLTVDTSKPFTITTQFNTD
NGSPSGNLVSITRKYIQNGVSIPSAQSGGDIISSCPSASAYGGLTTMGKALTSGMVLIFSIWNDSGGYMN
WLDSGSSGPCSSTEGNPSTILANNPGTHVTFSNIKWGDIGSTTSGGSSPPPPPASSTTLRTSTTTSKTST
APPSCTQTHWGQCGGNGYTGCKTCASGTTCQYSNDCEYSMNISKRRFRILIM*


>86295
MVLFRSLVFFSATACAATAPPSQSQGGIMAEQGLPDGIYQAAAVQGPTFEAPSAVPSSHLSLRGWKHPPG
EGDFHEKPGPHTEDEYSVPIHATRHSCHKDRHILLNSTEYRRAIDNLWDYCQNFKVPYHGAHLSIVGDVM ...
Read more : Contador de cisteínas en una secuencia Fasta de aminoácidos | Vistas : 3936 | Respuestas : 13


Cambiar de nombre a las cabeceras de un archivo fasta

Hola, ¿qué tal?

Me puse a revisar su foro y en primer lugar lo felicito por la forma didáctica que tiene de responder. Soy novato en el uso de los scripts en Perl. La verdad, me gustaría aprender, espero que me informe si pretende hacer algún curso; la verdad, estoy muy interesado.

Mi problema es el siguiente: muchas veces realizo alineamiento de secuencias provenientes del NCBI en formato multifasta; pero los headers son muy largos ...
Read more : Cambiar de nombre a las cabeceras de un archivo fasta | Vistas : 2467 | Respuestas : 3


 

Identificarte  •  Registrarse


Estadísticas

Mensajes totales 36890 • Temas totales 7432 • Usuarios totales 1981