• Publicidad

Fecha actual 2024-11-24 07:55 @371

News News of Bioinformática

Site map of Bioinformática » Foro : Bioinformática

Perl aplicado a la bioinformática

bioinfo: El Protein Data Bank en El País

«... hoy me gustaría destacar que recientemente ha salido en el diario El País, uno de los más leídos en español, un artículo donde se resumían los últimos avances en las técnicas de resolución de estructuras moleculares, que poco a poco parece que se van encaminando al estudio de moléculas individuales. El artículo original, muy interesante, es Destellos brillantes y ultracortos iluminarán la nueva biología estructural.
La verdad me sorprendió gratamente encontrarme en la prensa ...
Read more : bioinfo: El Protein Data Bank en El País | Vistas : 2437 | Respuestas : 0


Comparación de listas

Hola a todos:

Tengo varias listas con un número variable de elementos. Quiero comparar las listas con menor número de elementos contra las listas que tienen mayor número de elementos. Si todos los elementos de la lista con menor número de elementos están contenidos en la lista con mayor número de elementos quiero imprimir el nombre de dicha lista en un archivo de salida.

Este es el script que he desarrollado hasta el momento. Soy ...
Read more : Comparación de listas | Vistas : 1327 | Respuestas : 3


Cruzar dos listas

Hola perleros,

Tengo dos archivos de datos. El primero me indica el cromosoma, el nombre del gen (gene_symbol) y la posición central del gen en el cromosoma. Tengo 2000 filas. El segundo me indica el cromosoma, la posición inicial y final del gen y el identificador (ID) del gen. Tengo 35000 filas. Lo que necesito es obtener en un archivo resultante, el gene_symbol y su ID propio.

Para ello he pensado leer el archivo menor ...
Read more : Cruzar dos listas | Vistas : 5062 | Respuestas : 24


Sustitución de la palabra "5'" en un oneliner

¡Hola! Soy nueva con el uso del Perl y la programación en general y estoy tratando de hacer un oneliner para realizar la edición de la primera línea de un archivo FASTA (fastaheader) del Genebank, y básicamente lo he hecho a base de la expresión regular:

perl -pe 'if(/^>/){ s/gi\|//; s/\|.*\| / /;s/bv.//; s/strain//;s/gene,//;s/partial//;s/cds//;s/.//g;s/-//g;s/ / /g;s/ / /g;s/ / /g;s/ /_/g} s/^\n$//' archivo.fasta | grep '>'

Con el grep() voy viendo cómo va quedando y ...
Read more : Sustitución de la palabra "5'" en un oneliner | Vistas : 1160 | Respuestas : 3


Contar espacios y eliminar

Hola.

Tengo un archivo con el siguiente formato
>GW156IX01BW18G length=114 xy=0669_2046 region=1 run=R_2011_02_01_18_40_56_
40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 33 30 28 28 28 28
>GW156IX01AUUGH length=76 xy=0234_0799 region=1 run=R_2011_02_01_18_40_56_
40 40 40 40 40 40 40 40 40 39 40 27 26 16 16 16 26 29 14 26 21 21 21 21
>GW156IX01AOII3 length=113 xy=0162_0317 region=1 run=R_2011_02_01_18_40_56_
4 9 40 40 ...
Read more : Contar espacios y eliminar | Vistas : 1782 | Respuestas : 5


Unir condiciones

Hola, ¿qué tal?

¿Podrían orientarme en el siguiente código?

#!/usr/local/bin/perl

open(my $file, $ARGV) or die "no se pudo abrir\n"; #abrir archivo

while (<$file>){

if(/>/)
{
$_=~ s/>|length=|uaccno=/,/g;

print "proyecto$_";

}elsif (/^+$/) {

print ",$_";

}
}

close (FH);

Obtengo una salida:

proyecto,000359_0207_2153 ,64 ,GK7VQPO01ASH53
,CGTATGTAAATGGTTCTTGCTTCTCCCTCCCTAATGATAAGACAGGCACTGATGGCGCGA

Pero necesito que esto se imprima en una sola línea, ¿cómo puedo realizarlo?

Agradecería mucho tu atención.
Read more : Unir condiciones | Vistas : 1446 | Respuestas : 5


Detección de ORF

Hola a todos. Me presento: estoy estudiando 2º de grado de biotecnología y tengo que terminar este trabajo para aprobar la asignatura.

El trabajo consiste en, dado un fichero FASTA identificar todos los ORF tanto en sentido normal como inverso ("reverse"). El problema está en que no me encuentra todos los ORF que debería. Sin embargo, los que encuentra coinciden con la solución. Por ejemplo, mi ORF nº 1 equivale al ORF nº 7 del ...
Read more : Detección de ORF | Vistas : 2694 | Respuestas : 9


Sacar nombres de especies sin repetición

Hola, necesito un programa de Perl que saque por pantalla (sin repetición) los nombres de las especies representadas en un fichero.

El fichero es así:
>TPC2_XENTR Xenopus tropicalis
AAGTGACCGTAGACCAAAGCGAGTTTCGGCTCCAGGGAAGCGAGTTTCGGCTCCAGGGAAGCGAGTTTCGGCTCCAGGG
>TPC2_XENLA Xenopus laevis
ATGGAGTCGGAGCCGCTGCTCGGTTGGAGCGTCAATCTGCCTTGGAGAAAAGCGAGTTTCGGCTCCAGGG

Lo que me interesa es que imprima sin repetición solo el nombre (ej: Xenopus tropicalis)

Muchas, muchas, gracias.

No sé si es muy simple, pero lo necesito lo más rápido posible. Gracias.
Read more : Sacar nombres de especies sin repetición | Vistas : 3243 | Respuestas : 16


Analizar un archivo y contar cuántas veces aparece un contig

¿Qué tal? Quisiera ver si me pueden ayudar con este pequeño problema...
Tengo este archivo:

GPJFHIG01AN7BW Assembled contig00764 69 - contig00748 3 -
GPJFHIG01D3PF6 Assembled contig00645 650 + contig00009 710 -
GPJFHIG01ADJDG Assembled contig00764 490 + contig00674 586 -
GPJFHIG01CEBKL Singleton
GPJFHIG01ECQ6L Singleton
GPJFHIG01CS9M0 Assembled contig00645 186 + contig00645 273 -
GPJFHIG01CDL5X Assembled contig00764 580 - contig00690 75 +
GPJFHIG01AZUS9 Singleton
GPJFHIG01BHOJ5 Assembled contig00645 146 + contig00645 278 -
GPJFHIG01AHBGC TooShort
GPJFHIG01B6LGY PartiallyAssembled contig02291 359 ...
Read more : Analizar un archivo y contar cuántas veces aparece un contig | Vistas : 1854 | Respuestas : 5


Buscar secuencias en ficheros

¡Hola! ¡Nuevamente necesito ayuda! Bueno, lo que ocurre es que tengo un archivo de esta manera (mucho más largo, de unas 22200 líneas)

gn0058461_int_gn0085512
\ACAAACACAATTCACTCATCGGACCCGCTGGTTCCGGCTAC/
gn0020660_int_gn0260994
\TTAAAAATAAATAAAAATAAAGAAAATATATAAATCTATGAC/
gn0260994_int_gn0046706
\GACAACTTGGAGGAGACACCCGGCGGACCCGGAATCCAAGTC/
_int_gn0031208
\CGACAATGCACGACAGAGGAAGCAGAACAGATATTTAGATTG/
gn0031208_int_gn0002121
\AAAAACAATGCGAATAGGGACGTATTAATTGCCGAATCTCT/
gn0002121_int_gn0031209
\GTGCCCGTGTATCTCTATCGAAAAAATCATATATTTTTTAGA/
gn0031209_int_gn0051973
\ATCGAGCGCAAGTTTGGAGTTCGATGTGTTTTCAGCTGTGAGC/
gn0051973_int_gn0067779
\GTGCGGACGAGTGTCTTGAGACTCTGGGCAAGCGCAGCCAGCCA/

Y un archivo similar pero contiene solo nombres, no las secuencias. Hice un código que lee nombres en archivo que contiene los nombres y los busca en el segundo archivo (el que muestro) y si lo ...
Read more : Buscar secuencias en ficheros | Vistas : 2915 | Respuestas : 11


 

Identificarte  •  Registrarse


Estadísticas

Mensajes totales 36880 • Temas totales 7428 • Usuarios totales 1981