• Publicidad

Fecha actual 2024-11-24 07:45 @364

News News of Bioinformática

Site map of Bioinformática » Foro : Bioinformática

Perl aplicado a la bioinformática

SNP coincidentes entre dos archivos

Hola, necesito ayuda para agilizar una miniprograma.

El programa trata de abrir dos archivos, uno de más de 800 000 líneas y otro de longitud variable (de 10 líneas a 20 000 líneas) que contiene información por columnas. El primero y más largo contiene por columnas (separadas por varios espacios y no tabuladores): Cromosoma, SNP, posición, etc.; el segundo, SNP y Gen, separados por tabulador.

Mi intención es obtener un archivo de salida con solo ...
Read more : SNP coincidentes entre dos archivos | Vistas : 1185 | Respuestas : 1


Determinación de la posición de genes en el genoma

Hola a todos,

Necesito obtener las coordenadas de inicio y fin de los genes (guardados en formato FASTA) en el genoma completo (guardado en otro archivo FASTA). La idea es que vaya tomando la secuencia de los genes una por una, identifique la posición en el genoma y te devuelva las coordenadas de inicio y fin. ¿Alguien sabría guiarme sobre cómo hacerlo con un script en Perl?

Muchas gracias,

Berin
Read more : Determinación de la posición de genes en el genoma | Vistas : 1905 | Respuestas : 3


bioinfo: Indexando archivos FASTA

«Recientemente me he visto en la necesidad de acceder de maneara aleatoria a secuencias de un archivo FASTA de gran tamaño, en mi caso cercano a los 2 Gb,
con las secuencias formateadas en una sola línea.»

Artículo
Read more : bioinfo: Indexando archivos FASTA | Vistas : 1078 | Respuestas : 0


Promotores de Arabidopsis

Hola a todos, estoy teniendo un problema con un script para tratar de obtener los promotores de Arabidopsis en formato gff3.

En principio los obtuve simplemente contando -500 nt río arriba del inicio de los genes, pero luego me di cuenta que muchos de ellos se solapan con genes contiguos.

De manera que solo me quiero quedar con los que no solapen con genes.

Para eso escribí un script para que me encuentre coordenadas y ...
Read more : Promotores de Arabidopsis | Vistas : 2085 | Respuestas : 7


Cómo sumar elementos escalares numéricos dentro de un array

Hola a todos, soy bastante nuevo en programación en Perl y quiero hacer un script que me haga lo siguiente:

Tengo una lista de genes con números:

AT1G01073 18,5
AT1G02470 20
AT1G02590 5
AT1G02590 6,5
AT1G02740 5,5
AT1G03600 5,5
AT1G03600 9
AT1G03600 4,5
AT1G03600 8
AT1G03600 6
AT1G03600 11,5
AT1G03600 4
AT1G04410 4,5

Lo que quiero hacer es sumar los números correspondientes a cada gen, pero como verán, algunas son únicas, y otros tienen más ...
Read more : Cómo sumar elementos escalares numéricos dentro de un array | Vistas : 3602 | Respuestas : 5


bioinfo: comparando secuencias de igual longitud

«Hola,
hoy quería compartir recetas en Perl para la comparación eficiente de secuencias de igual longitud. Las dos funciones que vamos a ver devuelven como resultado listas con las posiciones (contando desde 0) en las que difieren dos secuencias.

Para qué sirve esto? En general, para calcular distancias de edición (edit distances); en bioinformática es una manera, por ejemplo, de comparar oligos de igual longitud o secuencias extraídas de un alineamiento múltilple, incluyendo gaps. El ...
Read more : bioinfo: comparando secuencias de igual longitud | Vistas : 1807 | Respuestas : 2


Extracción de líneas coincidentes

Hola,
he hecho un script que me permite abrir el archivo "funcions.txt" donde solo me interesan las líneas que contengan "glycolisis" o "neogenesis" porque llevan un código que necesito posteriormente.

Una vez consigo esta información quiero leer el archivo "lee.txt" para extraer de él las líneas que contengan los códigos anteriores y guardarlos en:

- GL.txt: si contiene los códigos de glycolisis
- NL.txt: si contiene los códigos de neogenesis

El script que he ideado ...
Read more : Extracción de líneas coincidentes | Vistas : 1640 | Respuestas : 3


Expresión Diferencial RNA-seq

¡¡¡Hola a todos!!!

Tengo un problema y estoy atorado con esto desde hace ya varios días. Tengo un archivo así:

ID RPKM_C RPKM_T1 RPKM_T2
Pp1s10008_1V6.1 15.1413902 13.23147945 63.56598706
Pp1s100_101V6.1 3.02827804 2.615525008 7.196149479
Pp1s100_102V6.1 6.012701324 6.004640585 12.75103445
Pp1s100_104V6.1 4.660445525 4.4133651 8.656488079
Pp1s100_106V6.1 4.05209418 3.87275314 6.58645081
Pp1s100_107V6.1 3.563197791 3.881832493 7.756641103
Pp1s100_108V6.1 2.658938461 2.450037373 6.639192251

Y necesito un script que me compare los RPKM_C vs RPKM_T1, RPKM_C vs RPKM_T2, de cada ID y que los asigne a ...
Read more : Expresión Diferencial RNA-seq | Vistas : 2025 | Respuestas : 5


Seleccionar secuencias de un archivo multiFASTA

Hola, Perleros,

tengo un archivo multiFASTA con miles de entradas y quiero filtrarlo, en función del nombre de la secuencia, que incluye información relevante para el filtrado. La verdad es que estoy un poco perdido porque no sé cómo organizarlo ya que es un archivo fasta con miles de secuencias, y no sé si es buena idea guardar todo en variables.

El archivo es de la siguiente manera. En este ejemplo voy a incluir únicamente ...
Read more : Seleccionar secuencias de un archivo multiFASTA | Vistas : 2240 | Respuestas : 3


Blast remoto

Hola a todos :)

He estado trabajando con blast de forma remota para anotar genes y todo funciona bien, pero cuando le mando un archivo con muchas proteínas me genera un archivo por cada resultado, por lo que se me generan demasiados archivos en el ordenador, yo sólo necesito un sólo archivo donde se almacenen todos los blastreport. ¿Se puede de alguna forma?

Ocupo la función blastreport->save_output($filename), ...
Read more : Blast remoto | Vistas : 1544 | Respuestas : 2


 

Identificarte  •  Registrarse


Estadísticas

Mensajes totales 36880 • Temas totales 7428 • Usuarios totales 1981