• Publicidad

Fecha actual 2024-12-25 20:25 @892

News News of Bioinformática

Site map of Bioinformática » Foro : Bioinformática

Perl aplicado a la bioinformática

Interpretación de una expresión regular

Buenas. Estaba mirando un programa que han subido aquí y no entiendo muy bien este trozo de código.

my @orfs = $sequence =~ /(ATG(?:.{3})*?)(TAA|TAG|TGA|.{1,3}$)/g;

Muchas gracias.
Read more : Interpretación de una expresión regular | Vistas : 1278 | Respuestas : 1


Posiciones de un array

Buenas.

Me están pidiendo que diga las posiciones en un array que presenten el valor mínimo. Ando un poco liado con esto. Si alguien me puede ayudar...

Muchas gracias.
Read more : Posiciones de un array | Vistas : 2714 | Respuestas : 7


Uso de valor no inicializado (Use of uninitialized value)

Hola, buenos días. Tengo un script que lo uso para extraer asignaciones taxonómicas de lo obtenido con qiime. Está desarrollado para extraer cada asignación por separado de los archivos obtenidos en el formato de Silva y el de GreenGenes. Sin embargo, en la línea
my @kingd=($taxon_value=~m/D_0__(.*);D_1|k__(.*);p__/g);
que es donde está las opciones para los dos formatos, tengo un problema que me arroja este mensaje: Use of uninitialized value $_ in pattern match (m//) at ...
Read more : Uso de valor no inicializado (Use of uninitialized value) | Vistas : 1851 | Respuestas : 3


Extraer secuencias usando un archivo con los ID

Hola, buenos días. Tengo este código en Perl que modifiqué de acuerdo a lo que requiero de uno ya existente, para extraer secuencias usando el ID en un archivo .txt. Sin embargo, el archivo de salida me arroja las secuencias con los ID del archivo.txt y yo lo que quiero es que salga todo el nombre original de cada secuencia.

>Z85.T_1177507 Z85s 9PG0M:00018:00019 orig_bc= new_bc= bc_diffs=0
ACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATGGGTTGTAAAGCACTTTCAGTAGGGAGGAAAACTTGGGAATTAATACCCCCCAA
>X89.T_24577341 X89s 9PG0M:00022:00033 orig_bc= new_bc= bc_diffs=0
CGATTACTAGCGATTCCGACTGAATTGCAGACTCCAATCCGGATTTGCTTCCCCTCGCGGGCTTGCGACCCTCTGTGCCGACCATTGTAGCACGTGAGTA ...
Read more : Extraer secuencias usando un archivo con los ID | Vistas : 1736 | Respuestas : 2


De fastaq a fasta en subrutina

Hola, he creado este script para extraer múltiples secuencias contenidas en una carpeta en formato fastq y pasarlas a formato fasta y que mantenga el mismo nombre de cada archivo fastq:

#!/usr/bin/perl

use strict;
use warnings;
use Getopt::Long;

my ($dir, $files, $file_name, $file_format, $extension);

GetOptions (
'dr=s' =>\$dir
);

foreach $files (glob("$dir/*.fastq")) {
open LINE, "<", $files or die "can't read open $files";
while(
defined(my $head = <LINE>) &&
defined(my $seq = <LINE>) && ...
Read more : De fastaq a fasta en subrutina | Vistas : 1743 | Respuestas : 2


Cambio de Id en fasta

Hola.

Soy nuevo en el foro, y quería pedir una ayuda. Soy biólogo y no me manejo mucho en programación.

Tengo un archivo fasta con cerca de 2 millones de registros, que apenas lo puedo abrir en un procesador de texto. Los registros se encuentran de la siguiente forma.
>SRR1517819.1.1
TNTCATCGAGACAGACTGTGAGGTGGATTTTGCACCTCCTCTGGATTACAAGGAACCTGAAAGGCCTGTTGCAACTGTTCCTTCAGGCAAGGCACCATCACAAGTTGAAGAGATTCCAGCTGAGACCGAACCAAAATTCAAC
>SRR1517819.1.2
GTTGAATTTTGGTTCGGTCTCAGCTGGAATCTCTTCAACTTGTGATGGTGCCTTGCCTGAAGGAACAGTTGCAACAGGCCTTTCAGGTTCCTTGTAATCCAGAGGAGGTGCAAAATCCACCTCACAGTCTGTCTCGATGATA
>SRR1517819.2.1
CNTATACATTTCAATTTACAATTTCAACATAAAACAGAAATAAAATGATAATATAATGTTTACATCTGGAATATACAATTATTGATTAACAAGCCCGTATCGGTTAGTATTTTTTTTTTTTGGGTAACGAGGATCCCACCCGTATTTAAGT
>SRR1517819.2.2
ATAAGTTCCATCCTTCTGGGGGTTGTGTGCAACAAATGGATTTTACAACTTAAGTGTCAATTCCTTGAAGATCTGTCACTACTTAAATACGGGTGGGATCCTCGTTACCCAAAAAAAAAAAATACTAACCGATACGGGCTTGTTAATCAAT
>SRR1517819.3.1
CNGTAATGAAACAAGACATAAGACCAGCTCTCAAGGACATTGTTTGGACCTGGCAAGGGGAGCCGCAGCAGCAGCAGCATCAGCATCAAGAACAACTACAACTAGAGGAACAAGAGCTACAGCCTTCTCAAGCACTCCCAATG
>SRR1517819.3.2
CATTGGGAGTGCTTGAGAAGGCTGTAGCTCTTGTTCCTCTAGTTGTAGTTGTTCTTGATGCTGATGCTGCTGCTGCTGCGGCTCCCCTTGCCAGGTCCAAACAATGTCCTTGAGAGCTGGTCTTATGTCTTGTTTCATTACCG
>SRR1517819.4.1
CNCTGGTACTATTGCAACATAAGCACTCTCAAAAAAAGAAACAAGTAGCATTGACACAAAACAGATTTTGACTAGATAGCAACTGAGATAATGCTCTAATCGAAGAGTGAGAATCCCATATCTTCATCTTCGC
>SRR1517819.4.2
GCGAAGATGAAGATATGGGATTCTCACTCTTCGATTAGAGCATTATCTCAGTTGCTATCTAGTCAAAATCTGTTTTGTGTCAATGCTACTTGTTTCTTTTTTTGAGAGTGCTTATGTTGCAATAGTACCAGAG

Como se observa, todos los id terminan en '.1' ...
Read more : Cambio de Id en fasta | Vistas : 1359 | Respuestas : 1


Edición en columna de tabla

Hola chicos:

Espero alguien me pudiera ayudar para editar la información de una tabla mediante línea de comandos ya que soy nuevo en esto.

La tabla que tengo presenta la siguiente información en el .txt adjunto.
En la columna de logFC se expresa el nombre del gen pero es demasiado largo y quisiera solo trabajar con el GeneID.

Por ejemplo, de

Dbxref=GeneID:105370384;Name=LOC105370384
Dbxref=GeneID:128869,HGNC:HGNC:15791,HPRD:12250,MIM:608528;Name=PIGU

quisiera mantener en esa columna solo 105370384 y 128869
manteniendo los valores ...
Read more : Edición en columna de tabla | Vistas : 1661 | Respuestas : 3


Duda sencilla sobre algoritmo de traducción ADN-Proteina

Hola a todos y muchas gracias por el trabajo que realizáis. No sabéis qué bien me ha venido vuestra ayuda.

Actualmente estoy haciendo un máster de bioinformática, pero vengo de la rama de biología y estoy aprendiendo programación. Mi duda es "teórica" más que "práctica" y viene con este algoritmo para dado un codón convertirlo en aminoácido.

$codon = <STDIN>;
if ( $codon =~ /GC./i) { print 'A'; } # Alanine
elsif ( $codon ...
Read more : Duda sencilla sobre algoritmo de traducción ADN-Proteina | Vistas : 1351 | Respuestas : 1


Extraer palabras con múltiples opciones

Hola.

¿Cómo hago para agregar una búsqueda y extracción de diferentes combinaciones de palabras?

Tengo un archivo de texto como este:
#name_file
Bacteria;WS3;PRR-12;SSS58A 0.0 0.12 0.6
Bacteria;WS3;PRR-12;Sediment-1 0.5 0.1 0.3
Bacteria;Terrabacteria_group;Firmicutes;Bacilli; unclassified_Bacillales;Bacillaceae;Vulcanibacillu 0.2 0.2 0.6
Bacteria;Terrabacteria_group;Firmicutes;Bacilli;Bacillales;Bacillaceae;Vulcanibacillu 0.2 0.2 0.6
Bacteria;Terrabacteria_group;Firmicutes;Bacilli;Bacillales;Bacillales_incertae_sedis;Bacillales_Family_X 0.1 0.3 0.5
Bacteria;Terrabacteria_group;Firmicutes;Bacilli;Bacillales;Bacillales_incertae_sedis;Bacillales_Family_X._Incertae_Sedis;Thermicanus 0.4 0.13 0.9
Bacteria;Nitrospirae;Nitrospira;Nitrospirales;Thermodesulfovibrionaceae 0.1 0.2 0.6
Bacteria;Nitrospirae;Nitrospira;Nitrospirales;Thermodesulfovibrionaceae;BD2-6 0.0 0.0 0.6
Bacteria;PVC_group;Lentisphaerae;Lentisphaeria;Lentisphaerales 0.7 0.2 0.1
y quiero extraer la primera, y si existe, una segunda palabra (pero no la tercera) que ...
Read more : Extraer palabras con múltiples opciones | Vistas : 1554 | Respuestas : 3


Ayuda buscar en y lista de resultado

Hola, grupo. Solicito de su ayuda para resolver un problema. Espero explicar bien el problema para que puedan ayudar a la solución.

Resulta que tengo la siguiente lista de genes abreviados:
ACY1
RNA5S1
USP12-AS1
TRAJ23
ZFAT
Y deseo buscar cada uno en el siguiente archivo de nombres:
Approved Symbol Approved Name
A2MP1 alpha-2-macroglobulin pseudogene 1
ACY1 aminoacylase 1
SLIT2 slit guidance ligand 2
RN7SL843P RNA, 7SL, cytoplasmic 843, pseudogene
SP9YP24 ubiquitin specific peptidase 9, Y-linked ...
Read more : Ayuda buscar en y lista de resultado | Vistas : 1334 | Respuestas : 1


 

Identificarte  •  Registrarse


Estadísticas

Mensajes totales 36890 • Temas totales 7432 • Usuarios totales 1981