Foro - Perl en Español

Buenas. Estaba mirando un programa que han subido aquí y no entiendo muy bien este trozo de código.

my @orfs = $sequence =~ /(ATG(?:.{3})*?)(TAA|TAG|TGA|.{1,3}$)/g;

Muchas gracias.

Buenas.

Me están pidiendo que diga las posiciones en un array que presenten el valor mínimo. Ando un poco liado con esto. Si alguien me puede ayudar...

Muchas gracias.

Hola, buenos días. Tengo un script que lo uso para extraer asignaciones taxonómicas de lo obtenido con qiime. Está desarrollado para extraer cada asignación por separado de los archivos obtenidos en el formato de Silva y el de GreenGenes. Sin embargo, en la línea
my @kingd=($taxon_value=~m/D_0__(.*);D_1|k__(.*);p__/g);
que es donde está las opciones para los dos formatos, tengo un problema que me arroja este mensaje: Use of uninitialized value $_ in pattern match (m//) at ...

Hola, buenos días. Tengo este código en Perl que modifiqué de acuerdo a lo que requiero de uno ya existente, para extraer secuencias usando el ID en un archivo .txt. Sin embargo, el archivo de salida me arroja las secuencias con los ID del archivo.txt y yo lo que quiero es que salga todo el nombre original de cada secuencia.

>Z85.T_1177507 Z85s 9PG0M:00018:00019 orig_bc= new_bc= bc_diffs=0
ACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATGGGTTGTAAAGCACTTTCAGTAGGGAGGAAAACTTGGGAATTAATACCCCCCAA
>X89.T_24577341 X89s 9PG0M:00022:00033 orig_bc= new_bc= bc_diffs=0
CGATTACTAGCGATTCCGACTGAATTGCAGACTCCAATCCGGATTTGCTTCCCCTCGCGGGCTTGCGACCCTCTGTGCCGACCATTGTAGCACGTGAGTA ...

Hola, he creado este script para extraer múltiples secuencias contenidas en una carpeta en formato fastq y pasarlas a formato fasta y que mantenga el mismo nombre de cada archivo fastq:

#!/usr/bin/perl

use strict;
use warnings;
use Getopt::Long;

my ($dir, $files, $file_name, $file_format, $extension);

GetOptions (
'dr=s' =>\$dir
);

foreach $files (glob("$dir/*.fastq")) {
open LINE, "<", $files or die "can't read open $files";
while(
defined(my $head = <LINE>) &&
defined(my $seq = <LINE>) && ...

Hola.

Soy nuevo en el foro, y quería pedir una ayuda. Soy biólogo y no me manejo mucho en programación.

Tengo un archivo fasta con cerca de 2 millones de registros, que apenas lo puedo abrir en un procesador de texto. Los registros se encuentran de la siguiente forma.
>SRR1517819.1.1
TNTCATCGAGACAGACTGTGAGGTGGATTTTGCACCTCCTCTGGATTACAAGGAACCTGAAAGGCCTGTTGCAACTGTTCCTTCAGGCAAGGCACCATCACAAGTTGAAGAGATTCCAGCTGAGACCGAACCAAAATTCAAC
>SRR1517819.1.2
GTTGAATTTTGGTTCGGTCTCAGCTGGAATCTCTTCAACTTGTGATGGTGCCTTGCCTGAAGGAACAGTTGCAACAGGCCTTTCAGGTTCCTTGTAATCCAGAGGAGGTGCAAAATCCACCTCACAGTCTGTCTCGATGATA
>SRR1517819.2.1
CNTATACATTTCAATTTACAATTTCAACATAAAACAGAAATAAAATGATAATATAATGTTTACATCTGGAATATACAATTATTGATTAACAAGCCCGTATCGGTTAGTATTTTTTTTTTTTGGGTAACGAGGATCCCACCCGTATTTAAGT
>SRR1517819.2.2
ATAAGTTCCATCCTTCTGGGGGTTGTGTGCAACAAATGGATTTTACAACTTAAGTGTCAATTCCTTGAAGATCTGTCACTACTTAAATACGGGTGGGATCCTCGTTACCCAAAAAAAAAAAATACTAACCGATACGGGCTTGTTAATCAAT
>SRR1517819.3.1
CNGTAATGAAACAAGACATAAGACCAGCTCTCAAGGACATTGTTTGGACCTGGCAAGGGGAGCCGCAGCAGCAGCAGCATCAGCATCAAGAACAACTACAACTAGAGGAACAAGAGCTACAGCCTTCTCAAGCACTCCCAATG
>SRR1517819.3.2
CATTGGGAGTGCTTGAGAAGGCTGTAGCTCTTGTTCCTCTAGTTGTAGTTGTTCTTGATGCTGATGCTGCTGCTGCTGCGGCTCCCCTTGCCAGGTCCAAACAATGTCCTTGAGAGCTGGTCTTATGTCTTGTTTCATTACCG
>SRR1517819.4.1
CNCTGGTACTATTGCAACATAAGCACTCTCAAAAAAAGAAACAAGTAGCATTGACACAAAACAGATTTTGACTAGATAGCAACTGAGATAATGCTCTAATCGAAGAGTGAGAATCCCATATCTTCATCTTCGC
>SRR1517819.4.2
GCGAAGATGAAGATATGGGATTCTCACTCTTCGATTAGAGCATTATCTCAGTTGCTATCTAGTCAAAATCTGTTTTGTGTCAATGCTACTTGTTTCTTTTTTTGAGAGTGCTTATGTTGCAATAGTACCAGAG

Como se observa, todos los id terminan en '.1' ...

Hola chicos:

Espero alguien me pudiera ayudar para editar la información de una tabla mediante línea de comandos ya que soy nuevo en esto.

La tabla que tengo presenta la siguiente información en el .txt adjunto.
En la columna de logFC se expresa el nombre del gen pero es demasiado largo y quisiera solo trabajar con el GeneID.

Por ejemplo, de

Dbxref=GeneID:105370384;Name=LOC105370384
Dbxref=GeneID:128869,HGNC:HGNC:15791,HPRD:12250,MIM:608528;Name=PIGU

quisiera mantener en esa columna solo 105370384 y 128869
manteniendo los valores ...

Hola a todos y muchas gracias por el trabajo que realizáis. No sabéis qué bien me ha venido vuestra ayuda.

Actualmente estoy haciendo un máster de bioinformática, pero vengo de la rama de biología y estoy aprendiendo programación. Mi duda es "teórica" más que "práctica" y viene con este algoritmo para dado un codón convertirlo en aminoácido.

$codon = <STDIN>;
if ( $codon =~ /GC./i) { print 'A'; } # Alanine
elsif ( $codon ...

Hola.

¿Cómo hago para agregar una búsqueda y extracción de diferentes combinaciones de palabras?

Tengo un archivo de texto como este:
#name_file
Bacteria;WS3;PRR-12;SSS58A 0.0 0.12 0.6
Bacteria;WS3;PRR-12;Sediment-1 0.5 0.1 0.3
Bacteria;Terrabacteria_group;Firmicutes;Bacilli; unclassified_Bacillales;Bacillaceae;Vulcanibacillu 0.2 0.2 0.6
Bacteria;Terrabacteria_group;Firmicutes;Bacilli;Bacillales;Bacillaceae;Vulcanibacillu 0.2 0.2 0.6
Bacteria;Terrabacteria_group;Firmicutes;Bacilli;Bacillales;Bacillales_incertae_sedis;Bacillales_Family_X 0.1 0.3 0.5
Bacteria;Terrabacteria_group;Firmicutes;Bacilli;Bacillales;Bacillales_incertae_sedis;Bacillales_Family_X._Incertae_Sedis;Thermicanus 0.4 0.13 0.9
Bacteria;Nitrospirae;Nitrospira;Nitrospirales;Thermodesulfovibrionaceae 0.1 0.2 0.6
Bacteria;Nitrospirae;Nitrospira;Nitrospirales;Thermodesulfovibrionaceae;BD2-6 0.0 0.0 0.6
Bacteria;PVC_group;Lentisphaerae;Lentisphaeria;Lentisphaerales 0.7 0.2 0.1
y quiero extraer la primera, y si existe, una segunda palabra (pero no la tercera) que ...

Hola, grupo. Solicito de su ayuda para resolver un problema. Espero explicar bien el problema para que puedan ayudar a la solución.

Resulta que tengo la siguiente lista de genes abreviados:
ACY1
RNA5S1
USP12-AS1
TRAJ23
ZFAT
Y deseo buscar cada uno en el siguiente archivo de nombres:
Approved Symbol Approved Name
A2MP1 alpha-2-macroglobulin pseudogene 1
ACY1 aminoacylase 1
SLIT2 slit guidance ligand 2
RN7SL843P RNA, 7SL, cytoplasmic 843, pseudogene
SP9YP24 ubiquitin specific peptidase 9, Y-linked ...

Foro - Perl en Español

News of Bioinformática

Site map of Bioinformática » Foro : Bioinformática

Interpretación de una expresión regular

Posiciones de un array

Uso de valor no inicializado (Use of uninitialized value)

Extraer secuencias usando un archivo con los ID

De fastaq a fasta en subrutina

Cambio de Id en fasta

Edición en columna de tabla

Duda sencilla sobre algoritmo de traducción ADN-Proteina

Extraer palabras con múltiples opciones

Ayuda buscar en y lista de resultado

Last 10 active topics

Identificarte • Registrarse

Estadísticas