Sitios de restricción de ADN
Publicado: 2010-12-06 13:16 @595
Compañeros:
Una vez más solicitando su ayuda. Deseo crear un script que me devuelva secuencias de ADN que se encuentra entre dos pequeñas secuencias del mismo patrón. Las secuencias de ADN se encuentran en un archivo .txt, y el usuario puede definir que patrón buscar y el archivo a introducir.
Es algo como esto: quiero extraer las secuencias que se encuentran entre el patrón ATC
CATCTAAAAGTGCGTAGATC
GTGTACCAACAGGAGGCTTG
TGTCAGATGAATACACTTGT
TGGGCGTGTTATTAATAAGA
ACTCGCATTCGCCTAGAGAA
CATCTAAAAGTGCGTAGATC
GTGTACCAACAGGAGGCTTG
TGTCAGATGAATACACTTGT
Deseo que se extraigan secuencias de toda la secuencia, y línea por línea. Además, deseo conocer la longitud de cada secuencia extraída. Algo así:
TAAAAGTGCGTAG 13
GTGTACCAACAGGAGGCTTGTGTCAGATGAATACACTTGTTGGGCGTGTTATTAATAAGAACTCGCATTCGCCTAGAGAAC 81
TAAAAGTGCGTAG 13
Lo más a lo que he llegado es a este script:
Pero no me funciona, además soy malo con las regex. ¿Alguna recomendación?
¡Muchas gracias de antemano!
UPDATE: coloqué mal el patrón, el patrón es ATC.
Una vez más solicitando su ayuda. Deseo crear un script que me devuelva secuencias de ADN que se encuentra entre dos pequeñas secuencias del mismo patrón. Las secuencias de ADN se encuentran en un archivo .txt, y el usuario puede definir que patrón buscar y el archivo a introducir.
Es algo como esto: quiero extraer las secuencias que se encuentran entre el patrón ATC
CATCTAAAAGTGCGTAGATC
GTGTACCAACAGGAGGCTTG
TGTCAGATGAATACACTTGT
TGGGCGTGTTATTAATAAGA
ACTCGCATTCGCCTAGAGAA
CATCTAAAAGTGCGTAGATC
GTGTACCAACAGGAGGCTTG
TGTCAGATGAATACACTTGT
Deseo que se extraigan secuencias de toda la secuencia, y línea por línea. Además, deseo conocer la longitud de cada secuencia extraída. Algo así:
TAAAAGTGCGTAG 13
GTGTACCAACAGGAGGCTTGTGTCAGATGAATACACTTGTTGGGCGTGTTATTAATAAGAACTCGCATTCGCCTAGAGAAC 81
TAAAAGTGCGTAG 13
Lo más a lo que he llegado es a este script:
Using perl Syntax Highlighting
- #!/usr/bin/perl
- # digest.pl
- use strict; use warnings;
- die "usage: digest.pl <pattern> <file>" unless @ARGV ==2;
- my $pattern = $ARGV[0];
- print "The pattern is: $pattern\n";
- open (FILE, $ARGV[1]);
- while (<FILE>) {
- if (/$pattern/../$pattern/) {
- print "$. $_\n";
- }
- }
Coloreado en 0.002 segundos, usando GeSHi 1.0.8.4
Pero no me funciona, además soy malo con las regex. ¿Alguna recomendación?
¡Muchas gracias de antemano!
UPDATE: coloqué mal el patrón, el patrón es ATC.