¿Cómo podría buscar cada ORF (ATG) hasta un STOP (TAA, TAG, TGA) guardando cada triplete desde ATG hasta STOP en un arreglo? Debido a que es un genoma y necesito sacar los marcos de lecturas.
Llevo esto:
#!/usr/bin/perl
use strict;
use warnings;
my $cadena = '';
my $file = 'archivo.fna'; # archivo .fna que contiene el #genoma de un procariota
if ( -e $file ) {
open IN, "<$file" or die "No pasa nada ...