Foro - Perl en Español

por **jalapea** » 2015-03-25 10:13 @467

Un buen día. Estoy tratando de realizar una matriz para simular mutaciones.
La característica de la matriz sería:

filas igual a los 64 codones
columna 1 igual a exones

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

          codón 1          codón 2   codón 3 ...  codón n

          UUU             UUC      UUG            ...

exon 1    frecuencia

          de mutación

exon 2

exon 3

.

.

.

exon mColoreado en 0.000 segundos,  usando GeSHi 1.0.8.4

Lo anterior sería el esquema de la matriz.

¿Me podrían colaborar en cuáles serían los pasos para empezar a crear el script en Perl?

Les agradezco su colaboración.

Les solicito su colaboración con lo siguiente.

Teniendo los siguientes datos:

my $secuencia1 = "TCACTCACTCACACCTCCCGCAGCTCACCTCCTCCCCACCCCAGCATGGCCGCGTCCACC";
my $secuencia1 = "GGATGCTTATTATAGATCGACGCGACACCAGCGCCCGGTGCCAGGTTCTCCCCTGAGGCT";
my $secuencia1 = "GGAAGGTGGCGGTGGTGAAGGTGCAGGCCGTTGGGGCGGCTCAGAGGCAGAGTTCCACAG";

my(%genetic_code) = (

'TCA', # Serine 'S'
'TCC', # Serine 'S'
'TCG', # Serine 'S'
'TCT', # Serine 'S'
'TTC', # Phenylalanine 'F'
'TTT', # Phenylalanine 'F'
'TTA', # Leucine 'L'
'TTG', # Leucine 'L'
'TAC', # Tyrosine 'Y'
'TAT', # Tyrosine 'Y'
'TAA', # Stop '_'
'TAG', # Stop '_'
'TGC', # Cysteine 'C'
'TGT', # Cysteine 'C'
'TGA', # Stop '_'
'TGG', # Tryptophan 'W'
'CTA', # Leucine 'L'
'CTC', # Leucine 'L'
'CTG', # Leucine 'L'
'CTT', # Leucine 'L'
'CCA', # Proline 'P'
'CCC', # Proline 'P'
'CCG', # Proline 'P'
'CCT', # Proline 'P'
'CAC', # Histidine 'H'
'CAT', # Histidine 'H'
'CAA', # Glutamine 'Q'
'CAG', # Glutamine 'Q'
'CGA', # Arginine 'R'
'CGC', # Arginine 'R'
'CGG', # Arginine 'R'
'CGT', # Arginine 'R'
'ATA', # Isoleucine 'I'
'ATC', # Isoleucine 'I'
'ATT', # Isoleucine 'I'
'ATG', # Methionine 'M'
'ACA', # Threonine 'T'
'ACC', # Threonine 'T'
'ACG', # Threonine 'T'
'ACT', # Threonine 'T'
'AAC', # Asparagine 'N'
'AAT', # Asparagine 'N'
'AAA', # Lysine 'K'
'AAG', # Lysine 'K'
'AGC', # Serine 'S'
'AGT', # Serine 'S'
'AGA', # Arginine 'R'
'AGG', # Arginine 'R'
'GTA', # Valine 'V'
'GTC', # Valine 'V'
'GTG', # Valine 'V'
'GTT', # Valine 'V'
'GCA', # Alanine 'A'
'GCC', # Alanine 'A'
'GCG', # Alanine 'A'
'GCT', # Alanine 'A'
'GAC', # Aspartic Acid 'D'
'GAT', # Aspartic Acid 'D'
'GAA', # Glutamic Acid 'E'
'GAG', # Glutamic Acid 'E'
'GGA', # Glycine 'G'
'GGC', # Glycine 'G'
'GGG', # Glycine 'G'
'GGT', # Glycine 'G'
);

Después de mutar 1000 veces cada secuencia, se arroje el porcentaje de mutación de cada codón (arreglo del código genético), para poder graficar cómo sería la distribución del porcentaje de mutaciones, por secuencia y en la totalidad de secuencias.

Les agradezco su colaboración.

por **explorer** » 2015-05-09 05:04 @253

¿Has hecho ya la parte de mutar 1000 veces?

por **jalapea** » 2015-05-12 01:25 @101

explorer, un buen día. Lo que llevo hasta el momento es:

#!/usr/bin/perl -w

# using a random number generator to randomly select bases to mutate
use strict;
use warnings;
# Declare the variables
# The DNA is chosen to make it easy to see mutations:
my (%secuencias) = 'TCACTCACTCACACCTCCCGCAGCTCACCTCCTCCCCACCCCAGCATGGCCGCGTCCACC', 'GGATGCTTATTATAGATCGACGCGACACCAGCGCCCGGTGCCAGGTTCTCCCCTGAGGC', 'GGAAGGTGGCGGTGGTGAAGGTGCAGGCCGTTGGGGCGGCTCAGAGGCAGAGTTCCAC';
my $i;
my $mutant;
# Seed the random number generator.
# time|$$ combines the current time with the current process id
srand(time|$$);
# Let's test it, shall we?
$mutant = mutate(%secuencias);
print "\nMutate secuencias\n\n";
print "\nHere is the original DNA:\n\n";
print "%secuencias\n";
print "\nHere is the mutant secuencias:\n\n";
print "%mutant\n";
# Let's put it in a loop and watch that bad boy accumulate mutations:
print "\nHere are 1000 more successive mutations:\n\n";
for ($i=0 ; $i < 1000 ; ++$i) {
%mutant = mutate(%mutant);
print "$mutant\n"; }
exit;

#########################
# Subroutines
#########################
# Notice, now that we have a fair number of subroutines, we
# list them alphabetically
# A subroutine to perform a mutation in a string of DNA
#
# WARNING: make sure you call srand to seed the
# random number generator before you call this function.
sub mutate {
my(%secuencias) = @_;

my(@geneticcode) = (
'TCA', # Serine 'S'
'TCC', # Serine 'S'
'TCG', # Serine 'S'
'TCT', # Serine 'S'
'TTC', # Phenylalanine 'F'
'TTT', # Phenylalanine 'F'
'TTA', # Leucine 'L'
'TTG', # Leucine 'L'
'TAC', # Tyrosine 'Y'
'TAT', # Tyrosine 'Y'
'TAA', # Stop '_'
'TAG', # Stop '_'
'TGC', # Cysteine 'C'
'TGT', # Cysteine 'C'
'TGA', # Stop '_'
'TGG', # Tryptophan 'W'
'CTA', # Leucine 'L'
'CTC', # Leucine 'L'
'CTG', # Leucine 'L'
'CTT', # Leucine 'L'
'CCA', # Proline 'P'
'CCC', # Proline 'P'
'CCG', # Proline 'P'
'CCT', # Proline 'P'
'CAC', # Histidine 'H'
'CAT', # Histidine 'H'
'CAA', # Glutamine 'Q'
'CAG', # Glutamine 'Q'
'CGA', # Arginine 'R'
'CGC', # Arginine 'R'
'CGG', # Arginine 'R'
'CGT', # Arginine 'R'
'ATA', # Isoleucine 'I'
'ATC', # Isoleucine 'I'
'ATT', # Isoleucine 'I'
'ATG', # Methionine 'M'
'ACA', # Threonine 'T'
'ACC', # Threonine 'T'
'ACG', # Threonine 'T'
'ACT', # Threonine 'T'
'AAC', # Asparagine 'N'
'AAT', # Asparagine 'N'
'AAA', # Lysine 'K'
'AAG', # Lysine 'K'
'AGC', # Serine 'S'
'AGT', # Serine 'S'
'AGA', # Arginine 'R'
'AGG', # Arginine 'R'
'GTA', # Valine 'V'
'GTC', # Valine 'V'
'GTG', # Valine 'V'
'GTT', # Valine 'V'
'GCA', # Alanine 'A'
'GCC', # Alanine 'A'
'GCG', # Alanine 'A'
'GCT', # Alanine 'A'
'GAC', # Aspartic Acid 'D'
'GAT', # Aspartic Acid 'D'
'GAA', # Glutamic Acid 'E'
'GAG', # Glutamic Acid 'E'
'GGA', # Glycine 'G'
'GGC', # Glycine 'G'
'GGG', # Glycine 'G'
'GGT', # Glycine 'G'
);

my($position) = randomposition(%sequencias);
my($newbase) = randomnucleotide(@geneticcode);
# Insert the random geneticcode into the random position in the DNA
# The substr arguments mean the following:
# In the string %secuencias at position $position change 1 character to
# the string in $newbase
substr(%secuencia,$position,1,$newbase);
return %secuencia; }

# A subroutine to randomly select an element from an array
# WARNING: make sure you call srand to seed the
# random number generator before you call this function.
sub randomelement {
my(@array) = @_;
return $array[rand @array];
}

# randomnucleotide
# A subroutine to select at random one of the four nucleotides
# WARNING: make sure you call srand to seed the
# random number generator before you call this function.
sub randomnucleotide {
my(@geneticcode) = (
'TCA', # Serine 'S'
'TCC', # Serine 'S'
'TCG', # Serine 'S'
'TCT', # Serine 'S'
'TTC', # Phenylalanine 'F'
'TTT', # Phenylalanine 'F'
'TTA', # Leucine 'L'
'TTG', # Leucine 'L'
'TAC', # Tyrosine 'Y'
'TAT', # Tyrosine 'Y'
'TAA', # Stop '_'
'TAG', # Stop '_'
'TGC', # Cysteine 'C'
'TGT', # Cysteine 'C'
'TGA', # Stop '_'
'TGG', # Tryptophan 'W'
'CTA', # Leucine 'L'
'CTC', # Leucine 'L'
'CTG', # Leucine 'L'
'CTT', # Leucine 'L'
'CCA', # Proline 'P'
'CCC', # Proline 'P'
'CCG', # Proline 'P'
'CCT', # Proline 'P'
'CAC', # Histidine 'H'
'CAT', # Histidine 'H'
'CAA', # Glutamine 'Q'
'CAG', # Glutamine 'Q'
'CGA', # Arginine 'R'
'CGC', # Arginine 'R'
'CGG', # Arginine 'R'
'CGT', # Arginine 'R'
'ATA', # Isoleucine 'I'
'ATC', # Isoleucine 'I'
'ATT', # Isoleucine 'I'
'ATG', # Methionine 'M'
'ACA', # Threonine 'T'
'ACC', # Threonine 'T'
'ACG', # Threonine 'T'
'ACT', # Threonine 'T'
'AAC', # Asparagine 'N'
'AAT', # Asparagine 'N'
'AAA', # Lysine 'K'
'AAG', # Lysine 'K'
'AGC', # Serine 'S'
'AGT', # Serine 'S'
'AGA', # Arginine 'R'
'AGG', # Arginine 'R'
'GTA', # Valine 'V'
'GTC', # Valine 'V'
'GTG', # Valine 'V'
'GTT', # Valine 'V'
'GCA', # Alanine 'A'
'GCC', # Alanine 'A'
'GCG', # Alanine 'A'
'GCT', # Alanine 'A'
'GAC', # Aspartic Acid 'D'
'GAT', # Aspartic Acid 'D'
'GAA', # Glutamic Acid 'E'
'GAG', # Glutamic Acid 'E'
'GGA', # Glycine 'G'
'GGC', # Glycine 'G'
'GGG', # Glycine 'G'
'GGT', # Glycine 'G'
);

# scalar returns the size of an array.
# The elements of the array are numbered 0 to size-1
return randomelement(@geneticcode);
}

# randomposition
# A subroutine to randomly select a position in a string.
# WARNING: make sure you call srand to seed the
# random number generator before you call this function.
sub randomposition {
my($string) = @_;
# The whole expression returns a random number between 0 and
length-1, which is how the positions in a string are numbered in Perl.
return int rand length $string;
}

Pero no he podido correrlo.

por **explorer** » 2015-05-12 05:46 @282

Si corremos el programa con la opción '-c', hace la fase de compilación, y nos dirá qué pasa:

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

> perl -c mutacion.pl 

Warning: Use of "length-1" without parentheses is ambiguous at mutacion.pl line 216.

Global symbol "%mutant" requires explicit package name at mutacion.pl line 32.

Global symbol "%mutant" requires explicit package name at mutacion.pl line 32.

Global symbol "%sequencias" requires explicit package name at mutacion.pl line 115.

Global symbol "%secuencia" requires explicit package name at mutacion.pl line 121.

Global symbol "%secuencia" requires explicit package name at mutacion.pl line 122.

mutacion.pl had compilation errors.Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

Perl te dice exactamente qué errores tienes en el código.

No está muy claro qué quieres hacer. Sabemos que hay unas secuencias y que quieres luego meterle 1000 mutaciones, se supone que luego para sacar estadísticas, pero lo que no sabemos es cómo hay que comparar las secuencias mutadas con los codones.

Tu código es remiendo de varios otros códigos. Has copiado y pegado partes de varios programas, de estos foros, supongo. Pero es que de esa manera no obtendrás lo que quieres.

Es como mezclar código genético y que de ahí salga una secuencia que pueda generar algo viable.

Esta es una versión que solo muta:

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

#!/usr/bin/perl
#
#       Generador de mutaciones en secuencias
#
# Joaquín Ferrero, 2015
#
# v20150512 - Primera versión
#
 
use strict;
use warnings;
 
# Ajustamos el generador de números aleatorios
# time|$$ combina la hora y fecha actuales con el identificados del proceso actual
srand(time|$$);
 
# Listado de codones disponibles
my(@codones) = (
    'TCA', # Serine 'S'
    'TCC', # Serine 'S'
    'TCG', # Serine 'S'
    'TCT', # Serine 'S'
    'TTC', # Phenylalanine 'F'
    'TTT', # Phenylalanine 'F'
    'TTA', # Leucine 'L'
    'TTG', # Leucine 'L'
    'TAC', # Tyrosine 'Y'
    'TAT', # Tyrosine 'Y'
    'TAA', # Stop '_'
    'TAG', # Stop '_'
    'TGC', # Cysteine 'C'
    'TGT', # Cysteine 'C'
    'TGA', # Stop '_'
    'TGG', # Tryptophan 'W'
    'CTA', # Leucine 'L'
    'CTC', # Leucine 'L'
    'CTG', # Leucine 'L'
    'CTT', # Leucine 'L'
    'CCA', # Proline 'P'
    'CCC', # Proline 'P'
    'CCG', # Proline 'P'
    'CCT', # Proline 'P'
    'CAC', # Histidine 'H'
    'CAT', # Histidine 'H'
    'CAA', # Glutamine 'Q'
    'CAG', # Glutamine 'Q'
    'CGA', # Arginine 'R'
    'CGC', # Arginine 'R'
    'CGG', # Arginine 'R'
    'CGT', # Arginine 'R'
    'ATA', # Isoleucine 'I'
    'ATC', # Isoleucine 'I'
    'ATT', # Isoleucine 'I'
    'ATG', # Methionine 'M'
    'ACA', # Threonine 'T'
    'ACC', # Threonine 'T'
    'ACG', # Threonine 'T'
    'ACT', # Threonine 'T'
    'AAC', # Asparagine 'N'
    'AAT', # Asparagine 'N'
    'AAA', # Lysine 'K'
    'AAG', # Lysine 'K'
    'AGC', # Serine 'S'
    'AGT', # Serine 'S'
    'AGA', # Arginine 'R'
    'AGG', # Arginine 'R'
    'GTA', # Valine 'V'
    'GTC', # Valine 'V'
    'GTG', # Valine 'V'
    'GTT', # Valine 'V'
    'GCA', # Alanine 'A'
    'GCC', # Alanine 'A'
    'GCG', # Alanine 'A'
    'GCT', # Alanine 'A'
    'GAC', # Aspartic Acid 'D'
    'GAT', # Aspartic Acid 'D'
    'GAA', # Glutamic Acid 'E'
    'GAG', # Glutamic Acid 'E'
    'GGA', # Glycine 'G'
    'GGC', # Glycine 'G'
    'GGG', # Glycine 'G'
    'GGT', # Glycine 'G'
);
 
 
# Secuencias génicas a mutar
my @secuencias = qw(
    TCACTCACTCACACCTCCCGCAGCTCACCTCCTCCCCACCCCAGCATGGCCGCGTCCACC
    GGATGCTTATTATAGATCGACGCGACACCAGCGCCCGGTGCCAGGTTCTCCCCTGAGGC
    GGAAGGTGGCGGTGGTGAAGGTGCAGGCCGTTGGGGCGGCTCAGAGGCAGAGTTCCAC
);
 
 
# Proceso
for my $seq (@secuencias) {
 
    print "Original: [$seq]\n";
    for my $i (1 .. 1000) {
        $seq = muta($seq);
    }
    print "Mutada:   [$seq]\n";
}
 
sub muta {
    my($seq) = shift;
 
    my($posicion)  = posicion_aleatorio($seq);
    my($nuevabase) = nucleotico_aleatorio();
 
    # Insertar la $nuevabase en la $posicion dentro de $seq
    substr($seq, $posicion, 1) = $nuevabase;
 
    return $seq;
}
 
sub posicion_aleatorio {
    my($cadena) = shift;
 
    return int rand length $cadena;
}
 
sub nucleotico_aleatorio {
    return ('A','T','C','G')[rand 4];
}
 
__END__
Coloreado en 0.010 segundos,  usando GeSHi 1.0.8.4

Foro - Perl en Español

Simular mutaciones dentro de una matriz

Simular mutaciones dentro de una matriz

Publicidad

Re: Simular mutaciones dentro de una matriz

Re: Simular mutaciones dentro de una matriz

Re: Simular mutaciones dentro de una matriz

Re: Simular mutaciones dentro de una matriz

Re: Simular mutaciones dentro de una matriz

¿Quién está conectado?