Hola Explorer
No entiendo porqué la segunda columna tiene un 80% de similitud.
Por que:
Paso 1: tomo A2 de mi
alineamiento de referencia, y luego busco dónde se encuentra en el segundo alineamiento, o
alineamiento 1 (como muestra el esquema)
Paso 2: una vez encontrado éste comparo las columnas en donde se encuentran respectivamente (comparando los elementos de ésta), los primeros elementos son A2=A2 (iguales), luego B2=B2 (iguales), C2=C2 (iguales), D2 != D {1-2} (no iguales), E2=E2 (iguales). Entonces de los 5 elementos hay 4 iguales => 4/5 = 0.8.
Paso 3: tomo el siguiente elemento del
alineamiento de referencia y lo busco en el
alineamiento 1 que estoy comparando.
Paso 4: repito lo del paso 2 anterior, los elementos me dan 4 parecidos de 5, o sea 4/5 = 0.8.
Y así sucesivamente con cada elemento del alineamiento de referencia.
Y tampoco entiendo porqué eliges a los elementos A1, A2 y D3...
En realidad los elegí así para tener diferentes ejemplos, pero la realidad sería A1 A2 A3 y así sucesivamente y en orden, una vez terminado ese, sigo con B1 B2 B3... y luego con C1 C2... hasta el final y por cada uno de esos elementos hago los pasos descritos anteriormente.
Ni tampoco porqué la tercera columna del alineamiento de referencia se compara con la cuarta columna del alineamiento 1.
Esto porque, como digo anteriormente, primero me interesa buscar en el
alineamiento 1 el elemento que estoy mirando en mi
alineamiento de referencia, o sea si por ejemplo estoy en D3 (esto quiere decir que ya pase por todos los A...B....C....D1,D2) voy a buscar en qué columna del
alineamiento 1 está este D3, y bueno, en este ejemplo está en la cuarta columna del
alineamiento 1, lo que me interesa es el elemento, y no que éste en la misma columna, y una vez que lo encuentro comparo las columnas del
alineamiento de referencia y del
alineamiento 1 donde se encuentran el elemento común que estoy buscando.
Esto pasa porque con los
gap los elementos se corren de posición.
Y en cuanto a los "
gap" no es ni un valor nulo, ni un valor 0; en presencia de un
gap se pone un signo "-" o carácter si quieres llamarlo así, porque es una información, pero no un valor.
Eso, espero que haya quedado mas claro.
SALUDOS
Anexo:¿¿Qué es un alineamiento??
Las secuencias de ADN de cada especie (o de especies diferentes) son esquematizadas de la siguiente manera:
- Código: Seleccionar todo
>random sequence 1 consisting of 10 bases.
gaatcttttt
>random sequence 2 consisting of 10 bases.
cggcccggat
>random sequence 3 consisting of 10 bases.
gtacccggac
>random sequence 4 consisting of 10 bases.
gaccttccag
>random sequence 5 consisting of 10 bases.
gtatcaggtt
Para ver si estas secuencias perteneces a la misma especie o si son familiares se hace lo que se llama un "alineamiento". Hoy en día estos alineamientos se hace gracias a programas informáticos como "
clustal", entre otros. Sobre todo porque una secuencia tiene más de 10 pares de bases y más de 5 secuencias, como muestra el ejemplo...
¿¿Y en qué consiste este alineamiento?? Bueno, en tratar de poner los pares de bases (atcg) alineados para tratar de hacerlos los más similares posibles (obviamente si las secuencias lo permiten). Entonces estos programas alinean lo más posible, con ciertas reglas, claro está, y hay veces que el programa considera que se parecen pero que quizás, en el transcurso de la evolución, hay uno de estos pares de bases (agct) que se suprimió o que se insertó, y el programa pone un "
gap" que se ve con un signo "-". Bueno, entonces, por ejemplo ClustalW hace el alineamiento de la secuencia siguiente de esta manera:
- Código: Seleccionar todo
random_sequence_2 CGGCCCGGAT-
random_sequence_3 GTACCCGGAC-
random_sequence_5 GTATCAGGTT-
random_sequence_1 GAATCTTTTT-
random_sequence_4 -GACCTTCCAG
Lo que yo pretendo hacer es un programa de fiabilidad de alineamientos, por ello cojo un
alineamiento de referencia y lo comparo con otros alineamientos hechos con otros programas para ver la fiabilidad de estos.