Cómo contar y buscar cadenas en secuencias nucleótidas
Publicado: 2011-12-01 00:18 @054
Hola. Soy estudiante de bioinformática. Tengo una duda en cómo busco y cuento una cadena en un secuencia. Está basado sobre el siguiente problema:
Tengo una secuencia...
GAGTTTTATCGCTTCCATGACGCAGAAGTTAACACTTTCGGATATTTCTAATGAGTCGAAAAATTATCTT
y deseo buscar cuántas veces se repite una cadena de dos letras, vale decir, cuántas veces AT, TA, CG, GC, GT, AC.... (en fin, todas las posibilidades en dos letras de espacio), se encuentran en la secuencia.
Ejemplo:
SECUENCIA= GGGTAGGCTAGGATCGGGTACGTCACGGGTATGCA
STRING=GG
RESULTADO: SE HAN ENCONTRADO 8 VECES ESTE STRING (GG) EN LA SECUENCIA.
Me decían que con match se solucionaba, pero aún no lo entiendo del todo.
Tengo una secuencia...
GAGTTTTATCGCTTCCATGACGCAGAAGTTAACACTTTCGGATATTTCTAATGAGTCGAAAAATTATCTT
y deseo buscar cuántas veces se repite una cadena de dos letras, vale decir, cuántas veces AT, TA, CG, GC, GT, AC.... (en fin, todas las posibilidades en dos letras de espacio), se encuentran en la secuencia.
Ejemplo:
SECUENCIA= GGGTAGGCTAGGATCGGGTACGTCACGGGTATGCA
STRING=GG
RESULTADO: SE HAN ENCONTRADO 8 VECES ESTE STRING (GG) EN LA SECUENCIA.
Me decían que con match se solucionaba, pero aún no lo entiendo del todo.