¡Hola!
Mira tengo un problema: necesito extraer palabras de 8 nucleótidos de la siguiente forma:
Tengo mi secuencia:
CTGTGAAGGAACTT...La primera palabra sería:
CTGTGAAG Para la segunda palabra tiene que correr un espacio y empezar a correr los 8 nucleótidos desde el segundo nucleótido de la primera palabra, es decir, ambas palabras quedarían así:
Using text Syntax Highlighting
CTGTGAAG primera palabra
TGTGAAGG segunda
GTGAAGGA tercera
TGAAGGAC cuarta
GAAGGAGT quinta
AAGGAGTT sexta
Coloreado en 0.000 segundos, usando
GeSHi 1.0.8.4
Luego tengo que hacer un conteo de esas palabras para saber cuántas veces se repiten cada una de ellas en toda la secuencia.
Se me ocurre hacer un
hash donde la llave sea la palabra y el valor sea el número de veces que está, es decir, si la vio por primera vez el valor es 1, y si la vio por segunda vez el valor es 2, y así sucesivamente pero no tengo idea de cómo hacer esto. ¿Podrían ayudarme?
¡Gracias!