Este es mi primer mensaje en el foro, ya que soy un aprendiz de Perl.
Mi problema es el siguiente:
Debo encontrar la forma (si es que existe) de extraer de varios textos las combinaciones entre palabras de una lista dada de palabras. Estamos hablando de 140 textos y una lista de alrededor de 1.300 palabras. Se trataría de ver cómo esos términos se repiten/combinan entre ellos en dichos textos.
El primer paso sería almacenar en una tabla Hash el listado de las palabras y las posibles combinaciones entre ellas.
Había pensado en realizar una aplicación con la siguiente estructura (os la pongo es pseudo-código):
- Código: Seleccionar todo
for each file {
for each word in current file {
search for this word in keyword list hash table
search for previous word in keyword list hash table
if both are keywords {
search for this combination in list of combinations, and increase count by one
}
}
}
Os lo pongo en inglés porque lo tengo que desarrollar en dicho idioma, si alguien tiene algún problema que me lo diga
Espero que me aconsejeis sobre la mejor manera de realizarlo, y si estoy equivocado en el planteamiento de la estructura, admito sugerencias, recomendaciones, ayudas...
Un saludo y muchas gracias!!!