Me gustaría saber qué tecnica puede ser la más efectiva para identificar edades en un texto. Está claro que no es suficiente con buscar la cadena "X años" ya que puede ser confundido con un periodo de tiempo (p.e trabajó durante 2 años).
observa que 'cumplió' puede aparecer en ambos casos: 'cumplió X años' (de condena) así que tendrás que tratarlo como un caso especial y poder diferenciarlo o no funcionará. Buscar la cadena "y un día" puede ayudar aquí.
2 - sacar la palabra anterior con un regexp 3 - bucle if() para comparar esa palabra
si existe en válidos seguido de número seguido de años o meses o días... hacer algo, por ej. print()
si existe en no_válidos seguido de número seguido de años o meses o días ... next
Registrado: 2005-07-24 18:12 @800 Ubicación: Valladolid, España Mensajes: 10260
Re: Identificación de edades
Sí, es muy complicado, pues lo ideal sería hacer una interpretación del significado de lo que se dice, y eso está algo alejado de los temas que tratamos aquí. Es más bien un trabajo de tesis doctoral
La forma sencilla es buscar por palabras clave ("edad", "años", "nacimiento", "fecha", "tiene", etc), extraer esas frases, e intentar filtrar los falsos positivos.
_________________ JF^DPerl programming
Página 1 de 1
[ 3 mensajes ]
Reglas del Foro
No puedes abrir nuevos temas en este Foro No puedes responder a temas en este Foro No puedes editar tus mensajes en este Foro No puedes borrar tus mensajes en este Foro No puedes enviar adjuntos en este Foro