Hola amigos.
La verdad es que sigo mucho los diferentes foros pero apenas participo...
Bueno, tengo una duda: en muchas ocasiones me encontrado con la necesidad de substituir caracteres latinos, por ejemplo acentos con sus equivalentes sin acentos. Hasta ahí todo fácil, tengo diferentes funciones que hacen esto. Cuando voy procesando grandes cantidades de texto siempre me surgen la duda de haberme dejado alguno pues por último hago una s/\W// para eliminar todo lo no sustituido anteriormente.
A veces sustituto centenares de miles de líneas. He leído mucho en busca de listados de estos caracteres latinos en diferentes idiomas y y sus equivalentes en ASCII... pero siempre me queda la duda de si me dejo alguno.
http://es.wikipedia.org/wiki/Alfabeto_latino
El problema se complica pues yo programo muchas cosas en Perl pero también en PHP.
Por ejemplo :
Con Perl convierto :
"el gancho como en ả ẳ ẩ ẻ ể ỉ ỏ ổ ở ủ ử en vietnamita. "
a un fichero en el disco:
el-gancho-como-en-a-a-a-e-e-i-o-o-o-u-u-en-vietnamita.txt
Luego cargo una tabla en MySQL con esa frase he intento buscar el fichero si existe en el disco.
En ambos casos trabajo con expresiones regulares incluyendo los mismos caracteres y me funciona pero siempre me queda la duda de haberme dejado de substituir correctamente algún carácter.
¿Existe algún módulo de Perl que realice esa función o algún script? Yo lo programaría a su equivalente en PHP.
Yn saludo y gracias...
¿ Ideas ?