Re: 44 recetas para trabajar con Unicode en Perl
Publicado: 2012-05-26 08:37 @401
℞ 30: Extraer por grafema en lugar de por código de carácter (exp.reg.)
Recuerde que Unicode define un grafema como "lo que un usuario piensa que es un carácter". Un código de carácter es un valor entero en el espacio de código Unicode. Mientras que ASCII combina los dos, el uso efectivo de Unicode respeta la diferencia entre caracteres visibles por el usuario y sus representaciones.
Use el metacarácter de exp.reg. \X cuando necesite extraer grafemas de una cadena en lugar de códigos de carácter:
Artículo original (en inglés)
Recuerde que Unicode define un grafema como "lo que un usuario piensa que es un carácter". Un código de carácter es un valor entero en el espacio de código Unicode. Mientras que ASCII combina los dos, el uso efectivo de Unicode respeta la diferencia entre caracteres visibles por el usuario y sus representaciones.
Use el metacarácter de exp.reg. \X cuando necesite extraer grafemas de una cadena en lugar de códigos de carácter:
Using perl Syntax Highlighting
- # coincide y captura los cinco primeros grafemas
- my ($cinco_primeros) = $cadena =~ /^ ( \X{5} ) /x;
Coloreado en 0.003 segundos, usando GeSHi 1.0.8.4
Artículo original (en inglés)