℞ 23: Obtener la categoría de un carácterUnicode es un conjunto de caracteres y una lista de reglas y propiedades aplicadas a estos caracteres. La
Base de datos de Caracteres Unicode reúne estas propiedades. El módulo principal
Unicode::UCD ofrece acceso a estas propiedades.
Estas propiedades generales agrupan los caracteres en grupos, como caracteres en mayúscula, minúscula, símbolos de puntuación, símbolos matemáticos, y más. (Vea general_categories() de Unicode::UCD, para más información).
La función charinfo() devuelve una referencia a un hash conteniendo abundante información sobre el carácter Unicode carácter en cuestión. En particular, el valor de 'category' contiene el nombre abreviado de la categoría del carácter.
Para encontrar la categoría general de un código de carácter numérico:
Using perl Syntax Highlighting
use Unicode::UCD qw(charinfo);
my $cat = charinfo(0x3A3)->{category}; # "Lu"
Coloreado en 0.001 segundos, usando
GeSHi 1.0.8.4
Para traducir esta categoría en algo más amigable:
Using perl Syntax Highlighting
use Unicode::UCD qw( charinfo general_categories );
my $categories = general_categories();
my $cat = charinfo(0x3A3)->{category}; # "Lu"
my $full_cat = $categories{ $cat }; # "UppercaseLetter" (Mayúscula)
Coloreado en 0.001 segundos, usando
GeSHi 1.0.8.4
Artículo original (en inglés)