Re: 44 recetas para trabajar con Unicode en Perl
Publicado: 2012-05-08 18:45 @822
℞ 20: Tamaño de caja en Unicode
La gestión del tamaño de caja en Unicode es muy diferente del de ASCII. Algo de la complejidad de Unicode viene del hecho de que los caracteres Unicode pueden cambiar dramáticamente cuando cambian de mayúsculas a minúsculas y al revés. Por ejemplo, el Griego tiene dos caracteres sigma minúscula, dependiendo de cuando la letra está en el medio (σ) o en el final (ς) de una palabra. El Griego solo tiene una sigma mayúscula (Σ). (Algunos textos clásicos griegos del periodo Heleno usan una variante de forma creciente de sigma llamada sigma lunate, o ϲ).
El tamaño de caja es importante para cuando se necesita cambiarlo y para realizar coincidencia sensible al tamaño de caja:
Artículo original (en inglés)
La gestión del tamaño de caja en Unicode es muy diferente del de ASCII. Algo de la complejidad de Unicode viene del hecho de que los caracteres Unicode pueden cambiar dramáticamente cuando cambian de mayúsculas a minúsculas y al revés. Por ejemplo, el Griego tiene dos caracteres sigma minúscula, dependiendo de cuando la letra está en el medio (σ) o en el final (ς) de una palabra. El Griego solo tiene una sigma mayúscula (Σ). (Algunos textos clásicos griegos del periodo Heleno usan una variante de forma creciente de sigma llamada sigma lunate, o ϲ).
El tamaño de caja es importante para cuando se necesita cambiarlo y para realizar coincidencia sensible al tamaño de caja:
Using perl Syntax Highlighting
- uc("henry ⅷ") # "HENRY Ⅷ"
- uc("tschüß") # "TSCHÜSS" note ß => SS
- # ambos son verdad:
- "tschüß" =~ /TSCHÜSS/i # note ß => SS
- "Σίσυφος" =~ /ΣΊΣΥΦΟΣ/i # note la igualdad de Σ,σ,ς
Coloreado en 0.002 segundos, usando GeSHi 1.0.8.4
Artículo original (en inglés)