• Publicidad

Problema carácter iso-8859-1

Así que programas sin strict y las expresiones regulares son otro modo de hablar. Aquí encontrarás respuestas de nivel avanzado, no recomendable para los débiles de corazón.

Problema carácter iso-8859-1

Notapor Vertik » 2012-10-24 05:42 @279

Hola a todos,

Allá va mi consulta: Tengo un texto (ISO-8859-1) como el siguiente:

(at about—110)

Como veis, el guion es de tamaño diferente al de '-'

Al leerlo utilizando la instrucción

open($handleIn,"<:encoding($inputEncoding)",$pathFile);

no detecta bien el valor de '—'

si paso de iso a hex veo que

— tiene un valor de 97
- tiene un valor de 2D

¿Alguna idea? ¡¡¡No sé cómo hacer para que lea bien ese carácter!!!


¡Gracias!
Vertik
Perlero nuevo
Perlero nuevo
 
Mensajes: 41
Registrado: 2011-04-20 06:32 @314

Publicidad

Re: Problema carácter iso-8859-1

Notapor explorer » 2012-10-24 09:53 @453

Si esa raya tiene el valor 0x97 (151 decimal), entonces apuesto a que el texto no está codificado en ISO 8859-1, sino en Windows-1252.

Cambia $inputEncoding por 'cp1252'.

En otras codificaciones:

UTF-8: 0xE2 0x80 0x94
UTF-16: 0x2014
UTF-8 escapado en octal para C: \342\200\224
Entidad XML en decimal: &# 8212;
Entidad HTML: &mdash;

aunque... bueno... guiones, los hay de varias formas (en UTF-8, unos cuantos :) )
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14486
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Re: Problema carácter iso-8859-1

Notapor Vertik » 2012-10-24 10:10 @465

¡Eres un grande! ¡Gracias! Ha sido cambiar el enconding ¡¡y funcionar!!
Vertik
Perlero nuevo
Perlero nuevo
 
Mensajes: 41
Registrado: 2011-04-20 06:32 @314


Volver a Avanzado

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 0 invitados

cron