Página 1 de 1

Problema carácter iso-8859-1

NotaPublicado: 2012-10-24 05:42 @279
por Vertik
Hola a todos,

Allá va mi consulta: Tengo un texto (ISO-8859-1) como el siguiente:

(at about—110)

Como veis, el guion es de tamaño diferente al de '-'

Al leerlo utilizando la instrucción

open($handleIn,"<:encoding($inputEncoding)",$pathFile);

no detecta bien el valor de '—'

si paso de iso a hex veo que

— tiene un valor de 97
- tiene un valor de 2D

¿Alguna idea? ¡¡¡No sé cómo hacer para que lea bien ese carácter!!!


¡Gracias!

Re: Problema carácter iso-8859-1

NotaPublicado: 2012-10-24 09:53 @453
por explorer
Si esa raya tiene el valor 0x97 (151 decimal), entonces apuesto a que el texto no está codificado en ISO 8859-1, sino en Windows-1252.

Cambia $inputEncoding por 'cp1252'.

En otras codificaciones:

UTF-8: 0xE2 0x80 0x94
UTF-16: 0x2014
UTF-8 escapado en octal para C: \342\200\224
Entidad XML en decimal: &# 8212;
Entidad HTML: &mdash;

aunque... bueno... guiones, los hay de varias formas (en UTF-8, unos cuantos :) )

Re: Problema carácter iso-8859-1

NotaPublicado: 2012-10-24 10:10 @465
por Vertik
¡Eres un grande! ¡Gracias! Ha sido cambiar el enconding ¡¡y funcionar!!