por explorer » 2013-07-15 13:43 @613
Los byte cero están por una razón principal: porque los textos están codificados en UTF-16. Yo sospecho que es un texto sacado de un Windows, así que quizás sea un UCS-2. Pero otras partes dentro del archivo vi que estaban en iso-8859-1 (o quizás era Windows cp-1252).
Bueno, el caso es que, si se sabe la codificación de cada parte, Perl puede "quitarte" esos byte cero de forma automática, con el módulo Encode.
Si intentas quitarlos "a mano", pues puedes cargarte algo. No todas las codificaciones siguen un patrón de tamaño fijo como UCS-2.
Y, además, la última parte del archivo es un ejecutable binario para Windows...
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES