• Publicidad

Raúl Ochoa: Git y diff con documentos de Microsoft Word

¿Tienes algo interesante que decir? ¿O quizá algo no tan interesante? Aquí tenemos un espacio para compartir todo lo que queramos decir y que no cabe en ninguno de los otros foros.

Raúl Ochoa: Git y diff con documentos de Microsoft Word

Notapor explorer » 2011-01-03 14:28 @644

«Los archivos de Word 2007 en realidad son archivos ZIP que contienen documentos XML y otros archivos de datos. Podríamos reinventar la rueda otra vez hoy, pero como ya existen herramientas que extraen el texto (plano) de documentos Office Open XML (formato de Word 2007) nos limitaremos a usar alguna de ellas. Una búsqueda rápida para docx to text y tenemos un script en Perl que hará el trabajo sucio: extraer el texto de nuestros documentos Word 2007

Artículo
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14486
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Publicidad

Volver a Pasando el rato

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 0 invitados

cron