• Publicidad

Sacar palabras de una página sin el HTML

¿Apenas comienzas con Perl? En este foro podrás encontrar y hacer preguntas básicas de Perl con respuestas aptas a tu nivel.

Sacar palabras de una página sin el HTML

Notapor BigBear » 2010-04-30 12:40 @569

Hola.

Ando queriendo hacer un sencillo script en Perl que tome el código HTML que le devuelva una página para luego poder separar todas las palabras pero no lo que está en el código HTML.

La idea sería
Sintáxis: [ Descargar ] [ Ocultar ]
Using perl Syntax Highlighting
  1. use LWP::Simple;
  2.  
  3. $contenido = get("http://127.0.0.1/texto.html");
  4.  
Coloreado en 0.003 segundos, usando GeSHi 1.0.8.4


¿Alguien sabe cómo ayudarme?
BigBear
Perlero frecuente
Perlero frecuente
 
Mensajes: 981
Registrado: 2009-03-01 18:39 @818

Publicidad

Re: Sacar palabras de una página sin el HTML

Notapor explorer » 2010-04-30 16:31 @730

Por estos foros hay unos pocos hilos sobre el tema...

* Dudas con HTML::Parser

* Duda con el Mechanize

* Filtrar publicidad

Puedes también probar a usar el módulo HTML::Extract.
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14480
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España


Volver a Básico

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 35 invitados