• Publicidad

Problemas con HTML::TableExtract

¿Apenas comienzas con Perl? En este foro podrás encontrar y hacer preguntas básicas de Perl con respuestas aptas a tu nivel.

Problemas con HTML::TableExtract

Notapor panterozo » 2011-05-09 16:49 @742

Estimados..

Estoy tratando de obtener la información de una tabla HTML con el módulo HTML::TableExtract, pero no funciona nada de nada...

He probado un ejemplo dado por explorer link, pero no me muestra absolutamente nada :s

Sintáxis: [ Descargar ] [ Ocultar ]
Using perl Syntax Highlighting
  1. #!/usr/bin/perl
  2. use LWP::Simple;
  3. use HTML::TableExtract;
  4.  
  5. my $pagina = get('http://www.bcentral.cl/');
  6.  
  7. my $te = HTML::TableExtract->new( attribs => { summary => 'Indicadores diarios' } );
  8. $te->parse($pagina);
  9.  
  10. foreach $tabla ($te->tables) {
  11.     foreach $fila ($tabla->rows) {
  12.         print " ", join(', ', @$fila), "\n";
  13.     }
  14. }
  15.  
Coloreado en 0.002 segundos, usando GeSHi 1.0.8.4


¿Alguna idea de qué pueda estar sucediendo?

No funciona con ninguna tabla HTML :S
panterozo
Perlero nuevo
Perlero nuevo
 
Mensajes: 160
Registrado: 2010-01-26 08:36 @400

Publicidad

Re: Problemas con HTML::TableExtract

Notapor explorer » 2011-05-09 17:25 @767

¿Has vista la página que estás leyendo?
Sintáxis: [ Descargar ] [ Ocultar ]
Using html4strict Syntax Highlighting
  1. <HTML>
  2. <HEAD>
  3. <TITLE>Sitio Web Banco Central de Chile</TITLE>
  4. <meta http-equiv="Cache-Control"content="no-cache">
  5. <META HTTP-EQUIV="refresh" CONTENT="0;URL=index.asp">
  6. </HEAD>
  7. </HTML>
Coloreado en 0.001 segundos, usando GeSHi 1.0.8.4

En otras palabras: no has puesto bien la URL. Ha de ser http://www.bcentral.cl/index.asp

Ahora ya sale bien:
Sintáxis: [ Descargar ] [ Ocultar ]
Using text Syntax Highlighting
 UF, 21.763,52
 UTM (Mayo), 38.173,00
 Dólar Observado, 467,17
 Dólar Observado 10 de Mayo, 467,69
 Euro, 671,22
 TCM (02/01/1998=100), 97,82
Coloreado en 0.000 segundos, usando GeSHi 1.0.8.4
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14480
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Re: Problemas con HTML::TableExtract

Notapor panterozo » 2011-05-09 17:50 @785

:s... Tenías razón :s..

Para leer mi propio HTML, hice lo siguiente...

Sintáxis: [ Descargar ] [ Ocultar ]
Using perl Syntax Highlighting
  1. #!/usr/bin/perl
  2.  
  3. use HTML::TableExtract;
  4.  
  5. my $fh = undef;
  6. open($fh,"<test.html");
  7. my $aux = '';
  8. foreach(<$fh>){
  9.         $aux .= $_;
  10. }
  11.  
  12. my $te = HTML::TableExtract->new();
  13. $te->parse($aux);
  14.  
  15. foreach $tabla ($te->tables) {
  16.     foreach $fila ($tabla->rows) {
  17.         print " ", join(', ', @$fila), "\n";
  18.     }
  19. }
  20.  
Coloreado en 0.001 segundos, usando GeSHi 1.0.8.4


Y ahí todo bien...

¡¡¡Gracias!!!
panterozo
Perlero nuevo
Perlero nuevo
 
Mensajes: 160
Registrado: 2010-01-26 08:36 @400


Volver a Básico

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 58 invitados

cron