De HTML a TXT o XML
Publicado: 2017-06-14 12:26 @560
Hola. Estoy tratando de extraer datos que están en dos tablas que pertenecen a una página html que tengo guardada en local o sea en mi computadora y pasarlos a XML pero no logro avanzar.
Soy nuevo en Perl y no me empato con la solución. Si pudieran ayudarme se los agradecería. La cuestión es tomar los valores de cada Variable(Promedio,Mínimo,Máximo) y ponerlos en un xml, o sea, algo así:
Esto lo haría para cada una de las variables. Sin más, espero puedan ayudarme, he tratado de subir la página pero no me lo permite la seguridad, aquí les pego el código:
Soy nuevo en Perl y no me empato con la solución. Si pudieran ayudarme se los agradecería. La cuestión es tomar los valores de cada Variable(Promedio,Mínimo,Máximo) y ponerlos en un xml, o sea, algo así:
Using xml Syntax Highlighting
- <Data Variable="Temperatura del aire" Unit="°C" Value="25.4" DateTime="" Type="Promedio" />
- <Data Variable="Temperatura del aire" Unit="°C" Value="22.2" DateTime="04:50" Type="Mínimo" />
- <Data Variable="Temperatura del aire" Unit="°C" Value="30.9" DateTime="12:10" Type="Máximo" />
Coloreado en 0.001 segundos, usando GeSHi 1.0.8.4
Esto lo haría para cada una de las variables. Sin más, espero puedan ayudarme, he tratado de subir la página pero no me lo permite la seguridad, aquí les pego el código:
Using html4strict Syntax Highlighting
- <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
- <html xmlns="http://www.w3.org/1999/xhtml">
- <head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /><meta name="description" content="Description" /><meta name="keywords" content="Keywords" /><title>
- </title><link rel="stylesheet" href="http://10.0.4.22/santalucia/style.css" type="text/css" media="screen" />
- </head>
- <body>
- <div id="art-main">
- <div class="cleared reset-box"></div>
- <div class="cleared reset-box"></div>
- <div class="art-box art-sheet">
- <div class="art-box-body art-sheet-body">
- <div class="cleared reset-box"></div>
- <div class="art-layout-wrapper">
- <div class="art-content-layout">
- <div class="art-content-layout-row">
- <div class="art-layout-cell art-content">
- <div class="art-box art-post">
- <div class="art-box-body art-post-body">
- <div class="art-post-inner art-article">
- <div class="art-postcontent">
- <h1>
- Inicio
- </h1>
- <div id="ContentPlaceHolder1_UpdatePanel1">
- <span id="ContentPlaceHolder1_Timer1" style="display:none;"></span>
- <table>
- <tr>
- <td style="border-style:hidden">
- <table>
- <tr>
- <td style="border-style:hidden;text-align:center">
- <span id="ContentPlaceHolder1_lastDate"><b>14 de junio de 2017 07:50</b></span>
- </td>
- </tr>
- <tr>
- <td style="border-style:hidden;text-align:center">
- <span id="ContentPlaceHolder1_Label1"><font color="Red">Ahora</font></span>
- </td>
- </tr>
- <tr>
- <td style="border-style:hidden">
- <table id="ContentPlaceHolder1_lastVal_table1">
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_W_0">Variable</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_X_0">Promedio</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Y_0">Mínimo</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Z_0">Máximo</span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_W_1">Temperatura del aire (°C)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_X_1">27.4</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Y_1">27.1</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Z_1">27.8</span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_W_2">Humedad relativa (%)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_X_2">81.5</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Y_2">78.2</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Z_2">84.2</span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_W_3">Velocidad del Viento (m/s)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_X_3">1.3</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Y_3">0.3</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Z_3">2.3</span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_W_4">Dirección del Viento (°)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_X_4">93.7 (E) </span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Y_4"></span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Z_4"></span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_W_5">Presión atmosférica (hPa)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_X_5">1012.7</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Y_5">1012.6</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Z_5">1013.0</span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_W_6">Radiación Global (W/m²)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_X_6">297.5</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Y_6">277.4</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastVal_Z_6">314.5</span>
- </td>
- </tr>
- </table>
- </table>
- </td>
- </tr>
- </table>
- </td>
- </tr>
- <tr>
- <td style="border-style:hidden">
- <table>
- <tr>
- <td style="border-style:hidden;text-align:center">
- <span id="ContentPlaceHolder1_todayLabel"><font color="Red">Hoy</font></span>
- </td>
- </tr>
- <tr>
- <td style="border-style:hidden">
- <table id="ContentPlaceHolder1_lastDay_table2">
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_W1_0">Variable</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_X1_0">Promedio</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Y1_0">Mínimo</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Z1_0">Máximo</span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_W1_1">Temperatura del aire (°C)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_X1_1">23.4</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Y1_1">22.2 (04:50)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Z1_1">28.0 (08:00)</span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_W1_2">Humedad relativa (%)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_X1_2">93.3</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Y1_2">78.2 (07:50)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Z1_2">96.5 (04:20)</span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_W1_3">Velocidad del Viento (m/s)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_X1_3">0.1</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Y1_3">0.0 (00:00)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Z1_3">2.9 (08:00)</span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_W1_4">Dirección del Viento (°)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_X1_4">61.6 (ENE) </span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Y1_4"></span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Z1_4"></span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_W1_5">Presión atmosférica (hPa)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_X1_5">1011.4</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Y1_5">1010.4 (04:10)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Z1_5">1013.2 (08:00)</span>
- </td>
- </tr>
- </table>
- <table>
- <tr>
- <td style="width:250px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_W1_6">Radiación Global (W/m²)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_X1_6">33.3</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Y1_6">-2.9 (00:00)</span>
- </td>
- <td style="width:130px;text-align:center">
- <span id="ContentPlaceHolder1_lastDay_Z1_6">355.9 (08:00)</span>
- </td>
- </tr>
- </table>
- </table>
- </td>
- </tr>
- </table>
- </td>
- </tr>
- </table>
- </div>
- </div>
- </div>
- </div>
- </div>
- </div>
- </div>
- </div>
- </div>
- </div>
- </div>
- </div>
- <script type="text/javascript">
- //<![CDATA[
- Sys.Application.add_init(function() {
- $create(Sys.UI._Timer, {"enabled":true,"interval":20000,"uniqueID":"ctl00$ContentPlaceHolder1$Timer1"}, null, null, $get("ContentPlaceHolder1_Timer1"));
- });
- //]]>
- </script>
- </form>
- </body>
- </html>
Coloreado en 0.012 segundos, usando GeSHi 1.0.8.4