• Publicidad

Persistencia. Guardar datos para reutilizarlos después

¿Apenas comienzas con Perl? En este foro podrás encontrar y hacer preguntas básicas de Perl con respuestas aptas a tu nivel.

Persistencia. Guardar datos para reutilizarlos después

Notapor carlitos_30 » 2013-06-27 19:51 @868

Hola.

Quería consultar lo siguiente. Tengo un script que guarda código HTML de varias páginas. Lo que quiero hacer es guardar el código de cada página, cosa que más tarde pueda ejecutar el analizador que quiero hacer y no tener que descargar a cada rato las páginas para corregir cosas.

Lo que he estado haciendo es grabar cada página en un archivo dándole un nombre dinámico:

Sintáxis: [ Descargar ] [ Ocultar ]
  1. open my $fh, ">", "Pagina$[i].txt"; 
  2. $i++; 


Después leo cada archivo y aplico el analizador.

Lo otro es guardar todo el texto HTML en un mismo archivo y entre cada texto insertar una secuencia de caracteres como delimitador de cada texto HTML.

Si tengo, por ejemplo, más de 1000 textos HTML independientes, necesitaría crear 1000 archivos, y así sucesivamente.

Lo que me pregunto es si hay una forma más eficiente/inteligente de hacer esto.

Gracias.
carlitos_30
Perlero nuevo
Perlero nuevo
 
Mensajes: 8
Registrado: 2012-12-28 09:08 @422

Publicidad

Re: Persistencia. Guardar datos para reutilizarlos después

Notapor explorer » 2013-06-28 04:19 @221

Yo creo que no hay problemas en almacenar cada página como archivo independiente. Yo me he enfrentado a problemas parecidos, con miles de archivos para procesar en varios directorios.

Si no ocupan mucho, otra opción es meterlos en registros de una base de datos. Pero es más difícil verlos si en algún momento dado quieres consultar y editar uno de ellos. Si fueran archivos, entrarías en el directorio y lo editarías directamente.

Lo de ponerlos todos juntos puede ser un lío. El archivo puede ser muy grande para manejar. O para localizar información. Pero puede resultar una buena idea si se trata de procesar su contenido. Por ejemplo, para extraer información o para pasarle un corrector ortográfico. El tenerlo todo junto te ahorra el tener que gestionar la carga de cada uno de forma independiente. En contra, si vas a hacer cambios en su contenido, tenerlo todo junto puede no ser la forma más flexible.

¿Cuánto ocuparía toda la información?
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14480
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Re: Persistencia. Guardar datos para reutilizarlos después

Notapor carlitos_30 » 2013-06-28 09:40 @444

Gracias por la ayuda.

Y el proceso de crearlos que puse ¿está bien o hay una forma más inteligente?

Sintáxis: [ Descargar ] [ Ocultar ]
  1. open my $fh, ">", "Pagina$[i].txt";  
  2. $i++;  
carlitos_30
Perlero nuevo
Perlero nuevo
 
Mensajes: 8
Registrado: 2012-12-28 09:08 @422

Re: Persistencia. Guardar datos para reutilizarlos después

Notapor explorer » 2013-06-28 10:07 @463

No es correcto... creo que hay un error de sintaxis...

Mejor así:
Sintáxis: [ Descargar ] [ Ocultar ]
Using perl Syntax Highlighting
  1. my $archivo = "pagina0000";
  2.  
  3. # dentro del bucle de archivos:
  4. {
  5.     open my $fh, ">", "$archivo.html";
  6.     ...;
  7.     close $fh;
  8.  
  9.     $archivo++;         # incremento mágico
  10. }
Coloreado en 0.002 segundos, usando GeSHi 1.0.8.4
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14480
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Re: Persistencia. Guardar datos para reutilizarlos después

Notapor carlitos_30 » 2013-06-28 13:23 @599

Gracias. Así queda mejor.
carlitos_30
Perlero nuevo
Perlero nuevo
 
Mensajes: 8
Registrado: 2012-12-28 09:08 @422


Volver a Básico

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 12 invitados

cron