Foro - Perl en Español

por **JoshZeta** » 2015-09-02 14:58 @665

Buenas tardes con todos

Tengo un problema al extraer columnas con datos de un archivo plano. El archivo es el siguiente :

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

(1 row affected)

(1 row affected)

(1 row affected)

(1 row affected)

(1 row affected)

|deviceID   |measuringObject|collectionEndTime  |taskID     |insertionTime      |granularityPeriod|Time10             |row_index  

|-----------|---------------|-------------------|-----------|-------------------|-----------------|-------------------|-----------

|    4722691|825            |2015/07/06 10:00:00|        168|2015/07/06 09:52:00|               60|2015/07/06 10:00:00|     933114

|    4722691|936            |2015/07/06 10:00:00|        168|2015/07/06 09:52:00|               60|2015/07/06 10:00:00|     933115

|    4722691|2417           |2015/07/06 10:00:00|        168|2015/07/06 09:52:00|               60|2015/07/06 10:00:00|     933116

|    4722691|2903           |2015/07/06 10:00:00|        168|2015/07/06 09:52:00|               60|2015/07/06 10:00:00|     933117Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

Yo deseo extraer solo determinadas columnas (deviceID, insertiontime, row_index) e insertarlas en un archivo csv.

Para esto pensaba usar el siguiente código:

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

my $nombre_archivo_fuente = "/home/osboxes/Desktop/CN1/OFDOG_data.out";
my $SALIDA = "salida.txt";
 
open my $FORMAT_FONT, '<',$nombre_archivo_fuente;
open my $FORMAT_DO, '>', $SALIDA;
 
my $i = 0 ;
 
while (my $registro = <$FORMAT_FONT>{
next if $. == 1 ;
next if $. == 2 ;
next if $. == 3 ;
next if $. == 4 ;
next if $. == 5 ;
next if $. == 6 ;
next if $. == 7 ;
chomp $registro ; 
my @campos = split("|", $registro);
my $archivo_final = join ',',@campos[0,4,7];
print $FORMAT_DO "$archivo_final\n";
$i++;
}
 
close $FORMAT_FONT;
close $SALIDA;
 
my $pathsalida = "/home/osboxes/Desktop/CN2";
copy ($SALIDA, $pathsalida);
chmod 0777, "/home/osboxes/Desktop/CN2/$SALIDA" ;
unlink $SALIDA;
 
print "\n\t Operación realizada con éxito: $i registros procesados del archivo $archivo_final.\n";
 
Coloreado en 0.004 segundos,  usando GeSHi 1.0.8.4

El código aparentemente funciona bien porque el print() indica la cantidad de registros correspondiente al archivo plano; pero el contenido del archivo final sale en blanco. Please, Help Me... :roll:

Había problemas en el código: Faltaba un paréntesis, no se cerraba $FORMAT_DO, la presencia de un '|' inicial en el archivo de entrada obliga a renumerar las columnas una posición más.

Pero el problema principal estaba en el split(): hay que recordar que el primer argumento de split() es el delimitador, que es un patrón de expresiones regulares, no una cadena de caracteres, así que "|" realmente es un patrón. Y en un patrón, el carácter '|' sí que tiene un significado: es el de alternancia. Por eso no se realizaba bien la partición de las columnas.

La solución es indicar que el carácter '|' realmente no es alternancia, sino un carácter normal.

Esta es la versión corregida:

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

#!/usr/bin/env perl
use strict;
use warnings;
use autodie;
use feature 'say';
 
my $archivo_fuente = "code_38870.txt";
my $archivo_salida = "code_38870.csv";
 
#               deviceID insertiontime row_index
my @columnas = (1,       5,            8,       );
 
 
open my $FORMAT_FONT, '<', $archivo_fuente;
open my $FORMAT_DO,   '>', $archivo_salida;
 
my $i = 0;
 
while (my $registro = <$FORMAT_FONT>) {
 
    next if $registro !~ m/^ [|] \s* \d+/x;             # saltamos a la siguiente línea si no es un registro
 
    chomp $registro ; 
 
    my @campos = split /\s*[|]\s*/, $registro;          # extraemos @campos
 
    say $FORMAT_DO join ',', @campos[@columnas];        # y sacamos de @campos las @columnas que nos interesan
 
    $i++;
}
 
close $FORMAT_FONT;
close $FORMAT_DO;
 
say "\n\tOperación realizada con éxito: $i registros procesados del archivo $archivo_salida.";
Coloreado en 0.002 segundos,  usando GeSHi 1.0.8.4

Más información en perldoc -f split

por **JoshZeta** » 2015-09-08 11:54 @537

¡¡Gracias, explorer!! Estaba dando vueltas sobre lo mismo, pero ahora sí me quedó muy claro sobre "|" y su significado como carácter de alternancia. :wink:

Foro - Perl en Español

Extracion de datos de un archivo plano

Extracion de datos de un archivo plano

Publicidad

Re: Extracion de datos de un archivo plano

Re: Extracion de datos de un archivo plano

¿Quién está conectado?