Foro - Perl en Español

por **explorer** » 2012-03-18 15:31 @688

enric73 escribiste:De esta manera la primera línea de los diferentes ficheros planos no se conserva... ¿Tiene alguna relación con el HeaderRow?

¡Oops! Algo estaba mal... Corregido más abajo.

enric73 escribiste:Al final del proceso, querría añadir en la fila 1 del fichero final con la fecha del año (yyyymmddhh), ¿qué comando me recomienda que al introducir esta fila no me borre el resto? Ya tengo instalado el Class::Date

A ver... ¿A qué te refieres exactamente? ¿Insertar una línea delante de todas con la fecha? ¿O que esa fecha la insertemos solo en la primera columna, en la primera posición?

En el ejemplo que te pongo a continuación, insertamos una nueva fila al principio.

enric73 escribiste:Otra consulta, al ejecutar el script, se genera de forma paralela un carpeta llamada cache/ con ficheros UGRD*.dat.cache, ¿para qué sirven?

Eso se desactiva con la opción _CacheOnRead. El sistema de caché de este módulo es por si, más adelante, necesitas volver a leer los mismos archivos. El módulo se dará cuenta de que existe una copia prefabricada en el cache/, y lo leerá de allí.

La ventaja es que las lecturas desde el cache/ son mucho más rápidas que leyendo el archivo original. Sobre todo se nota si tienes archivos con miles o millones de datos.

Existe otro problema que no hemos comentado hasta ahora: este módulo toma por defecto la primera línea de cada archivo como el nombre de la columna. Podría darse el caso de que más de un archivo contuviera el mismo valor en la primera fila, y por lo tanto, el módulo sacaría un mensaje de error diciendo que no puede combinar esos archivos porque tienen el mismo nombre de columna. Si estás completamente seguro de que eso no se va a dar nunca, el programa lo puedes dejar tal cual. Pero si no es así, entonces el programa exige que tengamos creada, antes de la combinación, el listado de nombres de las columnas que vamos a leer. Podría ser algo tan simple como números: '1', '2', '3'... Y luego, en la salida, ponemos el _HeaderRow => 0, y los datos salen sin esas cabeceras.

Juntándolo todo, quedaría así:

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

#!/usr/bin/perl
use Data::CTable;
use POSIX 'strftime';
 
my $tabla = Data::CTable->new();                         # Objeto Data::CTable
 
my @archivos = </home/sam/enric/ASCII/UGRD*>;            # listado de los archivos
#print "Uniendo ", scalar(@archivos), " archivos\n";
 
# Combinación
for my $i ( 1 .. @archivos ) {                           # hacemos un bucle por todos ellos
    $tabla->combine_file( $archivos[$i-1], {             # combinamos un archivo
        _HeaderRow   => 0,                               # que no tiene cabecera
        _FieldList   => [ $i ],                          # porque la prefabricamos
        _CacheOnRead => 0,                               # y no queremos caché
    });
}
# aquí ya tenemos toda la tabla, con todas las columnas, cuyos nombres son 1, 2, 3, ...
 
# Ponemos la fecha
my $largo = $tabla->length();                            # cómo es de grande esa tabla
$tabla->row_set($largo, {                                # $largo también es el índice de la nueva fila
                                                         # (las filas se numeran de 0 a $largo-1)
    1 => strftime('%Y%m%d%H', localtime),                # en la primera columna de esa fila ponemos la fecha
});
$tabla->row_move($largo, 0);                             # y subimos la fila arriba del todo
 
# Salida
$tabla->write(                                           # escribimos el resultado
    _FileName   => 'vientos.dat',                        # aquí
    _FDelimiter => "\t",                                 # y tabulado
    _HeaderRow  => 0,                                    # pero sin las cabeceras prefabricadas
);
__END__
2012031821
1       a       A1
2       b       B2
3       c       C3
4       d       D4
5       e       E5
6       f       F6
7               G7
8               H8
9               I9
                J10
                K11
                L12
                M13
                N14
                O15
                P16
Coloreado en 0.003 segundos,  usando GeSHi 1.0.8.4

¡Muchas gracias explorer!

¡Qué máquina!

Una última consulta: si quiero eliminar una fila, la primera fila de un archivo.dat, no por comando sino desde dentro del script.

Por ejemplo, si quiero eliminar de esta columna, la primera fila que corresponde a 256 17, ¿cómo puedo hacerlo? ¿con la función sed?

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

256 17

35A

45C

45D

43JColoreado en 0.000 segundos,  usando GeSHi 1.0.8.4

Gracias.

por **explorer** » 2012-03-18 16:49 @742

Con la función row_delete($número_de_fila-1) puedes hacerlo.

sed no existe como función, dentro de Perl.

por **enric73** » 2012-03-19 02:38 @151

¡Buenos días, explorer, y al resto!

Gracias por el último consejo. He escrito este cortito script para eliminar la primera fila de todos los archivos MET* que se encuentran en un directorio.

He utilizado la subrutina row_delete() pero al lanzar el script no es reconocida.

Posiblemente en la cabecera he de introducir un use con alguna biblioteca...? Si alguien puede aconsejarme, gracias

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

#!/usr/bin/perl -w
# ************************************************************************** #
#  Script para eliminar la primera fila                #
# ************************************************************************** #
use Class::Date qw(date now);
use File::Path;
 
 
# ----------------------------------------------------------------------------
# Ruta de los archivos .dat
# ----------------------------------------------------------------------------
#
 
 
my @fitxers = </home/enric/ASCII/MET*>;
 
foreach $fitxer ( @fitxers) {
        open (FITXER, "<$fitxer") or die "$!\n";
        $numero_de_fila=1;
        row_delete($numero_de_fila-1);
##      chomp(@linies = <FITXER>) ;
        close (FITXER);
Coloreado en 0.001 segundos,  usando GeSHi 1.0.8.4

por **explorer** » 2012-03-19 08:38 @401

Me has liado con las preguntas. Pensaba que te seguías refiriendo al problema anterior, por lo que te he dado una solución basada en el problema anterior.

Como hemos usado el módulo Data::CTable, pues aprovechábamos su funcionalidad, y row_delete() pertenece a él.

Ahora lo que estás planteando es un problema nuevo.

Depende un poco del tamaño y el formato de los ficheros, pero una opción podría ser:
* leer todo el archivo en memoria, a un array (una línea por elemento)
* quitar la primera línea, con splice() o con shift()
* escribir el resultado

Pero se me ocurren otras seis formas distintas.

Depende de cómo sean esos archivos...

por **enric73** » 2012-03-19 09:43 @446

Hola, buenas tardes.

Se trata de eliminar la primera fila de un conjunto de ficheros MET*.dat que están en un directorio.

Cada fichero contiene unas 50.000 líneas y necesito eliminar la primera que es una cabecera. El fichero empieza así, y quiero eliminar las cifras 360 181.

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

360 181

-1.06

-0.99

-0.92

-0.85

-0.78

-0.71

-0.64

-0.57

-0.5

-0.43

-0.36

-0.29

-0.22

-0.15

-0.08

-0.01

0.06

0.13

0.2

0.27Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

Muchas gracias. ¿Hasta 6 maneras se puede eliminar esta línea?

por **Birei** » 2012-03-19 09:54 @454

Una manera:

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

perl -i.orig -ne 'print unless $. == 1; close ARGV if eof' MET*.dat
Coloreado en 0.001 segundos,  usando GeSHi 1.0.8.4

Los archivos originales se guardarán como seguridad añadiendo el sufijo .orig. Usa -i sólo para modificarlos sin crear backups.

por **enric73** » 2012-03-19 10:50 @493

¡Gracias Birei!

Me ha funcionado. ¿Me podrías explicar un poco más cómo procede esta línea comando? Muchas gracias.

perl -i.orig -ne 'print unless $. == 1; close ARGV if eof' MET*.dat

por **explorer** » 2012-03-19 11:00 @500

Otra forma:

Sintáxis: [ Descargar ] [ Ocultar ]

Using perl Syntax Highlighting

use autodie;
use Tie::File;
 
tie my @lineas, 'Tie::File', 'kk.txt';         # enlazamos la vida de @lineas con las líneas de kk.txt
shift  @lineas;                                # quitamos la primera línea
untie  @lineas;                                # fin del enlace
Coloreado en 0.001 segundos,  usando GeSHi 1.0.8.4

De todas maneras, ¿seguro que necesitas quitar esa línea?

Es muy posible que no necesites quitarla porque la siguiente fase de procesamiento podría, simplemente, obviarla.

por **Birei** » 2012-03-19 11:02 @501

Explicación:

Sintáxis: [ Descargar ] [ Ocultar ]

Using text Syntax Highlighting

-i                      Editar archivos pasados como argumentos.

.orig                   Antes de modificar, guardar el archivo original con extensión 'orig'.

-n                      Por defecto no imprimir nada.

-e                      Ejecutar las siguientes instrucciones.

print unless $. == 1    Imprimir línea salvo que sea la primera del archivo.

close ARGV if eof       Al final del archivo cerrarlo de manera explícita para inicializar el contador de líneas ($.).Coloreado en 0.000 segundos,  usando GeSHi 1.0.8.4

Foro - Perl en Español

Editar ficheros .dat en un solo .dat y por columnas

Re: Editar ficheros .dat en un solo .dat y por columnas

Publicidad

Re: Editar ficheros .dat en un solo .dat y por columnas

Re: Editar ficheros .dat en un solo .dat y por columnas

Re: Editar ficheros .dat en un solo .dat y por columnas

Re: Editar ficheros .dat en un solo .dat y por columnas

Re: Editar ficheros .dat en un solo .dat y por columnas

Re: Editar ficheros .dat en un solo .dat y por columnas

Re: Editar ficheros .dat en un solo .dat y por columnas

Re: Editar ficheros .dat en un solo .dat y por columnas

Re: Editar ficheros .dat en un solo .dat y por columnas

¿Quién está conectado?