Vale... entonces entiendo que solo interesa el campo de la fecha, por cada línea. Como decías algo de hacer estadísticas por acceso a ficheros, pensaba que te referías a hacer estadísticas de los ficheros registrados dentro de los ficheros comprimidos.
Para resolver el problema, no necesitas ni hacer un programa. Te vale con usar el programa bzgrep, haciendo una línea como esta:
Using bash Syntax Highlighting
bzgrep -c -e '^2009-06-11' *.bz2
Coloreado en 0.002 segundos, usando
GeSHi 1.0.8.4
Con '-c' indicamos que estamos interesados solo en el total de accesos. Con '-e' indicamos la expresión regular que queremos buscar: algo que comience (^) por la fecha que buscamos. Y como argumentos le pasamos todos los ficheros bz2 disponibles.
El resultado es algo como esto:
- Código: Seleccionar todo
cint-prx01_main__2009-06-12-06.22.33.log.bz2:232
cint-prx01_main__2009-06-11-22.00.00.log.bz2:15003
cint-prx01_main__2009-06-11-18.25.08.log.bz2:82
Ahora solo queda sacar el total, sumando esas cifras. Lo puedes hacer con un miniprograma en perl:
Using bash Syntax Highlighting
bzgrep -c -e '^2009-06-11' *.bz2
|perl -aln -F':' -e '$total += $F[1]; END { print $total }'Coloreado en 0.001 segundos, usando
GeSHi 1.0.8.4
y ya sale el total de accesos de ese día.