¡Buenas a todos!
Hace poco encontré el libro de Larry Wall ¡y no puedo dejar Perl!
Actualmente estoy aplicando este lenguaje en todo lo que puedo.
... Y lamentablemente me terminé bloqueando en algo.
La situación:
Estoy intentando realizar un
script que lo que hace es barrer un archivo HTML donde figuran todos los usuarios que se
loguearon a una aplicación, entre otros datos, y extraer todos los nombres de estos.
La parte del archivo donde saco datos:
Using html4strict Syntax Highlighting
...title="Ver perfil de perezjuan1">perezjuan1</a></td>.
Coloreado en 0.002 segundos, usando
GeSHi 1.0.8.4
.
El
script (la función que maneja esto):
Using perl Syntax Highlighting
$inputfile=$ARGV[0];
sub perfil() {
open( INPUTFILE, $inputfile ) || die "No existe el archivo " . $inputfile;
while (<INPUTFILE>) {
while (/perfil de (.*)">/g) {
print "$&\n";
}
}
close INPUTFILE;
exit(0);
}
Coloreado en 0.003 segundos, usando
GeSHi 1.0.8.4
El problema:
Sucede que la salida que veo es la siguiente:
Using text Syntax Highlighting
.
perfil de perezjuan1">
.
Coloreado en 0.000 segundos, usando
GeSHi 1.0.8.4
La idea es que la salida (en consola) sea:
Using text Syntax Highlighting
perezjuan1
rodriguezramon2
etc...
Coloreado en 0.000 segundos, usando
GeSHi 1.0.8.4
Entiendo por qué está mal, pero no logro encontrar una solución, ya que no veo cómo extraer los datos (nombres de usuarios) definiendolo entre "cadenas" (por ejemplo: imprimir los datos que se encuentran entre "
title="Ver perfil de">" y "
</a></td>").
Si alguien me pudiera ayudar a solucionar, esto lo agradecería, ya que no estoy extrayendo los datos limpios y no me sirve
¡¡¡Gracias!!!