Este código extrae el título de un archivo HTML tomado de la entrada y hace dos sustituciones para eliminar algunos espacios en blanco. Para desarrollarlo tuve en cuenta que títulos en páginas HTML encontradas en la web pueden estar en varias líneas o en una línea compartida con otro código HTML (algunas páginas hasta tienen todo el código HTML en una única línea). ¿Es posible simplificarlo o llevarlo a una forma más corta?
Using perl Syntax Highlighting
- #!/usr/bin/perl -ln0
- m/<title>(.*?)<\/title>/sg ;
- $_=$1 ;
- s/\s+/\ /g ;
- s/(^\s|\s$)*//g ;
- print "$_\n" ;
Coloreado en 0.003 segundos, usando GeSHi 1.0.8.4