Extraer los directorios de código fuente HTML con expresión
Publicado: 2013-04-06 21:49 @951
Recién comienzo con las expresiones regulares y me parece todo un arte al igual que complejo.
Estoy intentando extraer los directorios del código fuente de una página web pero no consigo coger la lógica para que tenga más profundidad.
En mis intentos he intentado lo siguiente:
La var $p es la línea que va interpretando el código fuente.
O sea: creo que le he indicado que busque cualquier directorio que no empiece por '/tag', '/TR', '/tr', '/www' y '/xhtml1', seguido de cualquier palabra más '/' seguido de cualquier palabra más '/' y que si no es repetida la concordancia que lo meta dentro de un array... pero solo consigo una profundidad de dos directorios.
Me preguntaba si hay alguna manera en que no importe la profundidad de la ruta, sin tener que repetir esta partecomo hice en el código expuesto.
Gracias de antemano... Agradezco también toda la ayuda brindada en el foro ya que gracias a esa ayuda voy progresando Viva Perl y a los perleros.
Estoy intentando extraer los directorios del código fuente de una página web pero no consigo coger la lógica para que tenga más profundidad.
En mis intentos he intentado lo siguiente:
Using perl Syntax Highlighting
- if($p =~ m/(\/[^\/tag | TR | tr | www | xhtml1 ]+[a-zA-Z0-9_-]{1,}\/+[a-zA-Z0-9_-]{1,}\/)/) {
- if (!grep $_ eq $1, @dirs) {
- push(@dirs, $1);
- }
- }
Coloreado en 0.003 segundos, usando GeSHi 1.0.8.4
La var $p es la línea que va interpretando el código fuente.
O sea: creo que le he indicado que busque cualquier directorio que no empiece por '/tag', '/TR', '/tr', '/www' y '/xhtml1', seguido de cualquier palabra más '/' seguido de cualquier palabra más '/' y que si no es repetida la concordancia que lo meta dentro de un array... pero solo consigo una profundidad de dos directorios.
Using text Syntax Highlighting
- /js/jquery/
- /blogified/scripts/
- /blogi_fied/scripts/
- /b_log-ified/scripts/
- /blogi66fied-okok/scripts/
Coloreado en 0.000 segundos, usando GeSHi 1.0.8.4
Me preguntaba si hay alguna manera en que no importe la profundidad de la ruta, sin tener que repetir esta parte
Using perl Syntax Highlighting
- [a-zA-Z0-9_-]{1,}\/
Coloreado en 0.001 segundos, usando GeSHi 1.0.8.4
Gracias de antemano... Agradezco también toda la ayuda brindada en el foro ya que gracias a esa ayuda voy progresando Viva Perl y a los perleros.