Estoy creando un script que descargue recursivamente las imágenes de todo un blog. Tengo más o menos todo montado y "funcionando" usando unicamente LWP::Simple. El problema viene al "extraer" los enlaces a esas imágenes. Lo primero que hago es descargar la página así:
Using perl Syntax Highlighting
- $html = get($page) or die "$!\n";
Coloreado en 0.002 segundos, usando GeSHi 1.0.8.4
Ahora viene el problema y es que no entiendo cómo "extraer" los enlaces de todo ese código HTML que está dentro $html. Sé cómo "extraer" 1 solo:
Using perl Syntax Highlighting
- $html =~ m/(\d+.media.tumblr.com\/tumblr_[A-Za-z0-9_.-\/]+)/g;
Coloreado en 0.001 segundos, usando GeSHi 1.0.8.4
¿Cómo he de hacer para sacar todos los enlaces? Pensé que '/g' me valdría para ello y los enlaces quedarían en $1, $2... y así, pero no xD
Un saludo y gracias por pasar