Tengo un problemilla con una búsqueda de un html que me llega que necesito sacar los vídeos de Youtube y los comentarios asociados.
Porción del html que quiero capturar:
Using html4strict Syntax Highlighting
- <div id="cuerpo_13234" class="cuerpo">
- Texto pruebra bllalblalbla
- <iframe title="YouTube video player" src="http://www.youtube.com/embed/h60pSZyaJBo?rel=0&hd=1&wmode=opaque" frameborder="0" allowFullScreen></iframe>
- Blablalvbla
- </div>
Coloreado en 0.004 segundos, usando GeSHi 1.0.8.4
Código para encontrar coincidencias Perl:
Using perl Syntax Highlighting
- #html pasado por referencia
- while (${$html} =~ m/\<div id\=\"cuerpo\_[0-9]*\" class\=\"cuerpo\"\>.*youtube.*\</div\>/sig) {
- print "Encontrado '$&'.\n\n-----------------------------------------------------------------------------\n\n";
- }
Coloreado en 0.004 segundos, usando GeSHi 1.0.8.4
Modificador /s para poner texto en una sola línea ya que el /m que se supone que es el multi-línea, no me lo coge.
La cosa es que me coge la primera condición del <div> con la última del cierre del <div>. Utilizo el Strawberry de Windows. No creo que haya ninguna gran diferencia.
Un saludo y gracias por vuestro tiempo.