Coloreado en 0.000 segundos, usando GeSHi 1.0.8.4
Estoy haciendo un script que dado un texto me devuelva todos sus tokens.
Dado este texto:
Using text Syntax Highlighting
Tras admitir que cada uno "puede tomar sus propias decisiones" aunque el Gobierno no espera un "comportamiento irracional" de los clientes sacando cantidades excesivas de dinero, el jefe de la política económica del Ejecutivo ha justificado el aval de hasta 9.000 millones sobre los fondos depositados en Caja Castilla-La Mancha en que, en cualquier caso, había que prever este extremo. "Pueden pedir su dinero con toda tranquilidad, pero si no le hace falta utilizarlo no tienen ninguna necesidad de cambiar de entidad", ha asverado Solbes en declaraciones posteriores a TVE.
Obtener la separación de palabras y signos de puntuación.
Pues no sé cómo hacerlo bien del todo, me explico.
Con un:
Using perl Syntax Highlighting
- split(\b,$linea) #siendo linea el texto
Coloreado en 0.002 segundos, usando GeSHi 1.0.8.4
el resultado es aproximadamente lo que quiero, pero el caso de 9.000 falla, ya que me los separa.
Entonces, jugando con un validador de expresiones regulares, la expresión:
Using perl Syntax Highlighting
- [a-zA-Zàáóòíéèúñ]+|\d+(.\d+)?|[,."?¿]
Coloreado en 0.001 segundos, usando GeSHi 1.0.8.4
haciendo matchAll me caza todas los tokens que quiero.
Entonces, ¿cómo puedo hacer para que dada esta expresión Perl me genere un array donde cada elemento/posición sea un match de ella?
¡Mil gracias!