• Publicidad

Ayuda con Expresiones Regulares

¿Apenas comienzas con Perl? En este foro podrás encontrar y hacer preguntas básicas de Perl con respuestas aptas a tu nivel.

Ayuda con Expresiones Regulares

Notapor jclp77 » 2006-09-21 12:48 @575

Hola a todos. Ojalá me puedan ayudar con lo siguiente:

Tengo un archivo que tiene la estructura:

Código: Seleccionar todo
Adu Agente Documento Sec T.O C.D R.F.C. Resultado Momento Usuario
90 9090 3001295 0 Imp A1 LOPJ771123EX7 Dictaminado 18/03/2003 17:17:00 LOPJ77BN
Notificado Con Acta de Hechos 20/03/2003 20:12:27 LOPJ77BN
3001787 0 Imp A1 LOPJ771123EX7 Dictaminado 11/04/2003 21:02:00 LOPJ77BN
Notificado Con Acta de Hechos 14/04/2003 12:54:34 LOPJ77BN
3002206 0 Imp A1 LOPJ771123EX7 Dictaminado 07/05/2003 21:51:00 GAPK79B4
Notificado Con Acta de Hechos 08/05/2003 14:20:23 LOPJ77BN
3004066 0 Imp A1 LOPJ771123EX7 Dictaminado 12/08/2003 20:19:00 LOPJ77BN
Notificado Con Acta de Hechos 15/08/2003 16:08:24 LOPJ77BN
3004072 0 Imp A1 LOPJ771123EX7 Dictaminado 12/08/2003 20:20:00 LOPJ77BN
Notificado Con Acta de Hechos 15/08/2003 18:20:04 LOPJ77BN
3005106 0 Imp A1 LOPJ771123EX7 Dictaminado 07/10/2003 14:39:00 LOPJ77BN
Notificado Con Acta de Hechos 09/10/2003 18:40:28 LOPJ77BN
3006510 1 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:14:00 LOPJ77BN
Notificado Con Acta de Hechos 20/12/2003 16:30:15 LOPJ77BN
2 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:14:00 LOPJ77BN
Notificado Con Acta de Hechos 20/12/2003 16:43:34 LOPJ77BN
3 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:15:00 LOPJ77BN
Notificado Con Acta de Hechos 20/12/2003 16:54:08 LOPJ77BN
4 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:16:00 LOPJ77BN
Notificado Con Acta de Hechos 20/12/2003 17:05:38 LOPJ77BN
5 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:16:00 LOPJ77BN
Notificado Con Acta de Hechos 20/12/2003 17:14:36 LOPJ77BN
6 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:17:00 LOPJ77BN
Notificado Con Acta de Hechos 20/12/2003 17:25:39 LOPJ77BN
7 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:17:00 LOPJ77BN
Notificado Con Acta de Hechos 20/12/2003 17:35:33 LOPJ77BN
8 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:19:00 LOPJ77BN
Notificado Con Acta de Hechos 20/12/2003 17:42:02 LOPJ77BN
9 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:18:00 LOPJ77BN
Notificado Con Acta de Hechos 20/12/2003 17:49:46 LOPJ77BN
10 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:18:00 LOPJ77BN
Notificado Con Acta de Hechos 20/12/2003 17:56:45 LOPJ77BN
11 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:19:00 LOPJ77BN
Notificado Con Acta de Hechos 21/12/2003 11:12:16 LOPJ77BN
12 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:22:00 LOPJ77BN
Notificado Con Acta de Hechos 21/12/2003 11:22:18 LOPJ77BN
13 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:21:00 LOPJ77BN
Notificado Con Acta de Hechos 21/12/2003 11:30:04 LOPJ77BN
14 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:22:00 LOPJ77BN
Notificado Con Acta de Hechos 21/12/2003 11:36:45 LOPJ77BN
15 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:23:00 LOPJ77BN
Notificado Con Acta de Hechos 21/12/2003 11:46:55 LOPJ77BN
16 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:23:00 LOPJ77BN
Notificado Con Acta de Hechos 21/12/2003 11:54:59 LOPJ77BN


Sin embargo necesito separar los campos por tabuladores de acuerdo a lo siguiente:
Código: Seleccionar todo
Adu Agente Documento Sec T.O C.D R.F.C. Resultado Momento Usuario

para que quede un archivo con la estructura:
Código: Seleccionar todo
90   9090   3001295   0    Imp      A1     LOPJ771123EX7    Dictaminado      18/03/2003 17:17:00     LOPJ77BN
90   9090   3001295   0         LOPJ771123EX8    Notificado Con Acta de Hechos      20/03/2003 20:12:27     LOPJ77BN
90   9090   3001787   0    Imp      A1     LOPJ771123EX9    Dictaminado      11/04/2003 21:02:00     LOPJ77BN
90   9090   3001787   0         LOPJ771123EX10    Notificado Con Acta de Hechos      14/04/2003 12:54:34     LOPJ77BN
90   9090   3002206   0    Imp      A1     LOPJ771123EX11    Dictaminado      07/05/2003 21:51:00     LOPJ77BN
90   9090   3002206   0         LOPJ771123EX12    Notificado Con Acta de Hechos      08/05/2003 14:20:23     LOPJ77BN
90   9090   3004066   0    Imp      A1     LOPJ771123EX13    Dictaminado      12/08/2003 20:19:00     LOPJ77BN
90   9090   3004066   0         LOPJ771123EX14    Notificado Con Acta de Hechos      15/08/2003 16:08:24     LOPJ77BN
90   9090   3004072   0    Imp      A1     LOPJ771123EX15    Dictaminado      12/08/2003 20:20:00     LOPJ77BN
90   9090   3004072   0         LOPJ771123EX16    Notificado Con Acta de Hechos      15/08/2003 18:20:04     LOPJ77BN
90   9090   3005106   0    Imp      A1     LOPJ771123EX17    Dictaminado      07/10/2003 14:39:00     LOPJ77BN
90   9090   3005106   0         LOPJ771123EX18    Notificado Con Acta de Hechos      09/10/2003 18:40:28     LOPJ77BN
90   9090   3006510   1    Imp      A1     LOPJ771123EX19    Dictaminado      18/12/2003 19:14:00     LOPJ77BN
90   9090   3006510   1         LOPJ771123EX20    Notificado Con Acta de Hechos      20/12/2003 16:30:15     LOPJ77BN
90   9090   3006510   2    Imp      A1     LOPJ771123EX21    Dictaminado      18/12/2003 19:14:00     LOPJ77BN
90   9090   3006510   2         LOPJ771123EX22    Notificado Con Acta de Hechos      20/12/2003 16:43:34     LOPJ77BN
90   9090   3006510   3    Imp      A1     LOPJ771123EX23    Dictaminado      18/12/2003 19:15:00     LOPJ77BN
90   9090   3006510   3         LOPJ771123EX24    Notificado Con Acta de Hechos      20/12/2003 16:54:08     LOPJ77BN
90   9090   3006510   4    Imp      A1     LOPJ771123EX25    Dictaminado      18/12/2003 19:16:00     LOPJ77BN
90   9090   3006510   4         LOPJ771123EX26    Notificado Con Acta de Hechos      20/12/2003 17:05:38     LOPJ77BN
90   9090   3006510   5    Imp      A1     LOPJ771123EX27    Dictaminado      18/12/2003 19:16:00     LOPJ77BN
90   9090   3006510   5         LOPJ771123EX28    Notificado Con Acta de Hechos      20/12/2003 17:14:36     LOPJ77BN
90   9090   3006510   6    Imp      A1     LOPJ771123EX29    Dictaminado      18/12/2003 19:17:00     LOPJ77BN
90   9090   3006510   6         LOPJ771123EX30    Notificado Con Acta de Hechos      20/12/2003 17:25:39     LOPJ77BN
90   9090   3006510   7    Imp      A1     LOPJ771123EX31    Dictaminado      18/12/2003 19:17:00     LOPJ77BN
90   9090   3006510   7         LOPJ771123EX32    Notificado Con Acta de Hechos      20/12/2003 17:35:33     LOPJ77BN
90   9090   3006510   8    Imp      A1     LOPJ771123EX33    Dictaminado      18/12/2003 19:19:00     LOPJ77BN
90   9090   3006510   8         LOPJ771123EX34    Notificado Con Acta de Hechos      20/12/2003 17:42:02     LOPJ77BN
90   9090   3006510   9    Imp      A1     LOPJ771123EX35    Dictaminado      18/12/2003 19:18:00     LOPJ77BN
90   9090   3006510   9         LOPJ771123EX36    Notificado Con Acta de Hechos      20/12/2003 17:49:46     LOPJ77BN
90   9090   3006510   10    Imp      A1     LOPJ771123EX37    Dictaminado      18/12/2003 19:18:00     LOPJ77BN
90   9090   3006510   10         LOPJ771123EX38    Notificado Con Acta de Hechos      20/12/2003 17:56:45     LOPJ77BN
90   9090   3006510   11    Imp      A1     LOPJ771123EX39    Dictaminado      18/12/2003 19:19:00     LOPJ77BN
90   9090   3006510   11         LOPJ771123EX40    Notificado Con Acta de Hechos      21/12/2003 11:12:16     LOPJ77BN
90   9090   3006510   12    Imp      A1     LOPJ771123EX41    Dictaminado      18/12/2003 19:22:00     LOPJ77BN
90   9090   3006510   12         LOPJ771123EX42    Notificado Con Acta de Hechos      21/12/2003 11:22:18     LOPJ77BN
90   9090   3006510   13    Imp      A1     LOPJ771123EX43    Dictaminado      18/12/2003 19:21:00     LOPJ77BN
90   9090   3006510   13         LOPJ771123EX44    Notificado Con Acta de Hechos      21/12/2003 11:30:04     LOPJ77BN
90   9090   3006510   14    Imp      A1     LOPJ771123EX45    Dictaminado      18/12/2003 19:22:00     LOPJ77BN
90   9090   3006510   14         LOPJ771123EX46    Notificado Con Acta de Hechos      21/12/2003 11:36:45     LOPJ77BN
90   9090   3006510   15    Imp      A1     LOPJ771123EX47    Dictaminado      18/12/2003 19:23:00     LOPJ77BN
90   9090   3006510   15         LOPJ771123EX48    Notificado Con Acta de Hechos      21/12/2003 11:46:55     LOPJ77BN
90   9090   3006510   16    Imp      A1     LOPJ771123EX49    Dictaminado      18/12/2003 19:23:00     LOPJ77BN
90   9090   3006510   16         LOPJ771123EX50    Notificado Con Acta de Hechos      21/12/2003 11:54:59     LOPJ77BN


Ya hice algunas expresiones regulares,
Sintáxis: [ Descargar ] [ Ocultar ]
Using perl Syntax Highlighting
($aduana, $patente, $pedimento, $sec, $to, $cd, $rfc, $resultado, $momento, $usuario) = $_ =~ /(\d+) (\d+) (\d+) (\d+) (\w+) (\w*\d*) *(\w*\&*\w*|\&\w*.+?) *(\w.+?) (\d*\/\d*\/\d* \d*\:\d*\:\d*) (\w*\d*)/;
Coloreado en 0.002 segundos, usando GeSHi 1.0.8.4


pero a veces no detecta todos los campos ya que algunos comienzan con 4 números y otros con 7 y otros con 2 (o más). ¿Alguien me podrá echar una mano? ¡¡Gracias!!

¡¡Saludos!! :)
jclp77
Perlero nuevo
Perlero nuevo
 
Mensajes: 21
Registrado: 2006-09-06 12:04 @544
Ubicación: México

Publicidad

Notapor AkonD » 2006-09-21 15:49 @700

Deberias usar el cuantificador {m,s}
m lo sustituyes por el mínimo de veces que quieres que se encuentre y n por el máximo.

ejemplo:
if($campo =~ /\d{5,10}/){ #hay entre 5 y 10 números }

salu2
AkonD
Perlero nuevo
Perlero nuevo
 
Mensajes: 50
Registrado: 2005-10-06 06:36 @316
Ubicación: España

Notapor jclp77 » 2006-09-21 18:10 @799

Que tal,

Dependiendo de la linea, hago lo que comentas:
if ($_ =~ /^\d{2} /){ #Para cuando empieza con dos digitos.
#90 9090 3001295 0 Imp A1 LOPJ771123EX7 Dictaminado 18/03/2003 17:17:00 LOPJ77BN
...
}

if ($_ =~ /^\d{3,4} /){ #Para cuando empieza con 4 digitos
#9090 3001295 0 Imp A1 LOPJ771123EX7 Dictaminado 18/03/2003 17:17:00 LOPJ77BN
...
}
}if ($_ =~ /^\d{7} /g){#Para cuando empieza con 4 digitos
#3001295 0 Imp A1 LOPJ771123EX7 Dictaminado 18/03/2003 17:17:00 LOPJ77BN

Pero el problema es para los casos cuando el campo es:
2 Imp A1 LOPJ771123EX7 Dictaminado 18/12/2003 19:14:00 LOPJ77BN
ya que el primer campo puede ser hasta 3 caracteres pero se confunde con el primer caso,

estaba pensando hacer algo así:
if ($_ =~ /^\d*\w{3}/){
para detectar "2 Imp" pero no me funciona... alguna sugerencia??

Saludos
jclp77
Perlero nuevo
Perlero nuevo
 
Mensajes: 21
Registrado: 2006-09-06 12:04 @544
Ubicación: México

Notapor explorer » 2006-09-22 09:58 @457

Yo he encontrado una solución, pero lo que no sé es de dónde sale la cadena 'LOPJ771123EX50' de la última línea de la salida.

Con este programa:
Sintáxis: [ Descargar ] [ Ocultar ]
Using perl Syntax Highlighting
#!/usr/bin/perl -l

@archivo = do { open ARCHIVO, "<kk.txt"; <ARCHIVO> };

# Se supone que la primera línea tiene los campos
@titulares = split(" ", shift @archivo);
print join("\t",@titulares);

# Recorremos todo el resto de las líneas
foreach ( @archivo ) {

    # Dividimos los campos de la línea separados por el espacio en blanco
    @campos = split " ";

    # Si la línea no empieza con un número,
    # se trata de un resultado
    if ( /^\D/ ) {
        ($momento_fecha,$momento_hora,$usuario) = @campos[-3..-1];
        $resultado = join(" ",@campos[0..$#campos-3]);
    }

    # Según el número de campos, hacemos una cosa u otra
    elsif ( @campos == 11 ) {
        ($aduana,$agente,$documento,$sec,$to,$cd,$rfc,$resultado,$momento_fecha,$momento_hora,$usuario) = @campos;
    }
    elsif ( @campos == 9  ) {
        ($documento,$sec,$to,$cd,$rfc,$resultado,$momento_fecha,$momento_hora,$usuario) = @campos;
    }
    else {# @campos == 8  ) {
        ($sec,$to,$cd,$rfc,$resultado,$momento_fecha,$momento_hora,$usuario) = @campos;
    }

    # Pintamos el resultado
    $momento = "$momento_fecha $momento_hora";
    print join("\t",($aduana,$agente,$documento,$sec,$to,$cd,$rfc,$resultado,$momento,$usuario));
}
Coloreado en 0.002 segundos, usando GeSHi 1.0.8.4
me sale esto:
Código: Seleccionar todo
Adu     Agente  Documento       Sec     T.O     C.D     R.F.C.  Resultado       Momento Usuario
90      9090    3001295 0       Imp     A1      LOPJ771123EX7   Dictaminado     18/03/2003 17:17:00     LOPJ77BN
90      9090    3001295 0       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   20/03/2003 20:12:27     LOPJ77BN
90      9090    3001787 0       Imp     A1      LOPJ771123EX7   Dictaminado     11/04/2003 21:02:00     LOPJ77BN
90      9090    3001787 0       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   14/04/2003 12:54:34     LOPJ77BN
90      9090    3002206 0       Imp     A1      LOPJ771123EX7   Dictaminado     07/05/2003 21:51:00     GAPK79B4
90      9090    3002206 0       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   08/05/2003 14:20:23     LOPJ77BN
90      9090    3004066 0       Imp     A1      LOPJ771123EX7   Dictaminado     12/08/2003 20:19:00     LOPJ77BN
90      9090    3004066 0       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   15/08/2003 16:08:24     LOPJ77BN
90      9090    3004072 0       Imp     A1      LOPJ771123EX7   Dictaminado     12/08/2003 20:20:00     LOPJ77BN
90      9090    3004072 0       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   15/08/2003 18:20:04     LOPJ77BN
90      9090    3005106 0       Imp     A1      LOPJ771123EX7   Dictaminado     07/10/2003 14:39:00     LOPJ77BN
90      9090    3005106 0       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   09/10/2003 18:40:28     LOPJ77BN
90      9090    3006510 1       Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:14:00     LOPJ77BN
90      9090    3006510 1       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   20/12/2003 16:30:15     LOPJ77BN
90      9090    3006510 2       Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:14:00     LOPJ77BN
90      9090    3006510 2       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   20/12/2003 16:43:34     LOPJ77BN
90      9090    3006510 3       Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:15:00     LOPJ77BN
90      9090    3006510 3       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   20/12/2003 16:54:08     LOPJ77BN
90      9090    3006510 4       Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:16:00     LOPJ77BN
90      9090    3006510 4       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   20/12/2003 17:05:38     LOPJ77BN
90      9090    3006510 5       Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:16:00     LOPJ77BN
90      9090    3006510 5       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   20/12/2003 17:14:36     LOPJ77BN
90      9090    3006510 6       Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:17:00     LOPJ77BN
90      9090    3006510 6       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   20/12/2003 17:25:39     LOPJ77BN
90      9090    3006510 7       Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:17:00     LOPJ77BN
90      9090    3006510 7       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   20/12/2003 17:35:33     LOPJ77BN
90      9090    3006510 8       Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:19:00     LOPJ77BN
90      9090    3006510 8       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   20/12/2003 17:42:02     LOPJ77BN
90      9090    3006510 9       Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:18:00     LOPJ77BN
90      9090    3006510 9       Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   20/12/2003 17:49:46     LOPJ77BN
90      9090    3006510 10      Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:18:00     LOPJ77BN
90      9090    3006510 10      Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   20/12/2003 17:56:45     LOPJ77BN
90      9090    3006510 11      Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:19:00     LOPJ77BN
90      9090    3006510 11      Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   21/12/2003 11:12:16     LOPJ77BN
90      9090    3006510 12      Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:22:00     LOPJ77BN
90      9090    3006510 12      Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   21/12/2003 11:22:18     LOPJ77BN
90      9090    3006510 13      Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:21:00     LOPJ77BN
90      9090    3006510 13      Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   21/12/2003 11:30:04     LOPJ77BN
90      9090    3006510 14      Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:22:00     LOPJ77BN
90      9090    3006510 14      Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   21/12/2003 11:36:45     LOPJ77BN
90      9090    3006510 15      Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:23:00     LOPJ77BN
90      9090    3006510 15      Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   21/12/2003 11:46:55     LOPJ77BN
90      9090    3006510 16      Imp     A1      LOPJ771123EX7   Dictaminado     18/12/2003 19:23:00     LOPJ77BN
90      9090    3006510 16      Imp     A1      LOPJ771123EX7   Notificado Con Acta de Hechos   21/12/2003 11:54:59     LOPJ77BN
que seguro que NO es lo que quieres...
Última edición por explorer el 2006-10-02 09:04 @419, editado 1 vez en total
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14480
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Notapor jclp77 » 2006-09-22 13:07 @588

¡¡¡Esta excelente la solución, la verdad es que me ayudaste a resolver el problema!!!.

Y el LOPJ771123EX50 fue a consecuencia de hacer la númeración en Excel. :roll:

Saludos.

P.D. Aprovechando el viaje... ¿tendrás alguna dirección electrónica donde pueda conseguir mayor información de las expresiones regulares (aparte de la serie o'reilly)?. :D
jclp77
Perlero nuevo
Perlero nuevo
 
Mensajes: 21
Registrado: 2006-09-06 12:04 @544
Ubicación: México

Notapor explorer » 2006-09-22 15:26 @685

JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14480
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España


Volver a Básico

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 2 invitados

cron