• Publicidad

Crear lista de coincidencias de determinados elementos

Perl aplicado a la bioinformática

Crear lista de coincidencias de determinados elementos

Notapor mpar4 » 2011-04-13 13:04 @586

¡Hola!

Soy nueva en este foro y no entiendo mucho de Perl pero tengo que hacer lo siguiente:

Tengo un archivo con unas reacciones y unas enzimas que ya tengo separadas y ordenadas un poco, entonces lo que debo hacer ahora es contar las veces que sale cada enzima, es decir, crear una lista de coincidencias de cada elemento para poder luego separar los elementos más abundantes de los menos abundantes.

Debajo tengo la lista de las enzimas.

Espero que alguien me pueda ayudar porque ¡¡no sé cómo hacerlo!! :(

Muchas Gracias.

Sintáxis: [ Descargar ] [ Ocultar ]
Using text Syntax Highlighting
Enzims amb reactius-productes comuns:

NUCLEOSIDE DIPHOSPHATE KINASE   GUANYLATE KINASE
GLUTAMYL TRNA REDUCTASE GLUTAMYL-TRNA SYNTHETASE
OXYGEN-INDEPENDENT COPROPORPHYRINOGEN III OXIDASE       UROPORPHYRINOGEN DECARBOXYLASE
dihydroxy-acid dehydratase      KETOL-ACID REDUCTOISOMERASE
MALONYL COA-ACYL CARRIER PROTEIN TRANSACYLASE   1-ACYL-SN-GLYCEROL-3-PHOSPHATE ACYLTRANSFERASE
predicted antiporter of Na+/H+  predicted symporter of Na+/L-glutamate
NUCLEOSIDE DIPHOSPHATE KINASE   THYMIDYLATE KINASE
LEUCYL-TRNA SYNTHETASE  BRANCHED-CHAIN AMINO ACID AMINOTRANSFERASE
ADENOSYLMETHIONINE-8-AMINO-7-OXONONANOATE AMINOTRANSFERASE      8-amino-7-oxononanoate synthase
DIAMINOPIMELATE EPIMERASE       SUCCINYL-DIAMINOPIMELATE DESUCCINYLASE
GERANYLTRANSTRANSFERASE geranyl diphosphate synthase
RIBOFLAVIN KINASE       RIBOFLAVIN SYNTHASE BETA CHAIN
succinate dehydrogenase cytochrome <i>c</i> reductase
malate dehydrogenase    putative peroxidase
cytochrome <i>c</i> reductase   putative CYTOCHROME C PEROXIDASE
PHOSPHO-N-ACETYLMURAMOYL-PENTAPEPTIDE- TRANSFERASE      D-ALANYL-D-ALANINE-ADDING ENZYME
predicted ATP transporter of an amino acid      cystathionine &beta;-synthase
deoxyinosine phosphorylase      hypoxanthine phosphoribosyltransferase
putative UNDECAPRENYL-PHOSPHATE-ALPHA-N- ACETYLGLUCOSAMINYLTRANSFERASE  UDP-N-ACETYLGLUCOSAMINE PYROPHOSPHORYLASE
ALANYL-TRNA SYNTHETASE  predicted symporter of Na+/L-alanine
ISOCITRATE DEHYDROGENASE        ACONITATE HYDRATASE
BRANCHED-CHAIN AMINO ACID AMINOTRANSFERASE      dihydroxy-acid dehydratase
ASPARTATE AMINOTRANSFERASE      cysteine dioxygenase
DEOXYCYTIDINE TRIPHOSPHATE DEAMINASE    NUCLEOSIDE DIPHOSPHATE KINASE
GLYCEROL-3-PHOSPHATE DEHYDROGENASE      glycerol-3-phosphate-dehydrogenase-[NAD+]
NAD+ synthase, NH3-dependent    threonine dehydratase (biosynthetic)
UDP-N-ACETYLMURAMYL-TRIPEPTIDE SYNTHETASE       UDP-N-ACETYLMURAMOYLALANINE--D-GLUTAMATE LIGASE
threonine dehydratase (biosynthetic)    THREONINE SYNTHASE
D-Amino acid dehydrogenase      ALANINE RACEMASE
putative peroxidase     dihydroorotate oxidase
UDP-N-ACETYLGLUCOSAMINE--N-ACETYLMURAMYL- (PENTAPEPTIDE) PYROPHOSPHORYL-UNDECAPRENOL N-ACETYLGLUCOSAMINE TRANSFERASE    PHOSPHO-N-ACETYLMURAMOYL-PENTAPEPTIDE- TRANSFERASE
RIBULOSE-PHOSPHATE 3-EPIMERASE  RIBOSE 5-PHOSPHATE ISOMERASE
1-pyrroline-5-carboxylate dehydrogenase NADH dehydrogenase I
BETA-KETOACYL-ACP SYNTHASE III  MALONYL COA-ACYL CARRIER PROTEIN TRANSACYLASE
ornithine decarboxylase, biosynthetic   arginase
transketolase   PHOSPHO-2-DEHYDRO-3-DEOXYHEPTONATE ALDOLASE
METHIONYL-TRNA FORMYLTRANSFERASE        METHIONYL-TRNA SYNTHETASE
hypoxanthine phosphoribosyltransferase  amidophosphoribosyl transferase
putative peroxidase     malate dehydrogenase
XANTHINE-GUANINE PHOSPHORIBOSYLTRANSFERASE      PURINE NUCLEOSIDE PHOSPHORYLASE
putative 2,3,4,5-TETRAHYDROPYRIDINE-2-CARBOXYLATE N-SUCCINYLTRANSFERASE methylmalonyl-CoA mutase
ADENYLOSUCCINATE LYASE  ADENYLOSUCCINATE SYNTHETASE
putative PEPTIDE METHIONINE SULFOXIDE REDUCTASE THIOL PEROXIDASE
L-SERYL-TRNA(SER) SELENIUM TRANSFERASE  SERYL-TRNA SYNTHETASE
S-adenosylmethionine synthetase S-ADENOSYLMETHIONINE TRNA RIBOSYLTRANSFERASE-ISOMERASE
GDP diphosphokinase     GUANOSINE-3,5-BIS(DIPHOSPHATE) 3-PYROPHOSPHOHYDROLASE
D-ALANYL-D-ALANINE-ADDING ENZYME        UDP-N-ACETYLMURAMYL-TRIPEPTIDE SYNTHETASE
ACETATE KINASE  acetoacetyl-CoA transferase
aspartate kinase III    L-asparaginase II
glycerol-3-phosphate-dehydrogenase-[NAD+]       glucose dehydrogenase
predicted symporter of Na+/L-glutamate  predicted antiporter of Na+/H+
SERINE HYDROXYMETHYLTRANSFERASE methylenetetrahydrofolate dehydrogenase-(NADP+)
3-PHOSPHOSHIKIMATE 1-CARBOXYVINYL TRANSFERASE   3-deoxy-D-manno-octulosonic acid 8-phosphate synthase
ANTHRANILATE PHOSPHORIBOSYLTRANSFERASE  ANTHRANILATE SYNTHASE COMPONENT II
BRANCHED-CHAIN AMINO ACID AMINOTRANSFERASE      dihydroxy-acid dehydratase
UDP-N-ACETYLGLUCOSAMINE PYROPHOSPHORYLASE       NUCLEOSIDE DIPHOSPHATE KINASE
THREONINE SYNTHASE      HOMOSERINE KINASE
dihydroxy-acid dehydratase      KETOL-ACID REDUCTOISOMERASE
BIOTIN SYNTHETASE       DETHIOBIOTIN SYNTHETASE
CDP-DIACYLGLYCEROL PYROPHOSPHATASE      CDP-DIACYLGLYCEROL SYNTHASE
1-pyrroline-5-carboxylate dehydrogenase Cytochrome oxidase
LYSYL-TRNA SYNTHETASE   DIAMINOPIMELATE DECARBOXYLASE
2-KETO-3-DEOXY-6-PHOSPHOGLUCONATE ALDOLASE      PHOSPHOGLUCONATE DEHYDRATASE
cystathionine &beta;-synthase   SERINE HYDROXYMETHYLTRANSFERASE
aspartate-semialdehyde dehydrogenase    HOMOSERINE DEHYDROGENASE
TRANSALDOLASE   transketolase
CDP-DIACYLGLYCEROL SYNTHASE     NUCLEOSIDE DIPHOSPHATE KINASE
putative THIOREDOXIN REDUCTASE  glutamate synthase (NADPH)
PANTOATE--BETA-ALANINE LIGASE   ASPARTATE 1-DECARBOXYLASE
folylpoly-&gamma;-glutamate synthetase  predicted symporter of Na+/L-glutamate
GUANYLATE KINASE        GMP REDUCTASE
amidophosphoribosyl transferase hypoxanthine phosphoribosyltransferase
GAMMA-GLUTAMYLTRANSPEPTIDASE    predicted ATP transporter of an amino acid
UDP-N-ACETYLMURAMOYLALANINE--D-GLUTAMATE LIGASE UDP-N-ACETYLMURAMATE--ALANINE LIGASE
UROPORPHYRINOGEN DECARBOXYLASE  putative UROPORPHYRINOGEN-III SYNTHASE
PHOSPHATIDYLSERINE DECARBOXYLASE        PHOSPHATIDYLSERINE SYNTHASE
3-DEHYDROQUINATE DEHYDRATASE    3-DEHYDROQUINATE SYNTHASE
DETHIOBIOTIN SYNTHETASE ADENOSYLMETHIONINE-8-AMINO-7-OXONONANOATE AMINOTRANSFERASE
Fumarate reductase      succinate dehydrogenase
UDP-GLUCOSE 4-EPIMERASE UTP--GLUCOSE-1-PHOSPHATE URIDYLYLTRANSFERASE
Fumarate reductase      FERROCHELATASE
PROLYL-TRNA SYNTHETASE  predicted symporter of Na+/L-proline
ASPARTATE CARBAMOYLTRANSFERASE CATALYTIC CHAIN  carbamoyl phosphate synthetase
PROTOPORPHYRINOGEN OXIDASE      OXYGEN-INDEPENDENT COPROPORPHYRINOGEN III OXIDASE
L-glutamine:D-fructose-6-phosphate aminotransferase     glutamate synthase (NADPH)
GLUTAMYL-TRNA SYNTHETASE        GLUTAMYL TRNA REDUCTASE
aminodeoxychorismate lyase      P-AMINOBENZOATE SYNTHETASE
hydroxymethylglutaryl-CoA synthase      pyruvate formate-lyase 4
glucose dehydrogenase   glycerol-3-phosphate-dehydrogenase-[NAD+]
UDP-N-ACETYLMURAMOYLALANINE--D-GLUTAMATE LIGASE GLUTAMATE RACEMASE
UDP-N-ACETYLMURAMYL-TRIPEPTIDE SYNTHETASE       DIAMINOPIMELATE EPIMERASE
triose phosphate isomerase      FRUCTOSE-BISPHOSPHATE ALDOLASE
PHOSPHATIDYLGLYCEROPHOSPHATASE A        PHOSPHATIDYLGLYCEROPHOSPHATE SYNTHASE
URIDYLATE KINASE        OROTIDINE 5-PHOSPHATE DECARBOXYLASE
carbamoyl phosphate synthetase  predicted SECONDARY transporter of H+/phosphate
3-deoxy-D-manno-octulosonic acid 8-phosphate synthase   predicted SECONDARY transporter of H+/phosphate
putative DGTP PYROPHOSPHOHYDROLASE      NUCLEOSIDE DIPHOSPHATE KINASE
putative spermidine synthase    ornithine decarboxylase, biosynthetic
glucose-6-phosphate isomerase   phosphoglucomutase
FOLYLPOLYGLUTAMATE SYNTHASE     SERINE HYDROXYMETHYLTRANSFERASE
phosphoribosylanthranilate isomerase    ANTHRANILATE PHOSPHORIBOSYLTRANSFERASE
ADENINE PHOSPHORIBOSYLTRANSFERASE       GDP diphosphokinase
3-DEOXY-D-MANNO-OCTULOSONIC-ACID TRANSFERASE    tetraacyldisaccharide 4'-kinase
succinate dehydrogenase Fumarate reductase
TRYPTOPHAN SYNTHASE ALPHA CHAIN INDOLE-3-GLYCEROL PHOSPHATE SYNTHASE
putative UROPORPHYRINOGEN-III SYNTHASE  PORPHOBILINOGEN DEAMINASE
FERROCHELATASE  PROTOPORPHYRINOGEN OXIDASE
cysteine dioxygenase    CYSTEINE SYNTHASE
ANTHRANILATE SYNTHASE COMPONENT II      CHORISMATE SYNTHASE
THIAMINE PHOSPHATE PYROPHOSPHORYLASE    PHOSPHOMETHYLPYRIMIDINE KINASE
transketolase   RIBULOSE-PHOSPHATE 3-EPIMERASE
GUANYLATE KINASE        putative DGTP PYROPHOSPHOHYDROLASE
7, 8-DIHYDRO-6-HYDROXYMETHYLPTERIN-PYROPHOSPHOKINASE    DIHYDRONEOPTERIN ALDOLASE
3-DEOXY-D-MANNO-OCTULOSONIC-ACID TRANSFERASE    3-DEOXY-MANNO-OCTULOSONATE CYTIDYLYLTRANSFERASE
TRNA (GUANINE-N1)-METHYLTRANSFERASE     PEPTIDYL-TRNA HYDROLASE
glycerol-3-phosphate-dehydrogenase-[NAD+]       triose phosphate isomerase
ASPARTATE AMINOTRANSFERASE      predicted SECONDARY transporter of H+/alpha-ketoglutarate
CDP-DIACYLGLYCEROL SYNTHASE     1-ACYL-SN-GLYCEROL-3-PHOSPHATE ACYLTRANSFERASE
L-glutamine:D-fructose-6-phosphate aminotransferase     TRANSALDOLASE
tetraacyldisaccharide 4'-kinase LIPID-A-DISACCHARIDE SYNTHASE
glutamate synthase (NADPH)      putative THIOREDOXIN REDUCTASE
NADH dehydrogenase I    1-pyrroline-5-carboxylate dehydrogenase
PHOSPHOPENTOMUTASE      PURINE NUCLEOSIDE PHOSPHORYLASE
GUANOSINE-5-TRIPHOSPHATE,3-DIPHOSPHATE PYROPHOSPHATASE  GTP pyrophosphokinase
PHOSPHOENOLPYRUVATE SYNTHASE    pyruvate formate-lyase 4
CHORISMATE SYNTHASE     3-PHOSPHOSHIKIMATE 1-CARBOXYVINYL TRANSFERASE
MALONYL COA-ACYL CARRIER PROTEIN TRANSACYLASE   acetyl-CoA carboxyltransferase
NAD+ synthase, NH3-dependent    nicotinate-mononucleotide adenylyltransferase
DNA (cytosine-5) methyltransferase      S-adenosylmethionine synthetase
GTP CYCLOHYDROLASE II   PROTOPORPHYRINOGEN OXIDASE
deoxyadenosine phosphorylase    PURINE NUCLEOSIDE PHOSPHORYLASE
D-ALANYL-D-ALANINE-ADDING ENZYME        D-ALANINE--D-ALANINE LIGASE
DEOXYURIDINE 5-TRIPHOSPHATE NUCLEOTIDOHYDROLASE NUCLEOSIDE DIPHOSPHATE KINASE
cytochrome <i>c</i> reductase   succinate dehydrogenase
GLYCINAMIDE RIBONUCLEOTIDE SYNTHETASE   amidophosphoribosyl transferase
THIAMINE PHOSPHATE PYROPHOSPHORYLASE    HYDROXYETHYLTHIAZOLE KINASE
pyruvate formate-lyase 4        hydroxymethylglutaryl-CoA synthase
NUCLEOSIDE DIPHOSPHATE KINASE   UDP-N-ACETYLGLUCOSAMINE--N-ACETYLMURAMYL- (PENTAPEPTIDE) PYROPHOSPHORYL-UNDECAPRENOL N-ACETYLGLUCOSAMINE TRANSFERASE
DIHYDROPTEROATE SYNTHASE        aminodeoxychorismate lyase
THIOL PEROXIDASE        putative PEPTIDE METHIONINE SULFOXIDE REDUCTASE
NUCLEOSIDE DIPHOSPHATE KINASE   POLYRIBONUCLEOTIDE NUCLEOTIDYLTRANSFERASE
pyruvate formate-lyase 4        FORMYLTETRAHYDROFOLATE HYDROLASE
methylenetetrahydrofolate dehydrogenase-(NADP+) 5,10-methylenetetrahydrofolate reductase
ENOLASE 2,3-BISPHOSPHOGLYCERATE-INDEPENDENT PHOSPHOGLYCERATE MUTASE
TRYPTOPHANYL-TRNA SYNTHETASE    TRYPTOPHAN SYNTHASE ALPHA CHAIN
VALYL-TRNA SYNTHETASE   BRANCHED-CHAIN AMINO ACID AMINOTRANSFERASE
PSEUDOURIDYLATE SYNTHASE I      PHOSPHOPENTOMUTASE
putative CYTOCHROME C PEROXIDASE        cytochrome <i>c</i> reductase
ISOLEUCYL-TRNA SYNTHETASE       BRANCHED-CHAIN AMINO ACID AMINOTRANSFERASE
3-PHOSPHOSHIKIMATE 1-CARBOXYVINYL TRANSFERASE   SHIKIMATE KINASE I
GMP SYNTHETASE  XANTHINE-GUANINE PHOSPHORIBOSYLTRANSFERASE
DETHIOBIOTIN SYNTHETASE arginine decarboxylase, biosynthetic
GUANOSINE-3,5-BIS(DIPHOSPHATE) 3-PYROPHOSPHOHYDROLASE   GDP diphosphokinase
GTP pyrophosphokinase   NUCLEOSIDE DIPHOSPHATE KINASE
cysteine dioxygenase    catalase
DIHYDROPTEROATE SYNTHASE        7, 8-DIHYDRO-6-HYDROXYMETHYLPTERIN-PYROPHOSPHOKINASE
putative PHOSPHOLIPASE A1       putative diacylglycerol cholinephosphotransferase
INDOLE-3-GLYCEROL PHOSPHATE SYNTHASE    phosphoribosylanthranilate isomerase
phosphoglucosamine mutase       L-glutamine:D-fructose-6-phosphate aminotransferase
1-pyrroline-5-carboxylate dehydrogenase putative PYRROLINE-5-CARBOXYLATE REDUCTASE
GLUTAMATE-1-SEMIALDEHYDE 2,1-AMINOMUTASE        GLUTAMYL TRNA REDUCTASE
Coloreado en 0.002 segundos, usando GeSHi 1.0.8.4


Nombre de coincidencies: 161

Imprimir aquellas enzimas de las cuales tenemos menos información:

Sintáxis: [ Descargar ] [ Ocultar ]
Using perl Syntax Highlighting
  1. $VAR1 = 'ENZRXN1FC-75266';
  2. $VAR2 = 'RIBONUCLEASE HII';
  3. $VAR3 = 'ENZRXN1FC-75295';
  4. $VAR4 = 'putative TYPE II RESTRICTION ENZYME';
  5. $VAR5 = 'ENZRXN1FC-2391';
  6. $VAR6 = 'predicted UNKNOWN transporter of Fe';
  7. $VAR7 = 'ENZRXN1FC-75278';
  8. $VAR8 = 'ATP-DEPENDENT PROTEASE LA';
  9. $VAR9 = 'ENZRXN1FC-2401';
  10. $VAR10 = 'predicted UNKNOWN transporter of Ni';
  11. $VAR11 = 'ENZRXN1FC-2353';
  12. $VAR12 = 'predicted UNKNOWN transporter of Fe';
  13. $VAR13 = 'ENZRXN1FC-75183';
  14. $VAR14 = 'TYPE I RESTRICTION ENZYME';
  15. $VAR15 = 'ENZRXN1FC-75404';
  16. $VAR16 = 'TYPE I RESTRICTION ENZYME';
  17. $VAR17 = 'ENZRXN1FC-2410';
  18. $VAR18 = 'predicted UNKNOWN transporter of urea';
  19. $VAR19 = 'ENZRXN1FC-2363';
  20. $VAR20 = 'predicted UNKNOWN transporter of Mg2+';
  21. $VAR21 = 'ENZRXN1FC-75265';
  22. $VAR22 = 'METHIONINE AMINOPEPTIDASE';
  23. $VAR23 = 'ENZRXN1FC-75330';
  24. $VAR24 = 'TYPE I RESTRICTIONENZYME';
  25. $VAR25 = 'ENZRXN1FC-2377';
  26. $VAR26 = 'predicted UNKNOWN transporter of L-proline';
  27. $VAR27 = 'ENZRXN1FC-75410';
  28. $VAR28 = 'DNA GYRASE SUBUNIT B';
  29. $VAR29 = 'ENZRXN1FC-75280';
  30. $VAR30 = 'putative TYPE III RESTRICTION ENZYME';
  31. $VAR31 = 'ENZRXN1FC-2388';
  32. $VAR32 = 'predicted UNKNOWN transporter of Long-Chain-Fatty-Acids';
  33. $VAR33 = 'ENZRXN1FC-75422';
  34. $VAR34 = 'SIGNAL PEPTIDASE I';
  35. $VAR35 = 'ENZRXN1FC-2386';
  36. $VAR36 = 'predicted UNKNOWN transporter of C4-dicarboxylate';
  37. $VAR37 = 'ENZRXN1FC-75120';
  38. $VAR38 = 'putative TYPE II restriction enzyme';
  39. $VAR39 = 'ENZRXN1FC-75181';
  40. $VAR40 = 'putative TYPE I RESTRICTION ENZYME';
  41. $VAR41 = 'ENZRXN1FC-75319';
  42. $VAR42 = 'putative TYPE I RESTRICTION ENZYME';
  43. $VAR43 = 'ENZRXN1FC-75289';
  44. $VAR44 = 'putative RIBONUCLEASE P PROTEIN COMPONENT';
  45. $VAR45 = 'ENZRXN1FC-75179';
  46. $VAR46 = 'TYPE III RESTRICTION ENZYME';
  47. $VAR47 = 'ENZRXN1FC-2375';
  48. $VAR48 = 'predicted UNKNOWN transporter of glycine betaine';
  49. $VAR49 = 'ENZRXN1FC-75129';
  50. $VAR50 = 'DNA TOPOISOMERASE I';
  51. $VAR51 = 'ENZRXN1FC-2384';
  52. $VAR52 = 'predicted UNKNOWN transporter of Fe';
  53. $VAR53 = 'ENZRXN1FC-75403';
  54. $VAR54 = 'TYPE I RESTRICTION ENZYME';
  55. $VAR55 = 'ENZRXN1FC-75182';
  56. $VAR56 = 'TYPE I RESTRICTION ENZYME';
  57. $VAR57 = 'ENZRXN1FC-75440';
  58. $VAR58 = 'RIBONUCLEASE III';
  59. $VAR59 = 'ENZRXN1FC-2370';
  60. $VAR60 = 'predicted UNKNOWN transporter of beta-D-galactose';
  61. $VAR61 = 'ENZRXN1FC-2390';
  62. $VAR62 = 'predicted UNKNOWN transporter of Fe2+';
  63. $VAR63 = 'ENZRXN1FC-75331';
  64. $VAR64 = 'TYPE I RESTRICTION ENZYME';
  65. $VAR65 = 'ENZRXN1FC-75329';
  66. $VAR66 = 'TYPE I RESTRICTION ENZYME';
  67. $VAR67 = 'ENZRXN1FC-2364';
  68. $VAR68 = 'predicted UNKNOWN transporter of Fe';
  69. $VAR69 = 'ENZRXN1FC-2361';
  70. $VAR70 = 'predicted UNKNOWN transporter of Co';
  71. $VAR71 = 'ENZRXN1FC-2408';
  72. $VAR72 = 'predicted UNKNOWN transporter of L-serine';
  73. $VAR73 = 'ENZRXN1FC-75305';
  74. $VAR74 = 'DNA GYRASE SUBUNIT A';
  75. $VAR75 = 'ENZRXN1FC-75194';
  76. $VAR76 = 'putative O-SIALOGLYCOPROTEIN ENDOPEPTIDASE';
  77. $VAR77 = 'ENZRXN1FC-75121';
  78. $VAR78 = 'LIPOPROTEIN SIGNAL PEPTIDASE';
  79. $VAR79 = 'ENZRXN1FC-2392';
  80. $VAR80 = 'predicted UNKNOWN transporter of Fe';
  81. $VAR81 = 'ENZRXN1FC-75302';
  82. $VAR82 = 'putative TYPE II RESTRICTION ENZYME';
  83. $VAR83 = 'ENZRXN1FC-2366';
  84. $VAR84 = 'predicted UNKNOWN transporter of nicotinamide mononucleotide';
Coloreado en 0.004 segundos, usando GeSHi 1.0.8.4
mpar4
Perlero nuevo
Perlero nuevo
 
Mensajes: 5
Registrado: 2011-04-13 12:49 @576

Publicidad

Re: Crear lista de coincidencias de determinados elementos

Notapor explorer » 2011-04-13 18:17 @803

Bienvenida a los foros de Perl en español, mpar4.

No está claro el fichero de entrada.

¿Te refieres a cada línea de entrada? Es decir, ¿hay que contar el número de veces que aparece cada línea?
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14486
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Re: Crear lista de coincidencias de determinados elementos

Notapor mpar4 » 2011-04-14 04:27 @227

¡¡No, perdona!!
Cada elemento que se tiene que contar está separado por tabuladores;
Gracias
mpar4
Perlero nuevo
Perlero nuevo
 
Mensajes: 5
Registrado: 2011-04-13 12:49 @576

Re: Crear lista de coincidencias de determinados elementos

Notapor explorer » 2011-04-14 15:33 @689

¿No tienes algún código ya hecho?

El trabajo consistiría en abrir el fichero, leerlo por línea, cada línea partirla por los tabuladores y extraer la parte que nos interesa, que luego meteremos como clave en un hash, incrementando en uno su valor correspondiente.

Al final, recorrer las claves del hash, sacando los valores en el orden deseado (usar sort()) para ello.
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14486
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Re: Crear lista de coincidencias de determinados elementos

Notapor mpar4 » 2011-04-15 10:24 @475

Sí tengo un programa ya empezado porque antes de esto he tenido que hacer otras cosas con este fichero y lo tengo dentro de un hash. Te pongo aquí lo que tengo de programa:

No sé cómo lo hacéis eso de pegar un trozo de fichero porque no me deja adjuntar nada, no sé si te sirve así pero eso es lo que tengo de programa.

¡¡Espero que puedas ayudarme un poquito, muchas gracias!!

Sintáxis: [ Descargar ] [ Ocultar ]
Using perl Syntax Highlighting
  1. #!/usr/bin/perl
  2.  
  3. ##  SCRIPT PER EXTREURE EL CODI, EL NOM I CADA REACCIO DEL ARXIU "enzymes.col"
  4.  
  5. use strict;
  6. use Data::Dumper;                      ## Llibreria de visualització de dades complexes
  7.  
  8. ## Data::Dumper es un modul que ve inclos en totes les distribucions Perl.
  9. ## Serveix, entre altres coses, per fer un bolcat del contingut de les variables.
  10. ## Aixi podem saber amb que estem treballant i si ho estem fent be.
  11.  
  12. ## Inici de declaracio de variables
  13.  
  14. my %estruct
  15.     ;                                  ## estructura buida DEREFERENCIADA -> tal i com està  declarada no representa res, es a
  16. my $HoHoA
  17.     ;                                  ## dir fins que no REFERENCIEM la variable aquesta no serà  ni '$', ni '@' ni tan sols
  18. ## un '%'
  19.  
  20. ## Amb aquestes variables anirem jugant amb les dades referents a CODIS, NOMS i REACCIONS
  21.  
  22. my ( @codi, @rx_separades, @productes_separats, @reactius_separats );
  23. my ( $codiEnzim, $nomEnzim, $reaccions, $reactius, $productes, $clauR, $clauP,
  24.     $coincidencies );
  25. my ( %hash_de_R, %hash_de_P );
  26.  
  27. sub ExtraccioEnzymes {
  28.  
  29.     open( enzyme, "enzymes.col" ) or die("Error!\n");
  30.  
  31.     while (<enzyme>) {
  32.         chomp;
  33.         if ( $_ =~ /^ENZ/ ) {
  34.  
  35.             @codi = split( /\t/, $_ );
  36.  
  37.             ## Fem una seleccio del que volem que s'imprimeixi o no per pantalla
  38.  
  39.             if (   ( $codi[1] =~ /^predicted UNKNOWN/ )
  40.                 or ( $codi[2] =~ /^\s\s=/ ) ) {
  41.  
  42.                 ## Aqui carregaríem l'estructura
  43.                 %estruct->{ $codi[0] } = $codi[1]
  44.                     ;                  ## Es carrega l'estructura amb totes aquelles linies que no tenen REACCIO
  45.  
  46.             }
  47.             else {
  48.  
  49.                 ## Aquest es el CAS IDEAL :: CODI + NOM + REACCIO
  50.  
  51.                 $codiEnzim = "@codi[0]";    ## Ho transformem tot a string
  52.                 $nomEnzim  = "@codi[1]";
  53.                 $reaccions = "@codi[2]";
  54.  
  55.                 ## Passem cada REACCIO a format ARRAY
  56.  
  57.                 @rx_separades = split( /=/, $reaccions )
  58.                     ;                  ## Fem un SPLIT del string buscant el '=' per separar en un ARRAY reactius i productes
  59.  
  60.                 ## Assignem cada valor de la var @rx_separades a $reactius i $productes
  61.  
  62.                 $reactius = "$rx_separades[0]";
  63.                 my @sense_HTML = split( /<\S+>(\S+)<\S+>/, $reactius )
  64.                     ;                  ## Treiem del string $reactius totes les formes corresponents a :: <sup></sup>,SUB></SUB>
  65.                 $reactius = join( "", @sense_HTML )
  66.                     ;                  ## Juntem aquells components dels reactius que han quedat separats
  67.  
  68.                 #########################################################################
  69.  
  70.                 $productes = "$rx_separades[1]";
  71.                 @sense_HTML = split( /<\S+>(\S+)<\S+>/, $productes )
  72.                     ;                  ## Treiem del string $productes totes les formes corresponents a :: <sup></sup>,SUB></SUB>
  73.                 $productes = join( "", @sense_HTML )
  74.                     ;                  ## Juntem aquells components dels productes que han quedat separats
  75.  
  76.                 ## Segons s'ha comprovat hi han estructures del tipus: <i>XX</i> en la part del nom (p.ex: cytochrome <i>c</i> reductase)
  77.                 ## Per tant també tractarem la variable $nomEnzim:
  78.  
  79.                 if ( $nomEnzim =~ /<\S+>/ ) {
  80.                     my @nom_sense_HTML
  81.                         = split( /<\S+>(\S+)<\S+>/, $nomEnzim );
  82.                     $nomEnzim = join( "", @nom_sense_HTML );
  83.                 }
  84.  
  85.                 ## Separem cada component dels reactius i dels productes
  86.  
  87.                 @reactius_separats
  88.                     = split( /\s\+\s/, $reactius );    ## Separem cada reactiu
  89.                 @productes_separats
  90.                     = split( /\s\+\s/, $productes );  ## Separem cada producte
  91.  
  92.                 ## Els arrays @reactius_separats i @productes_separats contenen espais en blanc de més, i els volem eliminar
  93.  
  94.                 foreach (@reactius_separats) {
  95.                     $_ =~ s/\s\s//g;   #Elimina espais en blanc dels reactius
  96.                 }
  97.                 foreach (@productes_separats) {
  98.                     $_ =~ s/\s\s//g;   #Elimina espais en blanc dels productes
  99.                 }
  100.  
  101.                 ## Creem el array dins el hash dins un altre hash {Hash of Hash of Array} (HoHoA)
  102.  
  103.                 $HoHoA->{$codiEnzim}{$nomEnzim}{P} = [@productes_separats];
  104.                 $HoHoA->{$codiEnzim}{$nomEnzim}{R} = [@reactius_separats];
  105.  
  106.                 ## Descarreguem la informacio de l'estructura $HoHoA:
  107.  
  108.                 foreach my $i ( @{ $$HoHoA{$codiEnzim}{$nomEnzim}{R} } )
  109.                 {                      ## Descarreguem els REACTIUS i els afegim com a KEYS d'un hash on tenim: {reactius} = nomEnzim
  110.                     $hash_de_R{$i} = $codi[1];
  111.  
  112.                 }
  113.                 foreach my $z ( @{ $$HoHoA{$codiEnzim}{$nomEnzim}{P} } )
  114.                 {                      ## Descarreguem els PRODUCTES i els afegim com a KEYS d'un hash on tenim: {productes} = nomEnzim
  115.                     $hash_de_P{$z} = $codi[1];
  116.  
  117.                 }
  118.             }
  119.         }
  120.     }
  121.  
  122.     close(enzyme);
  123.  
  124.     ## Fem la comparacio de productes i reactius ##################################################
  125.  
  126.     ## Assignem les claus de %hash_de_R a la variable $clauR
  127.     ## Assignem les claus de %hash_de_P a la variable $clauP
  128.     ## Establim una comparacio de claus dels DOS hashes utilitzats (%hash_de_R i %hash_de_P)
  129.     ## I definim que si el seu valor es igual no han de ser incloses per no comparar el mateix enzim
  130.  
  131.     ## Partim de la comparacio de reactius amb productes de diferents enzims
  132.  
  133.     print "Enzims amb reactius-productes comuns:\n";
  134.     print "\n";
  135.  
  136.     $coincidencies = 0;
  137.  
  138.     foreach $clauR ( keys %hash_de_R ) {
  139.         foreach $clauP ( keys %hash_de_P ) {
  140.             if (    ( $clauR eq $clauP )
  141.                 and ( $hash_de_R{$clauR} ne $hash_de_P{$clauP} ) ) {
  142.                 print "$hash_de_R{$clauR}\t$hash_de_P{$clauP}\n"
  143.                     ;                  ## Els enzims han d'estar separats per tabuladors pel processament pels programes
  144.                 $coincidencies
  145.                     = $coincidencies + 1;    ## Powergraph i GraphCrunch
  146.             }
  147.         }
  148.     }
  149.     print "\n";
  150.     print "Nombre de coincidencies: $coincidencies\n";
  151.  
  152.     print "\n";
  153.     print "Imprimim aquells enzims dels quals tenim poca informació\n";
  154.     print "\n";
  155.     print Dumper(%estruct)
  156.         ;                              ## Printa per pantalla l'estructura i permet detectar errades
  157.     print "\n";
  158. }
  159.  
  160. ## Cridem la subrutina
  161.  
  162. ExtraccioEnzymes;
  163.  
Coloreado en 0.004 segundos, usando GeSHi 1.0.8.4
Última edición por explorer el 2011-04-15 10:32 @480, editado 1 vez en total
Razón: Formatear el código con Perltidy
mpar4
Perlero nuevo
Perlero nuevo
 
Mensajes: 5
Registrado: 2011-04-13 12:49 @576

Re: Crear lista de coincidencias de determinados elementos

Notapor explorer » 2011-04-15 11:18 @512

Por lo que he visto, el fichero de entrada enzymes.col no corresponde con el que publicaste en el primer mensaje, salvo la primera línea.

No aparece ni el texto predicted UNKNOWN ni ninguna línea que empiece por dos espacios en blanco seguidos por un '=', tal como indican las líneas 39 y 40.

Y unas líneas más abajo, se ve que está extrayendo información en formato HTML, cosa que tampoco sale arriba.


¿No puedes publicar unas pocas líneas de ese fichero, para ver cómo es?
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14486
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Re: Crear lista de coincidencias de determinados elementos

Notapor mpar4 » 2011-04-18 05:35 @274

¡Hola!
Porque durante el programa hemos ido quitando ya los iguales y esas cosas... Te pongo el archivo tal y como estaba al principio, a ver si así me puedes ayudar.

¡Muchas gracias!!

Sintáxis: [ Descargar ] [ Ocultar ]
Using text Syntax Highlighting
  1. # Copyright © 2005, SRI International. All rights reserved.
  2. #
  3. # Authors:
  4. #    Caroline Moore-Kochlacs, SRI International
  5. #    Peter D. Karp, SRI International
  6. #
  7. # Please see the license agreement regarding the use of and distribution of this file.
  8. # The format of this file is defined at http://bioinformatics.ai.sri.com/ptools/flatfile-format.html .
  9. #
  10. # Species: H. pylori J99
  11. # Database: NIL
  12. # Version: 9.5
  13. # File Name: enzymes.col
  14. # Date and time generated: November 9, 2005, 14:59:37
  15. #
  16. #                       1       2       3       4       1       2       3       4       1       2       3       4       1       2       3       4
  17. UNIQUE-ID       NAME    REACTION-EQUATION       PATHWAYS        PATHWAYS        PATHWAYS        PATHWAYS        COFACTORS       COFACTORS       COFACTORS       COFACTORS       ACTIVATORS      ACTIVATORS      ACTIVATORS      ACTIVATORS      INHIBITORS      INHIBITORS      INHIBITORS      INHIBITORS      SUBUNIT-COMPOSITION
  18. ENZRXN1FC-75444 glycerol-3-phosphate dehydrogenase      acceptor + glycerol-3-phosphate  =  reduced acceptor + dihydroxy-acetone-phosphate                                                                                                                                      1*JHP0611-MONOMER
  19. ENZRXN1FC-75443 glycerol-3-phosphate dehydrogenase      glycerol-3-phosphate + ubiquinone-<i>8</i>  =  dihydroxy-acetone-phosphate + ubiquinol-<i>8</i> PWY0-381        AERESPDON-PWY   ANARESPDON-PWY                                                                                                          1*JHP0611-MONOMER
  20. ENZRXN1FC-75442 OXYGEN-INDEPENDENT COPROPORPHYRINOGEN III OXIDASE       NAD(P)<sup>+</sup> + coproporphyrinogen III  =  protoporphyrinogen + NAD(P)H + 2 CO<SUB>2</SUB> HEMESYN2-PWY                                                                                                                            1*JHP0610-MONOMER
  21. ENZRXN1FC-75441 CHORISMATE SYNTHASE     5-enolpyruvyl-shikimate-3-phosphate  =  phosphate + chorismate  ARO-PWY                                                                                                                         1*JHP0608-MONOMER
  22. ENZRXN1FC-75440 RIBONUCLEASE III          =                                                                                                                                     1*JHP0607-MONOMER
  23. ENZRXN1FC-75439 PHOSPHOSERINE PHOSPHATASE       3-phospho-serine + H<SUB>2</SUB>O  =  L-serine + phosphate      GLYSYN-PWY      SERSYN-PWY                                                                                                                      1*JHP0597-MONOMER
  24. ENZRXN1FC-75438 ASPARTATE AMMONIA-LYASE L-aspartate  =  NH<SUB>3</SUB> + fumarate       ASPASN-PWY      GLUTFUMARATE-PWY        GLUTAMINEFUM-PWY                                                                                                                1*JHP0594-MONOMER
  25. ENZRXN1FC-75437 UDP-N-ACETYLGLUCOSAMINE ENOLPYRUVYLTRANSFERASE  UDP-<i>N</i>-acetyl-D-glucosamine + phosphoenolpyruvate  =  UDP-GlcNAc-pyruvate enol ether + phosphate  PEPTIDOGLYCANSYN-PWY                                                                                                                            1*JHP0593-MONOMER
  26. ENZRXN1FC-75436 UTP--GLUCOSE-1-PHOSPHATE URIDYLYLTRANSFERASE    &alpha;-D-glucose-1-phosphate + UTP  =  UDP-D-glucose + pyrophosphate   P61-PWY COLANSYN-PWY    PWY-621 GALACTMETAB-PWY                                                                                                 1*JHP0591-MONOMER
  27. ENZRXN1FC-75435 GLUTAMYL-TRNA SYNTHETASE        tRNA<SUP>glt</SUP> + L-glutamate + ATP  =  L-glutamyl-tRNA<SUP>glt</SUP> + pyrophosphate + AMP  TRNA-CHARGING-PWY       HEMESYN2-PWY                                                                                                                    1*JHP0588-MONOMER
  28. ENZRXN1FC-75434 POLYNUCLEOTIDE ADENYLYLTRANSFERASE      (NUCLEOTIDE)(M) + N ATP  =  (NUCLEOTIDE)(M+N) + N pyrophosphate                                                                                                                                 1*JHP0583-MONOMER
  29. ENZRXN1FC-75433 putative 2,3,4,5-TETRAHYDROPYRIDINE-2-CARBOXYLATE N-SUCCINYLTRANSFERASE H<SUB>2</SUB>O + L-2,3,4,5-tetrahydrodipicolinate + succinyl-CoA  =  <i>N</i>-succinyl-2-amino-6-ketopimelate + coenzyme A      DAPLYSINESYN-PWY                                                                                                                                1*JHP0570-MONOMER
  30. ENZRXN1FC-75432 UDP-N-ACETYLMURAMATE--ALANINE LIGASE    L-alanine + UDP-<i>N</i>-acetylmuramate + ATP  =  UDP-<i>N</i>-acetylmuramoyl-L-alanine + phosphate + ADP       PEPTIDOGLYCANSYN-PWY                                                                                                                            1*JHP0567-MONOMER
  31. ENZRXN1FC-75431 inorganic pyrophosphatase       H<SUB>2</SUB>O + pyrophosphate  =  2 phosphate  P61-PWY                                                                                                                         1*JHP0564-MONOMER
  32. ENZRXN1FC-75430 ADENYLATE KINASE        AMP + ATP  =  ADP + ADP P1-PWY  DENOVOPURINE2-PWY                                                                                                                       1*JHP0561-MONOMER
  33. ENZRXN1FC-75429 ASPARTYL-TRNA SYNTHETASE        tRNA<SUP>asp</SUP> + L-aspartate + ATP  =  L-aspartyl-tRNA<SUP>asp</SUP> + pyrophosphate + AMP  TRNA-CHARGING-PWY                                                                                                                               1*JHP0560-MONOMER
  34. ENZRXN1FC-75428 DNA LIGASE      (deoxynucleotides)<sub>n</sub> + (deoxynucleotides)<sub>(m)</sub> + NAD<sup>+</sup>  =  (deoxynucleotides)(<sub>(n+m)</sub> + nicotinamide mononucleotide + AMP                                                                                                                                 1*JHP0558-MONOMER
  35. ENZRXN1FC-75427 UROPORPHYRINOGEN DECARBOXYLASE  uroporphyrinogen-III  =  4 CO<SUB>2</SUB> + coproporphyrinogen III      HEMESYN2-PWY                                                                                                                            1*JHP0551-MONOMER
  36. ENZRXN1FC-75426 ENDONUCLEASE III        C-O-P bond 3' to AP site in DNA intact  =  C-O-P bond 3' to AP site in DNA is broken. 3'-terminal unsaturated sugar and a product with a terminal 5'-phosphate                                                                                                                                  1*JHP0549-MONOMER
  37. ENZRXN1FC-75425 8-amino-7-oxononanoate synthase L-alanine + 6-carboxyhexanoyl-CoA  =  CO<SUB>2</SUB> + coenzyme A + 8-amino-7-oxononanoate      BIOTIN-SYNTHESIS-PWY    PWY-3701                                                                                                                        1*JHP0545-MONOMER
  38. ENZRXN1FC-75424 ENDONUCLEASE III        C-O-P bond 3' to AP site in DNA intact  =  C-O-P bond 3' to AP site in DNA is broken. 3'-terminal unsaturated sugar and a product with a terminal 5'-phosphate                                                                                                                                  1*JHP0532-MONOMER
  39. ENZRXN1FC-75423 DIHYDROOROTASE  dihydroorotate + H<SUB>2</SUB>O  =  carbamoyl-L-aspartate       PWY0-162                                                                                                                                1*JHP0528-MONOMER
  40. ENZRXN1FC-75422 SIGNAL PEPTIDASE I        =                                                                                                                                     1*JHP0523-MONOMER
  41. ENZRXN1FC-75421 RIBOSE 5-PHOSPHATE ISOMERASE    D-ribose-5-phosphate  =  D-ribulose-5-phosphate GLUCONSUPER-PWY RIBOKIN-PWY     PWY-1861        NONOXIPENT-PWY                                                                                                  1*JHP0521-MONOMER
  42. ENZRXN1FC-75420 ADENINE PHOSPHORIBOSYLTRANSFERASE       AMP + pyrophosphate  =  PRPP + adenine  P1-PWY  SALVADEHYPOX-PWY        P121-PWY                                                                                                                1*JHP0519-MONOMER
  43. ENZRXN1FC-75419 DIAMINOPIMELATE EPIMERASE       L,L-diaminopimelate  =  <i>meso</i>-diaminopimelate     DAPLYSINESYN-PWY                                                                                                                                1*JHP0513-MONOMER
  44. ENZRXN1FC-75418 BETA-KETOACYL-ACP SYNTHASE I    3,4-decenoyl-ACP + malonyl-ACP  =  beta-keto-cis-&Delta;<sup>5</sup>-dodecenoyl-ACP + ACP-SH + CO<SUB>2</SUB>   PWY0-862                                                                                                                                1*JHP0505-MONOMER
  45. ENZRXN1FC-75417 BETA-KETOACYL-ACP SYNTHASE I    acyl-ACP + malonyl-ACP  =  ACP-SH + &beta;-ketoacyl-ACP + CO<SUB>2</SUB>        UNSAT-FA-ELONG-PWY      FASYN-ELONG-PWY                                                                                                                 1*JHP0505-MONOMER
  46. ENZRXN1FC-75416 BETA-KETOACYL-ACP SYNTHASE I    acetyl-ACP + malonyl-ACP  =  ACP-SH + acetoacetyl-ACP + CO<SUB>2</SUB>  FASYN-INITIAL-PWY                                                                                                                               1*JHP0505-MONOMER
  47. ENZRXN1FC-75415 GLUTAMATE RACEMASE      L-glutamate  =  D-glutamate     PEPTIDOGLYCANSYN-PWY                                                                                                                            1*JHP0496-MONOMER
  48. ENZRXN1FC-75414 GLUTAMINE SYNTHETASE    NH<SUB>3</SUB> + L-glutamate + ATP  =  L-glutamine + ADP + phosphate    GLUTAMINE-SYN2-PWY                                                                                                                              1*JHP0461-MONOMER
  49. ENZRXN1FC-75413 DIHYDRODIPICOLINATE REDUCTASE   L-2,3,4,5-tetrahydrodipicolinate + NAD(P)<sup>+</sup>  =  L-2,3-dihydrodipicolinate + NAD(P)H + H<SUP>+</SUP>   DAPLYSINESYN-PWY                                                                                                                                1*JHP0460-MONOMER
  50. ENZRXN1FC-75412 putative Glycolate oxidase      glycolate + O<SUB>2</SUB>  =  glyoxylate + H<SUB>2</SUB>O<SUB>2</SUB>   PWY-181                                                                                                                         1*JHP0459-MONOMER
  51. ENZRXN1FC-75411 putative Glycolate oxidase      O<SUB>2</SUB> + (<i>S</i>)-2-hydroxyacid  =  H<SUB>2</SUB>O<SUB>2</SUB> + a 2-oxo acid                                                                                                                                  1*JHP0459-MONOMER
  52. ENZRXN1FC-75410 DNA GYRASE SUBUNIT B      =                                                                                                                                     1*JHP0453-MONOMER
  53. ENZRXN1FC-75409 putative PHOSPHOLIPASE A1       a phosphatidylcholine + H<SUB>2</SUB>O  =  a 2-lysophosphatidylcholine + a carboxylate                                                                                                                                  1*JHP0451-MONOMER
  54. ENZRXN1FC-75408 UDP-N-ACETYLMURAMOYLALANINE--D-GLUTAMATE LIGASE UDP-<i>N</i>-acetylmuramoyl-L-alanine + D-glutamate + ATP  =  UDP-<i>N</i>-acetylmuramoyl-L-alanyl-D-glutamate + phosphate + ADP        PEPTIDOGLYCANSYN-PWY                                                                                                                            1*JHP0446-MONOMER
  55. ENZRXN1FC-75407 PHOSPHO-N-ACETYLMURAMOYL-PENTAPEPTIDE- TRANSFERASE      UDP-<i>N</i>-acetylmuramoyl-L-alanyl-D-glutamyl-meso-2,6-diaminoheptanedioate- D-alanyl-D-alanine + undecaprenyl phosphate  =  <i>N</i>-acetylmuramoyl-L-alanyl-D-glutamyl-meso-2,6-diaminoheptane- D-alanyl-D-alanine-diphosphoundecaprenol + UMP      PEPTIDOGLYCANSYN-PWY                                                                                                                            1*JHP0445-MONOMER
  56. ENZRXN1FC-75406 PHOSPHO-N-ACETYLMURAMOYL-PENTAPEPTIDE- TRANSFERASE      undecaprenyl phosphate + UDP-N-acetylmuramoyl-L-alanyl-D-glutamyl-L-lysyl-D-alanyl-D-alanine  =  N-acetylmuramoyl-L-alanyl-D-glutamyl-L-lysyl- D-alanyl-D-alanine-diphosphoundecaprenol + UMP                                                                                                                                   1*JHP0445-MONOMER
  57. ENZRXN1FC-75405 GLUTAMYL-TRNA SYNTHETASE        tRNA<SUP>glt</SUP> + L-glutamate + ATP  =  L-glutamyl-tRNA<SUP>glt</SUP> + pyrophosphate + AMP  TRNA-CHARGING-PWY       HEMESYN2-PWY                                                                                                                    1*JHP0428-MONOMER
  58. ENZRXN1FC-75404 TYPE I RESTRICTION ENZYME         =                                                                                                                                     1*JHP0415-MONOMER
  59. ENZRXN1FC-75403 TYPE I RESTRICTION ENZYME         =                                                                                                                                     1*JHP0414-MONOMER
  60. ENZRXN1FC-75402 polyphosphate kinase    long chain polyphosphate + ATP  =  long chain polyphosphate + ADP                                                                                                                                       1*JHP0413-MONOMER
  61. ENZRXN1FC-75401 DIHYDRODIPICOLINATE SYNTHASE    pyruvate + L-aspartate-semialdehyde  =  2 H<SUB>2</SUB>O + L-2,3-dihydrodipicolinate    DAPLYSINESYN-PWY                                                                                                                                1*JHP0410-MONOMER
  62. ENZRXN1FC-75400 PHOSPHATIDYLGLYCEROPHOSPHATE SYNTHASE   CDP-diacylglycerol + glycerol-3-phosphate  =  L-1-phosphatidylglycerol-phosphate + CMP  PHOSLIPSYN2-PWY PHOSLIPSYN-PWY                                                                                                                  1*JHP0407-MONOMER
  63. ENZRXN1FC-75399 7, 8-DIHYDRO-6-HYDROXYMETHYLPTERIN-PYROPHOSPHOKINASE    6-hydroxymethyl-dehydropterin + ATP  =  2-amino-4-hydroxy-6-hydroxymethyl-7,8-dihydropteridine diphosphate + AMP        PWY-3742                                                                                                                                1*JHP0388-MONOMER
  64. ENZRXN1FC-75398 3-DEHYDROQUINATE DEHYDRATASE    3-dehydroquinate  =  H<SUB>2</SUB>O + 3-dehydro-shikimate       ARO-PWY                                                                                                                         1*JHP0386-MONOMER
  65. ENZRXN1FC-75397 HOMOSERINE KINASE       homoserine + ATP  =  O-phospho-L-homoserine + ADP       HOMOSER-THRESYN-PWY                                                                                                                             1*JHP0375-MONOMER
  66. ENZRXN1FC-75396 3-METHYL-2-OXOBUTANOATE HYDROXYMETHYLTRANSFERASE        H<SUB>2</SUB>O + 2-keto-isovalerate + 5,10-methylene-THF  =  2-dehydropantoate + tetrahydrofolate       PANTO-PWY       PWY-3921                                                                                                                        1*JHP0367-MONOMER
  67. ENZRXN1FC-75395 S-ADENOSYLMETHIONINE TRNA RIBOSYLTRANSFERASE-ISOMERASE  tRNA with 7-aminomethyl-7-deazaguanine at position 34 + S-adenosyl-L-methionine  =  adenine + L-methionine + tRNA with epoxyqueuosine at position 34                                                                                                                                    1*JHP0363-MONOMER
  68. ENZRXN1FC-75394 PHOSPHATIDYLSERINE SYNTHASE     CDP-diacylglycerol + L-serine  =  CMP + L-1-phosphatidylserine  PHOSLIPSYN-PWY                                                                                                                          1*JHP0354-MONOMER
  69. ENZRXN1FC-75393 multi-drug resistance protein   xenobiotic[in] + H<SUB>2</SUB>O + ATP  =  xenobiotic[out] + phosphate + ADP                                                                                                                                     1*JHP0343-MONOMER
  70. ENZRXN1FC-75392 ASPARTATE CARBAMOYLTRANSFERASE CATALYTIC CHAIN  L-aspartate + carbamoyl-phosphate  =  carbamoyl-L-aspartate + phosphate PWY0-162                                                                                                                                1*JHP0341-MONOMER
  71. ENZRXN1FC-75391 RIBOFLAVIN KINASE       riboflavin + ATP  =  FMN + ADP  RIBOSYN2-PWY                                                                                                                            1*JHP0338-MONOMER
  72. ENZRXN1FC-75390 transketolase   D-erythrose-4-phosphate + D-xylulose-5-phosphate  =  D-fructose-6-phosphate + D-glyceraldehyde-3-phosphate      P185-PWY        P21-PWY NONOXIPENT-PWY                                                                                                          1*JHP0337-MONOMER
  73. ENZRXN1FC-75389 transketolase   D-ribose-5-phosphate + D-xylulose-5-phosphate  =  D-sedoheptulose-7-phosphate + D-glyceraldehyde-3-phosphate    P21-PWY RIBOKIN-PWY     DRIBOPMET-PWY   PWY-1861                                                                                                        1*JHP0337-MONOMER
  74. ENZRXN1FC-75388 transketolase   D-fructose-6-phosphate + D-glyceraldehyde-3-phosphate  =  D-xylulose-5-phosphate + D-erythrose-4-phosphate      PWY-1861                                                                                                                                1*JHP0337-MONOMER
  75. ENZRXN1FC-75387 CTP SYNTHASE    L-glutamine + H<SUB>2</SUB>O + UTP + ATP  =  CTP + phosphate + ADP + L-glutamate        PWY0-162                                                                                                                                1*JHP0323-MONOMER
  76. ENZRXN1FC-75386 KETOL-ACID REDUCTOISOMERASE     2-aceto-2-hydroxy-butyrate + NADPH  =  2,3-dihydroxy-3-methylvalerate + NADP<sup>+</sup>        ILEUSYN-PWY                                                                                                                             1*JHP0313-MONOMER
  77. ENZRXN1FC-75385 KETOL-ACID REDUCTOISOMERASE     2-acetolactate + NADPH  =  2,3-dihydroxy-isovalerate + NADP<sup>+</sup> VALSYN-PWY                                                                                                                              1*JHP0313-MONOMER
  78. ENZRXN1FC-75384 NH(3)-DEPENDENT NAD+ SYNTHETASE ATP + deamido-NAD + L-glutamine + H<SUB>2</SUB>O  =  AMP + pyrophosphate + NAD<sup>+</sup> + L-glutamate        PYRIDNUCSYN-PWY NADSYN-PWY                                                                                                                      1*JHP0312-MONOMER
  79. ENZRXN1FC-75383 GUANYLATE KINASE        GMP + ATP  =  GDP + ADP P1-PWY  DENOVOPURINE2-PWY                                                                                                                       1*JHP0304-MONOMER
  80. ENZRXN1FC-75382 GUANYLATE KINASE        ATP + dGMP  =  ADP + dGDP                                                                                                                                       1*JHP0304-MONOMER
  81. ENZRXN1FC-75381 ARGINYL-TRNA SYNTHETASE tRNA<SUP>arg</SUP> + L-arginine + ATP  =  L-arginyl-tRNA<SUP>arg</SUP> + pyrophosphate + AMP    TRNA-CHARGING-PWY                                                                                                                               1*JHP0302-MONOMER
  82. ENZRXN1FC-75380 GLUTAMATE-1-SEMIALDEHYDE 2,1-AMINOMUTASE        glutamate-1-semialdehyde  =  5-amino-levulinate HEMESYN2-PWY                                                                                                                            1*JHP0291-MONOMER
  83. ENZRXN1FC-75379 P-AMINOBENZOATE SYNTHETASE      L-glutamine + chorismate  =  p-aminobenzoate + L-glutamate + pyruvate                                                                                                                                   1*JHP0278-MONOMER
  84. ENZRXN1FC-75378 P-AMINOBENZOATE SYNTHETASE      L-glutamine + chorismate  =  4-amino-4-deoxychorismate + L-glutamate    PWY-3742                                                                                                                                1*JHP0278-MONOMER
  85. ENZRXN1FC-75377 DIAMINOPIMELATE DECARBOXYLASE   <i>meso</i>-diaminopimelate  =  CO<SUB>2</SUB> + L-lysine       DAPLYSINESYN-PWY                                                                                                                                1*JHP0275-MONOMER
  86. ENZRXN1FC-75376 3-DEHYDROQUINATE SYNTHASE       3-deoxy-D-arabino-heptulosonate-7-phosphate  =  phosphate + 3-dehydroquinate    ARO-PWY                                                                                                                         1*JHP0268-MONOMER
  87. ENZRXN1FC-75375 QUEUINE TRNA-RIBOSYLTRANSFERASE queuine + tRNA containing guanine  =  guanine + tRNA containing queunine                                                                                                                                        1*JHP0266-MONOMER
  88. ENZRXN1FC-75374 GUANOSINE-5-TRIPHOSPHATE,3-DIPHOSPHATE PYROPHOSPHATASE  H<SUB>2</SUB>O + guanosine 3'-diphosphate 5'-triphosphate  =  phosphate + guanosine 5'-diphosphate,3'-diphosphate       PPGPPMET-PWY                                                                                                                            1*JHP0263-MONOMER
  89. ENZRXN1FC-75373 DIHYDROOROTASE  dihydroorotate + H<SUB>2</SUB>O  =  carbamoyl-L-aspartate       PWY0-162                                                                                                                                1*JHP0251-MONOMER
  90. ENZRXN1FC-75372 EXODEOXYRIBONUCLEASE LARGE SUBUNIT      a nucleoside monophosphate  =  a nucleoside monophosphate                                                                                                                                       1*JHP0243-MONOMER
  91. ENZRXN1FC-75371 ADENYLOSUCCINATE SYNTHETASE     L-aspartate + IMP + GTP  =  adenylo-succinate + phosphate + GDP P121-PWY        PWY-841 DENOVOPURINE2-PWY                                                                                                               1*JHP0239-MONOMER
  92. ENZRXN1FC-75370 putative OCTAPRENYL-DIPHOSPHATE SYNTHASE        <i>trans</i>-polyisoprenyl<sub>n</sub>-PP + &Delta;<SUP>3</SUP>-isopentenyl-PP  =  <i>trans</i>-polyisoprenyl<sub>n+1</sub>-PP + pyrophosphate  POLYISOPRENSYN-PWY                                                                                                                              1*JHP0225-MONOMER
  93. ENZRXN1FC-75369 GLUTAMYL TRNA REDUCTASE L-glutamyl-tRNA<SUP>glt</SUP> + NADPH  =  glutamate-1-semialdehyde + NADP<sup>+</sup> + tRNA<SUP>glt</SUP>      HEMESYN2-PWY                                                                                                                            1*JHP0224-MONOMER
  94. ENZRXN1FC-75368 DEOXYCYTIDINE TRIPHOSPHATE DEAMINASE    H<SUB>2</SUB>O + dCTP  =  NH<SUB>3</SUB> + dUTP PWY0-166                                                                                                                                1*JHP1009-MONOMER
  95. ENZRXN1FC-75367 FERROCHELATASE  Fe<SUP>2+</SUP> + protoporphyrin IX  =  2 H<SUP>+</SUP> + protoheme     HEMESYN2-PWY                                                                                                                            1*JHP1005-MONOMER
  96. ENZRXN1FC-75366 GLUTAMATE DEHYDROGENASE NAD(P)<sup>+</sup> + H<SUB>2</SUB>O + L-glutamate  =  NH<SUB>3</SUB> + NAD(P)H + &alpha;-ketoglutarate  GLUTAMATE-DEG1-PWY      ARGININE-DEG1-PWY       GLUTAMATE-SYN2-PWY      GLUTAMINE-SYN2-PWY                                                                                                      1*JHP1001-MONOMER
  97. ENZRXN1FC-75365 PROTOPORPHYRINOGEN OXIDASE      1.5 O<SUB>2</SUB> + protoporphyrinogen  =  3 H<SUB>2</SUB>O + protoporphyrin IX HEMESYN2-PWY                                                                                                                            1*JHP1000-MONOMER
  98. ENZRXN1FC-75364 THIOL PEROXIDASE        Reduced Thioredoxin + H<SUB>2</SUB>O<SUB>2</SUB>  =  Oxidized Thioredoxin + H<SUB>2</SUB>O                                                                                                                                      1*JHP0991-MONOMER
  99. ENZRXN1FC-75363 THIOL PEROXIDASE        reduced acceptor + H<SUB>2</SUB>O<SUB>2</SUB>  =  acceptor + 2 H<SUB>2</SUB>O                                                                                                                                   1*JHP0991-MONOMER
  100. ENZRXN1FC-75362 D-3-PHOSPHOGLYCERATE DEHYDROGENASE      3-phosphoglycerate + NAD<sup>+</sup>  =  3-phospho-hydroxypyruvate + NADH       SERSYN-PWY                                                                                                                              1*JHP0984-MONOMER
  101. ENZRXN1FC-75361 3-PHOSPHOSHIKIMATE 1-CARBOXYVINYL TRANSFERASE   shikimate-3-phosphate + phosphoenolpyruvate  =  5-enolpyruvyl-shikimate-3-phosphate + phosphate ARO-PWY                                                                                                                         1*JHP0980-MONOMER
  102. ENZRXN1FC-75360 PHENYLALANYL-TRNA SYNTHETASE BETA CHAIN tRNA<SUP>phe</SUP> + L-phenylalanine + ATP  =  L-phenylalanyl-tRNA<SUP>phe</SUP> + pyrophosphate + AMP  TRNA-CHARGING-PWY                                                                                                                               1*JHP0979-MONOMER
  103. ENZRXN1FC-75359 PHENYLALANYL-TRNA SYNTHETASE ALPHA CHAIN        tRNA<SUP>phe</SUP> + L-phenylalanine + ATP  =  L-phenylalanyl-tRNA<SUP>phe</SUP> + pyrophosphate + AMP  TRNA-CHARGING-PWY                                                                                                                               1*JHP0978-MONOMER
  104. ENZRXN1FC-75358 GMP SYNTHETASE  xanthosine-5-phosphate + H<SUB>2</SUB>O + L-glutamine + ATP  =  L-glutamate + GMP + pyrophosphate + AMP PWY-841 DENOVOPURINE2-PWY                                                                                                                       1*JHP0972-MONOMER
  105. ENZRXN1FC-75357 GMP SYNTHETASE  NH<SUB>3</SUB> + xanthosine-5-phosphate + ATP  =  AMP + pyrophosphate + GMP     DENOVOPURINE2-PWY                                                                                                                               1*JHP0972-MONOMER
  106. ENZRXN1FC-75356 METHIONYL-TRNA SYNTHETASE       tRNA<SUP>met</SUP> + L-methionine + ATP  =  L-methionyl-tRNA<SUP>met</SUP> + pyrophosphate + AMP        TRNA-CHARGING-PWY                                                                                                                               1*JHP0967-MONOMER
  107. ENZRXN1FC-75355 ADENOSYLMETHIONINE-8-AMINO-7-OXONONANOATE AMINOTRANSFERASE      S-adenosyl-L-methionine + 8-amino-7-oxononanoate  =  S-adenosyl-4-methylthio-2-oxobutanoate + 7,8-diaminononanoate      BIOTIN-SYNTHESIS-PWY    PWY-3701                                                                                                                        1*JHP0910-MONOMER
  108. ENZRXN1FC-75354 2,3-BISPHOSPHOGLYCERATE-INDEPENDENT PHOSPHOGLYCERATE MUTASE     3-phosphoglycerate  =  2-phosphoglycerate       PWY-1622        P461-PWY        GLUCONEO-PWY    P81-PWY                                                                                                 1*JHP0908-MONOMER
  109. ENZRXN1FC-75353 GLYCYL-TRNA SYNTHETASE BETA CHAIN       tRNA<SUP>gly</SUP> + glycine + ATP  =  glycyl-tRNA<SUP>gly</SUP> + pyrophosphate + AMP  TRNA-CHARGING-PWY                                                                                                                               1*JHP0906-MONOMER
  110. ENZRXN1FC-75352 GLYCEROL-3-PHOSPHATE DEHYDROGENASE      acceptor + glycerol-3-phosphate  =  reduced acceptor + dihydroxy-acetone-phosphate                                                                                                                                      1*JHP0895-MONOMER
  111. ENZRXN1FC-75351 GLYCEROL-3-PHOSPHATE DEHYDROGENASE      glycerol-3-phosphate + ubiquinone-<i>8</i>  =  dihydroxy-acetone-phosphate + ubiquinol-<i>8</i> PWY0-381        AERESPDON-PWY   ANARESPDON-PWY                                                                                                          1*JHP0895-MONOMER
  112. ENZRXN1FC-75350 GLYCYL-TRNA SYNTHETASE ALPHA CHAIN      tRNA<SUP>gly</SUP> + glycine + ATP  =  glycyl-tRNA<SUP>gly</SUP> + pyrophosphate + AMP  TRNA-CHARGING-PWY                                                                                                                               1*JHP0894-MONOMER
  113. ENZRXN1FC-75349 3-DEOXY-D-MANNO-OCTULOSONIC-ACID TRANSFERASE    lipid IV(A) + CMP-3-deoxy-D-<i>manno</i>-octulosonate  =  (KDO)-lipid IV(A) + CMP       KDOSYN-PWY      NAGLIPASYN-PWY                                                                                                                  1*JHP0891-MONOMER
  114. ENZRXN1FC-75348 D-Amino acid dehydrogenase      D-alanine + H<SUB>2</SUB>O  =  NH<SUB>3</SUB> + pyruvate        ALADEG-PWY                                                                                                                              1*JHP0878-MONOMER
  115. ENZRXN1FC-75347 D-Amino acid dehydrogenase      acceptor + H<SUB>2</SUB>O + a D amino acid  =  NH<SUB>3</SUB> + reduced acceptor + a 2-oxo acid                                                                                                                                 1*JHP0878-MONOMER
  116. ENZRXN1FC-75346 ALANINE RACEMASE        L-alanine  =  D-alanine ALADEG-PWY      ALANINE-VALINESYN-PWY                                                                                                                   1*JHP0876-MONOMER
  117. ENZRXN1FC-75345 GERANYLTRANSTRANSFERASE geranyl-PP + &Delta;<SUP>3</SUP>-isopentenyl-PP  =  pyrophosphate + trans, trans-farnesyl diphosphate   POLYISOPRENSYN-PWY      PWY-922                                                                                                                 1*JHP0864-MONOMER
  118. ENZRXN1FC-75344 GTP CYCLOHYDROLASE I    2 H<SUB>2</SUB>O + GTP  =  dihydroneopterin triphosphate + formate + H<SUB>2</SUB>O     PWY-3742                                                                                                                                1*JHP0863-MONOMER
  119. ENZRXN1FC-75343 GTP CYCLOHYDROLASE I    2 H<SUB>2</SUB>O + GTP  =  dihydroneopterin triphosphate + formate + H<SUB>2</SUB>O     PWY-3742                                                                                                                                1*JHP0862-MONOMER
  120. ENZRXN1FC-75342 GLYCERALDEHYDE 3-PHOSPHATE DEHYDROGENASE        D-glyceraldehyde-3-phosphate + phosphate + NAD<sup>+</sup>  =  1,3-diphosphateglycerate + NADH  P461-PWY        GLUCONEO-PWY    P81-PWY DHGLUCONATE-PYR-CAT-PWY                                                                                                 1*JHP0855-MONOMER
  121. ENZRXN1FC-75341 PHOSPHOTRANSACETYLASE   propionyl-CoA + phosphate  =  propionyl-P + coenzyme A  THREOCAT-PWY                                                                                                                            1*JHP0841-MONOMER
  122. ENZRXN1FC-75340 PHOSPHOTRANSACETYLASE   phosphate + acetyl-CoA  =  acetylphosphate + coenzyme A PYRUVOX-PWY     ANAGLYCOLYSIS-PWY       PWY-21  ACETATEUTIL-PWY                                                                                                 1*JHP0841-MONOMER
  123. ENZRXN1FC-75339 ACETATE KINASE  acetate + ATP  =  acetylphosphate + ADP PYRUVOX-PWY     ANAGLYCOLYSIS-PWY       PWY-21  ACETATEUTIL-PWY                                                                                                 1*JHP0840-MONOMER
  124. ENZRXN1FC-75338 CYSTEINYL-TRNA SYNTHETASE       tRNA<SUP>cys</SUP> + L-cysteine + ATP  =  L-cysteinyl-tRNA<SUP>cys</SUP> + pyrophosphate + AMP  TRNA-CHARGING-PWY                                                                                                                               1*JHP0818-MONOMER
  125. ENZRXN1FC-75337 catalase        2 H<SUB>2</SUB>O<SUB>2</SUB>  =  2 H<SUB>2</SUB>O + O<SUB>2</SUB>       DETOX1-PWY                                                                                                                              1*JHP0809-MONOMER
  126. ENZRXN1FC-75336 CDP-DIACYLGLYCEROL PYROPHOSPHATASE      CDP-diacylglycerol + H<SUB>2</SUB>O  =  CMP + L-phosphatidate                                                                                                                                   1*JHP0805-MONOMER
  127. ENZRXN1FC-75335 LIPID-A-DISACCHARIDE SYNTHASE   2,3-bis(3-hydroxymyristoyl)-&beta;-D-glucosaminyl 1-phosphate + UDP-2,3-bis(3-hydroxymyristoyl)glucosamine  =  lipid A disaccharide + UDP       NAGLIPASYN-PWY                                                                                                                          1*JHP0801-MONOMER
  128. ENZRXN1FC-75334 DEOXYURIDINE 5-TRIPHOSPHATE NUCLEOTIDOHYDROLASE H<SUB>2</SUB>O + dUTP  =  pyrophosphate + dUMP  PWY0-166                                                                                                                                1*JHP0799-MONOMER
  129. ENZRXN1FC-75333 ADP-L-GLYCERO-D-MANNOHEPTOSE-6-EPIMERASE        ADP-D-glycero-D-manno-heptose  =  ADP-L-glycero-D-manno-heptose                                                                                                                                 1*JHP0793-MONOMER
  130. ENZRXN1FC-75332 GMP REDUCTASE   NH<SUB>3</SUB> + IMP + NADP<sup>+</sup>  =  GMP + NADPH                                                                                                                                 1*JHP0790-MONOMER
  131. ENZRXN1FC-75331 TYPE I RESTRICTION ENZYME         =                                                                                                                                     1*JHP0786-MONOMER
  132. ENZRXN1FC-75330 TYPE I RESTRICTIONENZYME          =                                                                                                                                     1*JHP0785-MONOMER
  133. ENZRXN1FC-75329 TYPE I RESTRICTION ENZYME         =                                                                                                                                     1*JHP0784-MONOMER
  134. ENZRXN1FC-75328 HYDROXYETHYLTHIAZOLE KINASE     ATP + 4-methyl-5-(&beta;-hydroxyethyl)thiazole  =  ADP + 4-methyl-5-(&beta;-hydroxyethyl)thiazole phosphate     THISYN-PWY                                                                                                                              1*JHP0783-MONOMER
  135. ENZRXN1FC-75327 PHOSPHOMETHYLPYRIMIDINE KINASE  hydroxymethylpyrimidine phosphate + ATP  =  4-amino-5-hydroxymethyl-2-methylpyrimidine-pyrophosphate + ADP      THISYN-PWY                                                                                                                              1*JHP0782-MONOMER
  136. ENZRXN1FC-75326 THIAMINE PHOSPHATE PYROPHOSPHORYLASE    4-methyl-5-(&beta;-hydroxyethyl)thiazole phosphate + 4-amino-5-hydroxymethyl-2-methylpyrimidine-pyrophosphate  =  thiamine-phosphate + pyrophosphate    THISYN-PWY                                                                                                                              1*JHP0781-MONOMER
  137. ENZRXN1FC-75325 putative spermidine synthase    putrescine + S-adenosylmethioninamine  =  spermidine + 5'-methylthioadenosine   BSUBPOLYAMSYN-PWY       POLYAMINSYN3-PWY        ORNSPNANA-PWY                                                                                                           1*JHP0771-MONOMER
  138. ENZRXN1FC-75324 INOSINE-5-MONOPHOSPHATE DEHYDROGENASE   H<SUB>2</SUB>O + NAD<sup>+</sup> + IMP  =  xanthosine-5-phosphate + NADH        P121-PWY        PWY-841 DENOVOPURINE2-PWY       URSIN-PWY                                                                                                       1*JHP0768-MONOMER
  139. ENZRXN1FC-75323 ATP synthase F0, subunit a      H<SUP>+</SUP>[IN] + H<SUB>2</SUB>O + ATP  =  H<SUP>+</SUP>[OUT] + phosphate + ADP                                                                                                                                       1*JHP0767-MONOMER
  140. ENZRXN1FC-75322 THIOREDOXIN REDUCTASE   Oxidized Thioredoxin + NADPH  =  Reduced Thioredoxin + NADP<sup>+</sup> THIOREDOX-PWY                                                                                                                           1*JHP0764-MONOMER
  141. ENZRXN1FC-75321 HOMOSERINE DEHYDROGENASE        NADP<sup>+</sup> + homoserine  =  NADPH + L-aspartate-semialdehyde      HOMOSERSYN-PWY                                                                                                                          1*JHP0761-MONOMER
  142. ENZRXN1FC-75320 GTP CYCLOHYDROLASE II   3 H<SUB>2</SUB>O + GTP  =  pyrophosphate + 2,5-diamino-6-(ribosylamino)-4-(3H)-pyrimidinone 5'-phosphate + formate      RIBOSYN2-PWY                                                                                                                            1*JHP0738-MONOMER
  143. ENZRXN1FC-75319 putative TYPE I RESTRICTION ENZYME        =                                                                                                                                     1*JHP0726-MONOMER
  144. ENZRXN1FC-75318 ACONITATE HYDRATASE     cis-aconitate + H<SUB>2</SUB>O  =  isocitrate   P22-PWY P103-PWY        REDCITCYC       TCA                                                                                                     1*JHP0716-MONOMER
  145. ENZRXN1FC-75317 ACONITATE HYDRATASE     citrate  =  cis-aconitate + H<SUB>2</SUB>O      P22-PWY P103-PWY        REDCITCYC       TCA                                                                                                     1*JHP0716-MONOMER
  146. ENZRXN1FC-75316 URIDYLATE KINASE        ATP + UMP  =  ADP + UDP P1-PWY  PWY0-162                                                                                                                        1*JHP0714-MONOMER
  147. ENZRXN1FC-75315 GUANOSINE-3,5-BIS(DIPHOSPHATE) 3-PYROPHOSPHOHYDROLASE   guanosine 5'-diphosphate,3'-diphosphate + H<SUB>2</SUB>O  =  pyrophosphate + GDP        PPGPPMET-PWY                                                                                                                            1*JHP0712-MONOMER
  148. ENZRXN1FC-75314 TYROSYL-TRNA SYNTHETASE L-tyrosine + tRNA<SUP>tyr</SUP> + ATP  =  L-tyrosyl-tRNA<SUP>tyr</SUP> + pyrophosphate + AMP    TRNA-CHARGING-PWY                                                                                                                               1*JHP0711-MONOMER
  149. ENZRXN1FC-75313 MOLYBDOPTERIN-GUANINE DINUCLEOTIDE BIOSYNTHESIS PROTEIN A       molybdopterin + GTP  =  molybdopterin guanine dinucleotide + pyrophosphate                                                                                                                                      1*JHP0706-MONOMER
  150. ENZRXN1FC-75312 PHOSPHORIBOSYL PYROPHOSPHATE SYNTHETASE ATP + D-ribose-5-phosphate  =  PRPP + AMP       PWY0-662        P1-PWY                                                                                                                  1*JHP0679-MONOMER
  151. ENZRXN1FC-75311 D-ALANYL-D-ALANINE-ADDING ENZYME        UDP-<i>N</i>-acetylmuramoyl-L-alanyl-D-glutamyl-meso-2,6-diaminoheptanedioate + D-alanyl-D-alanine + ATP  =  UDP-<i>N</i>-acetylmuramoyl-L-alanyl-D-glutamyl-meso-2,6-diaminoheptanedioate- D-alanyl-D-alanine + phosphate + ADP        PEPTIDOGLYCANSYN-PWY                                                                                                                            1*JHP0677-MONOMER
  152. ENZRXN1FC-75310 D-ALANINE--D-ALANINE LIGASE     2 D-alanine + ATP  =  D-alanyl-D-alanine + phosphate + ADP      PEPTIDOGLYCANSYN-PWY                                                                                                                            1*JHP0675-MONOMER
  153. ENZRXN1FC-75309 PHOSPHATIDYLGLYCEROPHOSPHATASE A        L-1-phosphatidylglycerol-phosphate + H<SUB>2</SUB>O  =  L-1-phosphatidyl-glycerol + phosphate   PHOSLIPSYN2-PWY PHOSLIPSYN-PWY                                                                                                                  1*JHP0674-MONOMER
  154. ENZRXN1FC-75308 XANTHINE-GUANINE PHOSPHORIBOSYLTRANSFERASE      xanthine + PRPP  =  xanthosine-5-phosphate + pyrophosphate      SALVPURINE2-PWY                                                                                                                         1*JHP0672-MONOMER
  155. ENZRXN1FC-75307 L-asparaginase II       L-asparagine + H<SUB>2</SUB>O  =  NH<SUB>3</SUB> + L-aspartate  ASPASN-PWY      PWY-4001        ASPARAGINE-DEG1-PWY                                                                                                             1*JHP0661-MONOMER
  156. ENZRXN1FC-75306 DNA POLYMERASE III SUBUNITS GAMMA AND TAU       N 2'-deoxyribonucleoside triphosphate  =  DNA(N) + N pyrophosphate                                                                                                                                      1*JHP0655-MONOMER
  157. ENZRXN1FC-75305 DNA GYRASE SUBUNIT A      =                                                                                                                                     1*JHP0641-MONOMER
  158. ENZRXN1FC-75304 DIACYLGLYCEROL KINASE   ATP + 1,2-diacylglycerol  =  ADP + L-phosphatidate                                                                                                                                      1*JHP0640-MONOMER
  159. ENZRXN1FC-75303 ACETYL-COA ACETYLTRANSFERASE    2 acetyl-CoA  =  acetoacetyl-CoA + coenzyme A   ACETOACETATE-DEG-PWY    PWY-922                                                                                                                 1*JHP0638-MONOMER
  160. ENZRXN1FC-75302 putative TYPE II RESTRICTION ENZYME       =                                                                                                                                     1*JHP0630-MONOMER
  161. ENZRXN1FC-75301 UDP-N-ACETYLGLUCOSAMINE PYROPHOSPHORYLASE       N-acetyl-glucosamine-1-phosphate + UTP  =  UDP-<i>N</i>-acetyl-D-glucosamine + pyrophosphate    GLCMANNANAUT-PWY        UDPNACETYLGALSYN-PWY    UDPNAGSYN-PWY                                                                                                           1*JHP0624-MONOMER
  162. ENZRXN1FC-75300 ASPARTATE AMINOTRANSFERASE      L-aspartate + &alpha;-ketoglutarate  =  oxaloacetate + L-glutamate      GLUTFUMARATE-PWY        GLUTAMINEFUM-PWY        ASPARAGINE-DEG1-PWY     ASPARTATESYN-PWY                                                                                                        1*JHP0615-MONOMER
  163. ENZRXN1FC-75299 ASPARTATE AMINOTRANSFERASE      3-sulfinoalanine + &alpha;-ketoglutarate  =  3-sulfinyl-pyruvate + L-glutamate  CYSTEINE-DEG-PWY                                                                                                                                1*JHP0615-MONOMER
  164. ENZRXN1FC-75298 SERYL-TRNA SYNTHETASE   tRNA<SUP>ser</SUP> + L-serine + ATP  =  L-seryl-tRNA<SUP>ser</SUP> + pyrophosphate + AMP        TRNA-CHARGING-PWY                                                                                                                               1*JHP1373-MONOMER
  165. ENZRXN1FC-75297 SERYL-TRNA SYNTHETASE   tRNA<SUP>sec</SUP> + L-serine + ATP  =  L-seryl-tRNA<SUP>sec</SUP> + pyrophosphate + AMP        PWY0-901                                                                                                                                1*JHP1373-MONOMER
  166. ENZRXN1FC-75296 THYMIDYLATE KINASE      dTMP + ATP  =  dTDP + ADP       PWY0-166        P1-PWY                                                                                                                  1*JHP1367-MONOMER
  167. ENZRXN1FC-75295 putative TYPE II RESTRICTION ENZYME       =                                                                                                                                     1*JHP1364-MONOMER
  168. ENZRXN1FC-75294 DNA POLYMERASE I        N 2'-deoxyribonucleoside triphosphate  =  DNA(N) + N pyrophosphate                                                                                                                                      1*JHP1363-MONOMER
  169. ENZRXN1FC-75293 BRANCHED-CHAIN AMINO ACID AMINOTRANSFERASE      2-keto-isovalerate + L-glutamate  =  L-valine + &alpha;-ketoglutarate   ALANINE-VALINESYN-PWY   PWY-3921        VALSYN-PWY                                                                                                              1*JHP1361-MONOMER
  170. ENZRXN1FC-75292 BRANCHED-CHAIN AMINO ACID AMINOTRANSFERASE      2-keto-4-methyl-pentanoate + L-glutamate  =  L-leucine + &alpha;-ketoglutarate  LEU-DEG2-PWY    LEUSYN-PWY      LEUDEG-PWY                                                                                                              1*JHP1361-MONOMER
  171. ENZRXN1FC-75291 BRANCHED-CHAIN AMINO ACID AMINOTRANSFERASE      2-keto-3-methyl-valerate + L-glutamate  =  L-isoleucine + &alpha;-ketoglutarate ILEUSYN-PWY                                                                                                                             1*JHP1361-MONOMER
  172. ENZRXN1FC-75290 putative CYTOCHROME C PEROXIDASE        H<SUB>2</SUB>O<SUB>2</SUB> + 2 ferrocytochrome c  =  2 H<SUB>2</SUB>O + 2 ferricytochrome c                                                                                                                                     1*JHP1354-MONOMER
  173. ENZRXN1FC-75289 putative RIBONUCLEASE P PROTEIN COMPONENT         =                                                                                                                                     1*JHP1341-MONOMER
  174. ENZRXN1FC-75288 PEPTIDYL-PROLYL CIS-TRANS ISOMERASE     peptidylproline (&omega; 180)  =  peptidylproline (&omega; 0)                                                                                                                                   1*JHP1334-MONOMER
  175. ENZRXN1FC-75287 FORMYLTETRAHYDROFOLATE HYDROLASE        H<SUB>2</SUB>O + N<sup>10</sup>-formyl-THF  =  tetrahydrofolate + formate       1CMET2-PWY                                                                                                                              1*JHP1327-MONOMER
  176. ENZRXN1FC-75286 ISOLEUCYL-TRNA SYNTHETASE       tRNA<SUP>ile</SUP> + L-isoleucine + ATP  =  L-isoleucyl-tRNA<SUP>ile</SUP> + pyrophosphate + AMP        TRNA-CHARGING-PWY                                                                                                                               1*JHP1317-MONOMER
  177. ENZRXN1FC-75285 FLAGELLUM-SPECIFIC ATP SYNTHASE H<SUP>+</SUP>[IN] + H<SUB>2</SUB>O + ATP  =  H<SUP>+</SUP>[OUT] + phosphate + ADP                                                                                                                                       1*JHP1315-MONOMER
  178. ENZRXN1FC-75284 UDP-N-ACETYLENOLPYRUVOYLGLUCOSAMINE REDUCTASE   NADP<sup>+</sup> + UDP-<i>N</i>-acetylmuramate  =  NADPH + UDP-GlcNAc-pyruvate enol ether       PEPTIDOGLYCANSYN-PWY                                                                                                                            1*JHP1313-MONOMER
  179. ENZRXN1FC-75283 TRNA DELTA(2)-ISOPENTENYLPYROPHOSPHATE TRANSFERASE      a tRNA + &Delta;<SUP>3</SUP>-isopentenyl-PP  =  tRNA containing 6-Isopentenyladenosine + pyrophosphate                                                                                                                                  1*JHP1310-MONOMER
  180. ENZRXN1FC-75282 BIOTIN SYNTHETASE       dethiobiotin + sulfur donor  =  9-mercaptodethiobiotin  PWY-3701                                                                                                                                1*JHP1298-MONOMER
  181. ENZRXN1FC-75281 BIOTIN SYNTHETASE       sulfur donor + dethiobiotin  =  biotin  BIOTIN-SYNTHESIS-PWY                                                                                                                            1*JHP1298-MONOMER
  182. ENZRXN1FC-75280 putative TYPE III RESTRICTION ENZYME      =                                                                                                                                     1*JHP1297-MONOMER
  183. ENZRXN1FC-75279 PREPHENATE DEHYDROGENASE        prephenate + NAD<sup>+</sup>  =  p-hydroxyphenylpyruvate + CO<SUB>2</SUB> + NADH        TYRSYN                                                                                                                          1*JHP1294-MONOMER
  184. ENZRXN1FC-75278 ATP-DEPENDENT PROTEASE LA         =                                                                                                                                     1*JHP1293-MONOMER
  185. ENZRXN1FC-75277 HYDROXYMYRISTOYL-ACYL CARRIER PROTEIN DEHYDRATASE       D-3-hydroxy-acyl-ACP  =  trans-&Delta;<SUP>2</SUP>-enoyl-acyl-ACP + H<SUB>2</SUB>O      UNSAT-FA-ELONG-PWY      FASYN-ELONG-PWY                                                                                                                 1*JHP1290-MONOMER
  186. ENZRXN1FC-75276 UDP-N-ACETYLGLUCOSAMINE ACYLTRANSFERASE (R)-3-hydroxymyristoyl-ACP + UDP-<i>N</i>-acetyl-D-glucosamine  =  UDP-3-O-(3-hydroxymyristoyl)-N-acetylglucosamine + ACP-SH    NAGLIPASYN-PWY                                                                                                                          1*JHP1289-MONOMER
  187. ENZRXN1FC-75275 4-HYDROXYBENZOATE OCTAPRENYLTRANSFERASE farnesylfarnesylgeranyl-PP + p-hydroxybenzoate  =  3-octaprenyl-4-hydroxybenzoate + pyrophosphate       UBISYN-PWY                                                                                                                              1*JHP1278-MONOMER
  188. ENZRXN1FC-75274 PHOSPHATIDYLSERINE DECARBOXYLASE        L-1-phosphatidylserine  =  L-1-phosphatidyl-ethanolamine + CO<SUB>2</SUB>       PHOSLIPSYN2-PWY PHOSLIPSYN-PWY                                                                                                                  1*JHP1275-MONOMER
  189. ENZRXN1FC-75273 QUINOLINATE SYNTHETASE  L-aspartate + O<SUB>2</SUB> + dihydroxy-acetone-phosphate  =  quinolinate + phosphate + H<SUB>2</SUB>O<SUB>2</SUB> + 2 H<SUB>2</SUB>O                                                                                                                                   1*JHP1274-MONOMER
  190. ENZRXN1FC-75272 NICOTINATE-NUCLEOTIDE PYROPHOSPHORYLASE CO<SUB>2</SUB> + pyrophosphate + nicotinate nucleotide  =  PRPP + quinolinate   PYRIDNUCSYN-PWY NADSYN-PWY                                                                                                                      1*JHP1273-MONOMER
  191. ENZRXN1FC-75271 1-ACYL-SN-GLYCEROL-3-PHOSPHATE ACYLTRANSFERASE  1-acyl-sn-glycerol-3P + acyl-ACP  =  L-phosphatidate + ACP-SH   PHOSLIPSYN-PWY                                                                                                                          1*JHP1267-MONOMER
  192. ENZRXN1FC-75270 GLYCERALDEHYDE 3-PHOSPHATE DEHYDROGENASE        D-glyceraldehyde-3-phosphate + phosphate + NAD<sup>+</sup>  =  1,3-diphosphateglycerate + NADH  P461-PWY        GLUCONEO-PWY    P81-PWY DHGLUCONATE-PYR-CAT-PWY                                                                                                 1*JHP1265-MONOMER
Coloreado en 0.005 segundos, usando GeSHi 1.0.8.4
Última edición por explorer el 2011-04-18 12:18 @554, editado 4 veces en total
Razón: Bloque con marcas de texto
mpar4
Perlero nuevo
Perlero nuevo
 
Mensajes: 5
Registrado: 2011-04-13 12:49 @576

Re: Crear lista de coincidencias de determinados elementos

Notapor explorer » 2011-04-18 11:40 @528

Bien... ¿Y qué es lo que hay que hacer con este fichero? ¿Solo hay que contar las apariciones de la columna NAME? Es que como dices que hay que quitar los '=', esos solo aparecen en la columna REACTION-EQUATION...

Para el primer caso, te vale con un programa así:
Sintáxis: [ Descargar ] [ Ocultar ]
Using perl Syntax Highlighting
  1. #!/usr/bin/perl
  2. #
  3. # Joaquín Ferrero. 20110418
  4.  
  5. use autodie;
  6.  
  7. ## Lectura del fichero ######################################################
  8. my @enzimes;
  9.  
  10. open my $ENZIMES, q[<], 'enzymes.col';
  11.  
  12. while (<$ENZIMES>) {
  13.  
  14.     next if m/^#/;                                      # Saltamos cabeceras
  15.     next if m/^UNIQUE-ID/;
  16.  
  17.     chomp;
  18.  
  19.     my @campos = split /\t/;                            # Extracción de las columnas
  20.  
  21.     next if @campos != 20;                              # Necesitamos 20 columnas
  22.  
  23.     #   UNIQUE-ID       NAME    REACTION-EQUATION
  24.     #   PATHWAYS        PATHWAYS        PATHWAYS        PATHWAYS
  25.     #   COFACTORS       COFACTORS       COFACTORS       COFACTORS
  26.     #   ACTIVATORS      ACTIVATORS      ACTIVATORS      ACTIVATORS
  27.     #   INHIBITORS      INHIBITORS      INHIBITORS      INHIBITORS
  28.     #   SUBUNIT-COMPOSITION
  29.  
  30.     push @enzimes, {                                    # Almacenamos la información
  31.    
  32.         name            => $campos[1],
  33.         ecuation        => $campos[2],
  34.         composition     => $campos[19],
  35.  
  36.         pathways        => [ @campos[  3 ..  6 ] ],
  37.         cofactors       => [ @campos[  7 .. 10 ] ],
  38.         activators      => [ @campos[ 11 .. 14 ] ],
  39.         inhibitors      => [ @campos[ 15 .. 18 ] ],
  40.     };
  41. }
  42.  
  43. close $ENZIMES;
  44.  
  45.  
  46. ## Sacar estadísticas #######################################################
  47. my %total_enzimes;
  48.  
  49. for my $enzime_ref (@enzimes) {
  50.     $total_enzimes{ $enzime_ref->{name} }++;            # Contamos las ocurrencias
  51. }
  52.  
  53.                                                         # Ordenación por las veces que aparecen,
  54.                                                         # de forma numérica e inversa
  55. for my $enzime (sort { $total_enzimes{$b} <=> $total_enzimes{$a} } keys %total_enzimes) {
  56.     printf "%3d %s\n", $total_enzimes{$enzime}, $enzime;
  57. }
  58.  
  59. __END__
Coloreado en 0.003 segundos, usando GeSHi 1.0.8.4
sale:
Sintáxis: [ Descargar ] [ Ocultar ]
Using text Syntax Highlighting
  4 TYPE I RESTRICTION ENZYME
  3 BETA-KETOACYL-ACP SYNTHASE I
  3 transketolase
  3 BRANCHED-CHAIN AMINO ACID AMINOTRANSFERASE
  2 GUANYLATE KINASE
  2 BIOTIN SYNTHETASE
  2 GLUTAMYL-TRNA SYNTHETASE
  2 GLYCEROL-3-PHOSPHATE DEHYDROGENASE
...
Coloreado en 0.000 segundos, usando GeSHi 1.0.8.4
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14486
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Re: Crear lista de coincidencias de determinados elementos

Notapor mpar4 » 2011-04-27 11:51 @535

¡¡Hola!!
Sí, muchas gracias, veo que sí funciona tu programa pero el mio no me funciona y es que el motivo es que yo tengo todos estos elementos dentro de un hash de un hash de un array y me parece que no me los encuentra...

$HoHoA->{$codiEnzim}{$nomEnzim}{P}=[@productes_separats];
$HoHoA->{$codiEnzim}{$nomEnzim}{R}=[@reactius_separats];
mpar4
Perlero nuevo
Perlero nuevo
 
Mensajes: 5
Registrado: 2011-04-13 12:49 @576

Re: Crear lista de coincidencias de determinados elementos

Notapor explorer » 2011-04-27 12:12 @550

Puedes intentar "ver" el aspecto de la estructura que estás creando:
Sintáxis: [ Descargar ] [ Ocultar ]
Using perl Syntax Highlighting
  1. print Dumper($HoHoA);
  2. exit;
Coloreado en 0.001 segundos, usando GeSHi 1.0.8.4

El exit() está para cerrar el programa enseguida, pues suponemos que con la primera asignación de las líneas 103 y 104 nos vale para hacernos una idea de qué es lo que está haciendo. Si no es suficiente, quitamos el exit() y movemos el print Dumper al final del proceso de lectura del fichero de entrada, para ver cómo lo ha guardado.

Puedes, además, simplificar el código para hacerlo un poco más claro. La línea 108 la puedes reescribir así:
Sintáxis: [ Descargar ] [ Ocultar ]
Using perl Syntax Highlighting
  1. foreach my $i ( @reactius_separats ) {
Coloreado en 0.001 segundos, usando GeSHi 1.0.8.4
y lo mismo para la 113, con @productes_separats.

Si te sigue sin salir, mándanos otro mensaje. Si la estructura no es lo que quieres, publica algunas líneas del Dumper(), para que lo veamos aquí.
JF^D Perl programming & Raku programming. Grupo en Telegram: https://t.me/Perl_ES
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14486
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Siguiente

Volver a Bioinformática

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 0 invitados

cron