Contador de cisteínas en una secuencia Fasta de aminoácidos
Publicado: 2011-11-28 20:24 @892
Hola a todos.
Voy empezando con Perl. Tengo que hacer un contador de cisteínas (el número de veces que aparece la letra C en la secuencia de aminoácidos) en un archivo múltiple en formato fasta. Tengo varios días y no puedo. ¿Podría alguien darme una idea de cómo puedo hacer esto?
El input sería algo así:
Y la idea del output es algo así:
Gracias de antemano,
Iván Alemán
Voy empezando con Perl. Tengo que hacer un contador de cisteínas (el número de veces que aparece la letra C en la secuencia de aminoácidos) en un archivo múltiple en formato fasta. Tengo varios días y no puedo. ¿Podría alguien darme una idea de cómo puedo hacer esto?
El input sería algo así:
Using text Syntax Highlighting
>217618
MHHPILLSAFISIASSLRLNAPTVNKRGSTIAQPGSIKDVIVTSFNTLNSTHHYRIPKAKPHSWNDTIST
HNLSLKLYNNYNGGPINAYIQGLDSNGAIVFITSNGTLIHPRSNNSSSPIEIKDKLAIPLPPKGQSLTLN
ITTSLTSGRVYFSEGNLKFFTINLGAGDGLVQPSVNNLHDPSASLNWGFIELTFLRNGALYANISYVDFV
GLILSMMLSTKDGGTPQITRGLRANAVYDLCEGLFKQTANDGYLWLAMCVVGKTGDPVRVLSPNYYQRVY
AADFEDYWQDYVDTVWEYYSSHTLAIDTQTPLGQVECQVTNDTLYCAEDNRGYAKPTASDIWGCNSGPFG
LQEGDNPVHVAVIPRLCAAFVRSTLLIRGGDVQPRLNSSYHYSVSPTNHYSRIVHELQVDGRGYAFSYDD
VNPNGHEDVSGLVSSGNPDTLTVYVGGPPN*
>161114
MAPSGTLPLAAAILALAGIVTAQQPGTSTPEVHPKLTTYQCTTSGGCVAQDTSVVLDWNYRWMHDANYNS
CTVNGGVNTTICPDEATCGTNCFIEGVNYTASGVTTSGSSLTMNQYMPATTGGYSSVSPRLYLLGADGNY
VLLQLNGKELSFDVDLSALPCGENGSLYLSQMADNGGANQYNTAGANYGSGYCDAQCPVQTWKNGTLNTN
HSGYCCNEMDILEGNSEANALTPHSCTATACDSSGCGLNPYASGFHSYYGPGLTVDTSKPFTITTQFNTD
NGSPSGNLVSITRKYIQNGVSIPSAQSGGDIISSCPSASAYGGLTTMGKALTSGMVLIFSIWNDSGGYMN
WLDSGSSGPCSSTEGNPSTILANNPGTHVTFSNIKWGDIGSTTSGGSSPPPPPASSTTLRTSTTTSKTST
APPSCTQTHWGQCGGNGYTGCKTCASGTTCQYSNDCEYSMNISKRRFRILIM*
>86295
MVLFRSLVFFSATACAATAPPSQSQGGIMAEQGLPDGIYQAAAVQGPTFEAPSAVPSSHLSLRGWKHPPG
EGDFHEKPGPHTEDEYSVPIHATRHSCHKDRHILLNSTEYRRAIDNLWDYCQNFKVPYHGAHLSIVGDVM
VYVCAYGRERPCHRHEWNEAEQIMDKKCGQGKGSHVQMRKKLKEYGRAHVGKKVCASSSLGMDLEWKTKP
LPVLVNGQTLGHWKAGPPRYKAGDPQYKAEEDGKKEDKAEEDGKKEDKVEDDGKKKDKAG*
MHHPILLSAFISIASSLRLNAPTVNKRGSTIAQPGSIKDVIVTSFNTLNSTHHYRIPKAKPHSWNDTIST
HNLSLKLYNNYNGGPINAYIQGLDSNGAIVFITSNGTLIHPRSNNSSSPIEIKDKLAIPLPPKGQSLTLN
ITTSLTSGRVYFSEGNLKFFTINLGAGDGLVQPSVNNLHDPSASLNWGFIELTFLRNGALYANISYVDFV
GLILSMMLSTKDGGTPQITRGLRANAVYDLCEGLFKQTANDGYLWLAMCVVGKTGDPVRVLSPNYYQRVY
AADFEDYWQDYVDTVWEYYSSHTLAIDTQTPLGQVECQVTNDTLYCAEDNRGYAKPTASDIWGCNSGPFG
LQEGDNPVHVAVIPRLCAAFVRSTLLIRGGDVQPRLNSSYHYSVSPTNHYSRIVHELQVDGRGYAFSYDD
VNPNGHEDVSGLVSSGNPDTLTVYVGGPPN*
>161114
MAPSGTLPLAAAILALAGIVTAQQPGTSTPEVHPKLTTYQCTTSGGCVAQDTSVVLDWNYRWMHDANYNS
CTVNGGVNTTICPDEATCGTNCFIEGVNYTASGVTTSGSSLTMNQYMPATTGGYSSVSPRLYLLGADGNY
VLLQLNGKELSFDVDLSALPCGENGSLYLSQMADNGGANQYNTAGANYGSGYCDAQCPVQTWKNGTLNTN
HSGYCCNEMDILEGNSEANALTPHSCTATACDSSGCGLNPYASGFHSYYGPGLTVDTSKPFTITTQFNTD
NGSPSGNLVSITRKYIQNGVSIPSAQSGGDIISSCPSASAYGGLTTMGKALTSGMVLIFSIWNDSGGYMN
WLDSGSSGPCSSTEGNPSTILANNPGTHVTFSNIKWGDIGSTTSGGSSPPPPPASSTTLRTSTTTSKTST
APPSCTQTHWGQCGGNGYTGCKTCASGTTCQYSNDCEYSMNISKRRFRILIM*
>86295
MVLFRSLVFFSATACAATAPPSQSQGGIMAEQGLPDGIYQAAAVQGPTFEAPSAVPSSHLSLRGWKHPPG
EGDFHEKPGPHTEDEYSVPIHATRHSCHKDRHILLNSTEYRRAIDNLWDYCQNFKVPYHGAHLSIVGDVM
VYVCAYGRERPCHRHEWNEAEQIMDKKCGQGKGSHVQMRKKLKEYGRAHVGKKVCASSSLGMDLEWKTKP
LPVLVNGQTLGHWKAGPPRYKAGDPQYKAEEDGKKEDKAEEDGKKEDKVEDDGKKKDKAG*
Coloreado en 0.000 segundos, usando GeSHi 1.0.8.4
Y la idea del output es algo así:
Using text Syntax Highlighting
Gracias de antemano,
Iván Alemán