• Publicidad

bioinfo: kseq::klib para interpretar archivos FASTQ/FASTA

Perl aplicado a la bioinformática

bioinfo: kseq::klib para interpretar archivos FASTQ/FASTA

Notapor explorer » 2015-01-20 06:20 @306

«Desde hace tiempo venimos usando en el laboratorio la librería kseq.h , integrante de [ https://github.com/attractivechaos/klib ], para las desagradecidas tareas de manipular grandes archivos en formato FASTQ. Esta librería es un único archivo .h en lenguaje C que de manera muy eficiente permite leer archivos FASTQ, y también FASTA, incluso comprimidos con GZIP, con zlib. La eficiencia es fundamental para estas aplicaciones, porque modificar archivos .fastq de varios GB puede consumir mucho tiempo.

Como resultado de esta experiencia hace unos meses colgamos de la web del laboratorio un programita, que llamamos split_pairs. Este software facilita trabajos tediosos como pueden ser modificar las cabeceras de una archivo FASTQ con expresiones regulares para que un programa posterior no se queje, y de paso emparejar o interlazar los reads según convenga. Está escrito en C++ y tiene asociado un script Perl.

De lo que quería hablar hoy es de que es posible utilizar kseq.h directamente desde nuestro lenguaje preferido. Para ellos es necesario emplear herramientas que permitan incluir, y compilar, código C mezclado con el de nuestro lenguaje interpretado. En el caso de Python estaríamos hablando por ejemplo de cython; aquí os muestro cómo hacerlo en Perl con el módulo Inline::CPP, dotando a kseq de una interfaz orientada a objetos para evitar pasar tipos de datos con tipos no estándar...»

Artículo
Avatar de Usuario
explorer
Administrador
Administrador
 
Mensajes: 14480
Registrado: 2005-07-24 18:12 @800
Ubicación: Valladolid, España

Publicidad

Re: bioinfo: kseq::klib para interpretar archivos FASTQ/FAST

Notapor Kryban » 2017-02-25 00:27 @060

Saludos,

Buscando por Internet llegué a esta página y encontré interesante el tema de poder manejar un archivo fasta o fastq más rápido. He tratado de ejecutarlo en mi PC pero no logro ejecutarlo de manera correcta. ¿Hay algún manual o instructivo para poder utilizar el módulo klib::kseq?

De antemano, gracias.
Kryban
Perlero nuevo
Perlero nuevo
 
Mensajes: 3
Registrado: 2017-02-24 22:45 @989


Volver a Bioinformática

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 0 invitados