Pregunta:
¿Cuál es la diferencia entre samtools, bamtools, picard, sambamba y biobambam?
medbe
2017-06-03 04:50:11 UTC
view on stackexchange narkive permalink

Después de algunas búsquedas en Google, encontré varias herramientas con funciones superpuestas para ver, fusionar, agrupar, etc. No tengo tiempo para probar estas herramientas, así que veré si alguien ya sabe la respuesta: ¿cuál es la diferencia entre ¿ellos? ¿Actuación? ¿Caracteristicas? ¿O algo mas? ¿Cuál se prefiere generalmente? ¿Samtools?

Es probable que esta pregunta inspire un debate obstinado sobre los méritos (o no) de las diferentes herramientas, lo que no se recomienda en StackExchange. Sería útil que se hiciera una sola pregunta, preferiblemente una que trate de mantenerse alejada de las preferencias de las personas.
En el "algo más" se podría agregar la calidad de la documentación, que puede ser un factor importante a la hora de decidir qué herramienta adoptar.
One responder:
#1
+15
gringer
2017-06-03 06:50:55 UTC
view on stackexchange narkive permalink

La respuesta obvia es que las escribieron diferentes personas. Es bastante común en bioinformática que las personas con experiencia en ciencias de la computación se sientan frustradas con las herramientas existentes y creen su propia herramienta alternativa (en lugar de mejorar una herramienta existente). Con el tiempo, las herramientas con objetivos iniciales similares tendrán funcionalidades populares implementadas en ellas (y eventualmente tendrán errores corregidos), de modo que importa menos qué herramienta en particular se use para métodos comunes.

Aquí está mi impresión de las herramientas :

  1. samtools - escrito originalmente por Heng Li (quien también escribió BWA). Las personas que ahora trabajan en samtools también mantienen la especificación de formato de archivo de alineación para SAM, BAM y CRAM, por lo que es probable que las nuevas funciones de formato de archivo se implementen primero en samtools.

  2. bamtools: parece que fue escrito por Derek Barnett, Erik Garrison, Gabor Marth, Michael Stromberg para reflejar el kit de herramientas samtools, pero usando C ++ en lugar de C

  3. picard: herramientas Java escritas por Broad Institute para manipular archivos BAM / SAM. Estar escrito en Java facilita la migración a otros sistemas operativos, por lo que puede funcionar mejor en sistemas Windows. Estoy más familiarizado con el uso de picard en un nivel de filtrado (por ejemplo, eliminando duplicados de PCR) y para análisis estadístico, pero se vincula con la biblioteca Java HTS de samtools, por lo que probablemente comparta muchas de las funciones.

  4. sambamba: un conjunto de herramientas con licencia GPL2 escrito en el lenguaje de programación D (presumiblemente por Artem Tarasov y Pjotr ​​Prins). No lo he usado (y no conozco personas que lo hayan usado), pero la página de github sugiere "Durante casi 5 años, la principal ventaja sobre samtools fue la lectura de BAM paralelizada. Finalmente, en marzo de 2017, se lanzó samtools 1.4, alcanzando la paridad en esto ".

  5. biobambam: escrito por German Tischler en C ++. Tampoco tengo experiencia con este kit de herramientas. Esto parece tener alguna capacidad de subprocesamiento múltiple, pero por lo demás es similar a otros kits de herramientas.

Una comparación de la velocidad de clasificación entre SAMtools (versión 1.2) y sambamba (versión 0.6.3) [aquí] (https://www.basepairtech.com/blog/sorting-bam-files-samtools-vs-sambamba/).
A la luz de que las versiones anteriores de Samtools son más lentas que Sambamba, a veces también debe considerar las necesidades de la canalización general. Por ejemplo, algunos software más antiguos requieren versiones antiguas de Samtools para ejecutarse, lo que puede dificultar la obtención de las ventajas de velocidad de los Samtools más nuevos y llevar a elegir usar un programa diferente por completo en lugar de tener que admitir diferentes versiones de la misma herramienta en su tubería.


Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...