Pregunta:
¿Cuáles son todos los archivos de referencia producidos por bwa index, y dependen de si la referencia está comprimida?
mattm
2017-06-03 00:36:08 UTC
view on stackexchange narkive permalink

He indexado una referencia comprimida con gzip con bwa: bwa index reference.fa.gz , que produce una serie de otros archivos reference.fa.gz. {amb, ann, bwt, pac, sa} . Estos funcionan bien con la alineación bwa.

He descubierto que samtools no toma una referencia comprimida con gzip, así que planeo usar una versión descomprimida de la referencia para mi flujo de trabajo en lugar de tratar con dos representaciones separadas de la referencia.

¿Los archivos reference.fa.gz. {amb, ann, bwt, pac, sa} dependen de que la referencia se haya comprimido con gzip? ¿Necesito volver a indexar el archivo reference.fa descomprimido con bwa, o puedo simplemente cambiar el nombre de los archivos actuales para eliminar la parte .gz del nombre del archivo?

One responder:
#1
+6
Devon Ryan
2017-06-03 00:46:16 UTC
view on stackexchange narkive permalink

Obtendrá exactamente el mismo índice ( amb , ann , bwt , pac y sa archivos) si la referencia está comprimida con gzip o no. BWA también crea su propia secuencia de referencia empaquetada (el archivo .pac) por lo que ni siquiera necesita el genoma después de indexar.



Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...