Quiero realizar una comparación del genoma en un grupo de aislados. Quiero analizar dos grupos amplios de taxones y comparar el genoma accesorio en cada grupo. He estado usando prokka (v1.12) y roary (v3.8.2) para hacer esto, pero parece que el archivo accessories_binary_genes.fa es en realidad una representación falsa.
Nota: gene_presence_absence.Rtab contiene toda la presencia / ausencia total de conjuntos de genes accesorios. A pesar de esto, sigo descontento con la nomenclatura de los grupos de genes [problema para otro día]
[github problema 335] Lo mejor es ignorar el archivo accessories_binary_genes.fa. Es solo para crear un árbol rápido y sucio con FastTree. El archivo en sí se filtra para eliminar variaciones muy comunes y no comunes para acelerar la generación del árbol, de ahí la diferencia en los números.
Se excluyen el 5% superior y el 5% inferior. Está truncado en 4000 genes.
He estado buscando canales alternativos y un nuevo software BPGA parece prometedor. ¿Alguien tiene experiencia con esto?
Básicamente, quiero una herramienta que me proporcione los conjuntos de genes centrales y accesorios, sin el ruido de los impactos genéticos parciales.