Estoy buscando una forma de identificar regiones de baja complejidad y otras repeticiones en el genoma de Escherichia coli . Encontré que RepeatMasker se puede usar, por ejemplo, al redactar genomas de procariotas ( E. coli ejemplo). Pero RepeatMasker funciona con un conjunto de datos limitado de especies, ninguna de las cuales es procariota. De forma predeterminada, cuando se ejecuta RepeatMasker, si no se especifica ninguna especie, se comparará con los datos del homo sapiens.
Esto parece bastante inadecuado, pero la alternativa más relevante, PRAP, requiere una herramienta "muerta" (VisCoSe, de Michael Spitzer).
- ¿Sigue siendo aconsejable utilizar RepeatMasker en Escherichia coli ?
- En caso afirmativo, ¿qué configuración maximizaría la relevancia?