Estamos considerando cambiar nuestro formato de almacenamiento de BAM a CRAM. Trabajamos con muestras de cáncer humano, que pueden tener variantes de prevalencia muy baja (es decir, sin frecuencia diploide).
Si usamos CRAM con pérdida para ahorrar más espacio, ¿cuánto cambiarán las variantes llamadas desde esos archivos CRAM? ¿Qué estrategia de compresión tiene el menor impacto?
¿Existen otros impactos en las herramientas posteriores que no estemos considerando?