Esta pregunta también se ha publicado en Biostars
He secuenciado numerosos conjuntos multiplexados de bibliotecas BS amplicon-seq derivadas de muestras humanas en un MiSeq durante las últimas semanas. He estado utilizando trim-galore y Bismark para la alineación y encuentro que la eficiencia del mapeo es realmente baja para dos grupos (55% & 30% respectivamente), los cuales tenían una citosina por secuencia de bases de alrededor del 10-20% en todo el leer en sus archivos fastqc.
El alto contenido de C visible en los archivos fastqc me hace pensar que la baja eficiencia de mapeo se debe a una mala conversión de bisulfito, ya que se esperaría que estuviera cerca de cero si la conversión de bisulfito hubiera realmente tuvo lugar.
Soy nuevo en el campo, por lo que cualquier ayuda sería muy apreciada.