Pregunta:
Los efectos de la conversión incompleta de bisulfito sobre la eficiencia del mapeo
DDRRpy
2017-05-24 11:41:10 UTC
view on stackexchange narkive permalink

Esta pregunta también se ha publicado en Biostars

He secuenciado numerosos conjuntos multiplexados de bibliotecas BS amplicon-seq derivadas de muestras humanas en un MiSeq durante las últimas semanas. He estado utilizando trim-galore y Bismark para la alineación y encuentro que la eficiencia del mapeo es realmente baja para dos grupos (55% & 30% respectivamente), los cuales tenían una citosina por secuencia de bases de alrededor del 10-20% en todo el leer en sus archivos fastqc.

El alto contenido de C visible en los archivos fastqc me hace pensar que la baja eficiencia de mapeo se debe a una mala conversión de bisulfito, ya que se esperaría que estuviera cerca de cero si la conversión de bisulfito hubiera realmente tuvo lugar.

Soy nuevo en el campo, por lo que cualquier ayuda sería muy apreciada.

Puede ser bueno familiarizarse con los pasos detrás del mapeo de lecturas convertidas con bisulfito. En esta publicación sobre [biostars] (https://www.biostars.org/p/107871/), le doy un desglose rápido de los pasos involucrados si quiere echar un vistazo (pero, por supuesto, hay mucho material disponible en eso).
One responder:
#1
+7
Devon Ryan
2017-05-24 11:46:37 UTC
view on stackexchange narkive permalink

La eficiencia de conversión de bisulfito no tiene ningún efecto sobre la tasa de mapeo en bismark y herramientas similares. La razón es que las lecturas se convierten completamente en bisulfito in silico antes de la alineación para minimizar el sesgo de mapeo.

Te sugiero que juegues con la configuración entregada a bowtie2, como usar alineación local y modificar la opción --score-min para permitir más discrepancias. Alternativamente, puede probar un alineador diferente como bwameth, que siempre hará una alineación local.

Gracias. --La ​​bandera local en los documentos de bowtie2 parece prometedora, le daré una oportunidad cuando entre en la oficina. ¿Bismark analizará las opciones / banderas de bowtie2 en bowtie2 (pregunto ya que --local no está presente en los documentos de bisamark sino solo en los documentos de bowtie2)? ¿Qué puedo concluir sobre la alta citosina por secuencia de bases en los archivos fastqc? En general, he encontrado que esto está al 0% en análisis anteriores o al 10% en los extremos, momento en el que recortaría los extremos.
No creo que bismark maneje correctamente el indicador `--local`, ya que espera que las lecturas se alineen por completo o se descarten, sin ningún recorte suave.
Si después de ejecutar bismark los gráficos de MBIAS no parecen relativamente planos, puede pasar un parámetro de filtro a bismark_methylation_extractor, de modo que, por ejemplo, ignora los últimos 10 pb de cada lectura.
@719016: Puede que tengas razón, han pasado algunos años desde que miré el código bismark, generalmente trato de evitar usarlo ya que es increíblemente lento y se usa para dar malos resultados.
Como también propone Devon Ryan, es posible que desee probar bwameth, que es una envoltura simple alrededor de bwa-mem, y mantiene las alineaciones recortadas suavemente si existen. Luego puede aplicar otro script para contar los CpG del bam, p. Ej. éste: https://github.com/dariober/bioinformatics-cafe/tree/master/bam2methylation
Por lo general, recomiendo [MethylDackel] (https://github.com/dpryan79/MethylDackel) para la extracción de metilación y el control de calidad, pero estoy sesgado: P


Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...