Pregunta:
¿En qué se diferencian los algoritmos de pico estrecho y pico ancho de MACS2?
Ian Sudbery
2017-05-20 05:21:09 UTC
view on stackexchange narkive permalink

La herramienta de llamada de picos MACS2 puede llamar a picos en modo de pico estrecho (para señales enfocadas como el factor de transcripción ChIPseq) o en modo de pico amplio (para señales más desactivadas, como ciertas modificaciones de histonas).

El algoritmo para llamadas de picos estrechos está bien descrito en la publicación MACS. Pero no encuentro mucha documentación sobre cómo las llamadas pico son diferentes en el modo pico amplio. El manual solo contiene lo siguiente:

--broad

Cuando esta bandera está activada, MACS intentará componer regiones amplias en BED12 (un formato similar al modelo genético ) colocando regiones cercanas muy enriquecidas en una región amplia con un límite flexible. La región amplia está controlada por otro corte a través de un corte amplio. La longitud máxima de la longitud de la región amplia es 4 veces la d de MACS

Pero esto realmente no describe exactamente cómo se realiza esto.

Entonces, ¿cuál es el algoritmo que utiliza MACS para llamar a picos amplios?

Encontré el [algoritmo] (https://github.com/taoliu/MACS/blob/24a1eab9fe7e885c27a37dbac2efb99d6da8dc74/MACS2/IO/BedGraph.pyx#L594), pero honestamente no pude obtener el intento / excepto la construcción en la línea 629. ..
One responder:
#1
+10
Daniel Kim
2017-05-21 02:38:55 UTC
view on stackexchange narkive permalink

La función clave es call_broadpeaks :

La descripción adjunta a la función dice:

Esta función intente encontrar regiones enriquecidas dentro de las cuales, las puntuaciones sean continuamente más altas que un límite dado para el nivel 1, y vincúlelas usando el espacio por encima del límite del nivel 2 con una longitud máxima de lvl2_max_gap.

scoring_function_s: símbolos de funciones para calcular la puntuación. 'p' para pscore, 'q' para qscore, 'f' para cambio de pliegue, 's' para resta. por ejemplo: ['p', 'q']

lvl1_cutoff_s: lista de cortes en regiones altamente enriquecidas, correspondientes a funciones de puntuación.

lvl2_cutoff_s: lista de cortes en regiones menos enriquecidas , correspondiente a las funciones de puntuación.

min_length: longitud de pico mínima, predeterminada 200.

lvl1_max_gap: espacio máximo para fusionar picos enriquecidos cercanos, predeterminado 50.

lvl2_max_gap : longitud máxima de las regiones de enlace, por defecto 400.

Devuelve el objeto PeakIO general para regiones altamente enriquecidas y regiones amplias con espacios en BroadPeakIO.

Para dar una explicación básica, el algoritmo (brevemente) parece ser el siguiente:

  1. Se denominan dos niveles separados de picos, nivel 1 (un pval más alto, es decir, más significativo) y nivel 2 (un pval más bajo ). El nivel 1 está controlado por -p y el nivel 2 está controlado por --broad-cutoff . Cuando se llama a cada conjunto de picos, se vinculan inmediatamente mediante el parámetro de intervalo máximo para cada conjunto.

  2. Luego, suponiendo que todos los picos de nivel 1 deben estar dentro de los picos de nivel 2 (esto es una suposición explícita de MACS2), el algoritmo agrupa los picos del nivel 1 dentro de los picos del nivel 2 para generar un pico amplio.

...

Esto tiene algunas implicaciones:

  1. Las llamadas de picos amplios realmente provienen solo de los picos de nivel 2 (+ enlace). Las llamadas de picos de nivel 1 le permiten distinguir subpicos (para que pueda tener picos con huecos).

  2. Aparte de la vinculación, las llamadas de pico amplio serían las mismas que las llamadas de pico estrecho, si llama a ambas con el mismo umbral de pval (por ejemplo, si establece --broad-cutoff 0.1 en el modo de pico amplio y -p 0.1 para el modo de pico estrecho)

¿Podría aclarar en su respuesta que "pval más alto" es en realidad un valor p "más bajo" o "más significativo" y que "pval más bajo" es en realidad un valor p "más alto" o "menos significativo"? Preveo que alguien se confundirá con la redacción.
Se agregó una aclaración: ¡gracias por la captura!


Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...