Sesgo de 5 'y 3' en datos Rna-seq

Pregunta:

stack_learner

2018-02-18 16:36:18 UTC

view on stackexchange narkive permalink

Estoy trabajando con muestras de rna-seq. Veo un sesgo de 5 'y también un sesgo de 3' en la trama de contenido de secuencia por base. Desde este enlace veo que el sesgo al comienzo de las secuencias parece ser el resultado de una selección sesgada de fragmentos de la biblioteca. Y esto no afectará a ningún análisis posterior. Pero en todas mis muestras también veo sesgos al final de las secuencias. ¿Cual puede ser el problema? Las muestras se secuencian de forma específica por hebra con el protocolo de selección poli-A.

En el perfil de cobertura de la transcripción veo un sesgo de 5'-3 'para todas mis muestras: 0,9

Mostrando el -trama de secuencia base para una de las muestras: para todas las muestras veo ese sesgo de 5 'y 3'.

Cuando miré el contenido del Adaptador, esto es lo que veo:

No se encontraron muestras con ningún adaptador de contaminación> 0,1%

Dos respuestas:

Devon Ryan

2018-02-18 20:34:53 UTC

view on stackexchange narkive permalink

Supongo que hubo un problema de secuenciación durante la última base, donde algunos de los reactivos se estaban agotando en el secuenciador. Esto no planteará ningún problema real, los alineadores de RNAseq como STAR simplemente recortarán suavemente la última base o dos si no coinciden.

Es común ver un poco de sesgo hacia el 5 'o 3 'termina en RNAseq, principalmente debido a si se realizó una selección de poli-A o hubo un poco de degradación. Lo principal que debe asegurarse es que el sesgo sea similar entre muestras / grupos. Si ese es el caso, no tiene que preocuparse de que sus análisis posteriores se vean afectados por algún tipo de sesgo por grupo.

Estoy usando hisat2 y sí, veo que el sesgo es similar en todas las muestras. Gracias por la respuesta.

Ah, para hisat2 podrías obtener resultados un poco mejores si recortas las últimas 1-2 bases. Esto se debe a que hisat2 realiza alineaciones globales (es decir, no realiza recortes suaves). O al menos ese fue el caso la última vez que lo comprobé.

Frio. Consideraré esto y recortaré algunas bases en el extremo de 3 '. ¿Necesita algún recorte también en el extremo de 5 '?

No, el final de 5 'debería estar bien.

Pensé que hisat2 tenía una opción `--local`, pero cuando ejecuto` hisat2 -h | grep local`, solo obtengo `--ma bonificación de coincidencia (0 para - de extremo a extremo, 2 para --local)`. No `--local` propiamente dicho. La ayuda no parece coherente.

@bli Los placeres de la documentación del paquete bioinformático ...

ewels

2020-05-20 14:22:49 UTC

view on stackexchange narkive permalink

Sé que esta es una publicación antigua, pero si este gráfico es de después del recorte, sugeriría una explicación diferente: algunas herramientas de recorte eliminan las secuencias poli-A de las lecturas. Si ese es el caso, entonces cualquier lectura que termine con A se eliminará, esto conduce a un contenido base 0% A en la posición base final (y un% Un en el último par de bases).

Esto no debería tener ningún efecto sobre las alineaciones o el análisis.

ⓘ

Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.

acerca de - nota legal