Pregunta:
Cómo calcular genes superpuestos entre dos versiones de anotaciones genómicas
holmrenser
2017-05-17 16:51:45 UTC
view on stackexchange narkive permalink

Tengo dos anotaciones del mismo genoma generadas con diferentes canales de anotaciones. Quiero identificar modelos genéticos superpuestos.

Una característica importante de este genoma es que hay muchos 'genes dentro de los genes', es decir, un modelo de gen en el intrón de otro modelo de gen . Por lo tanto, solo quiero contar dos modelos de genes como superpuestos cuando sus anotaciones de exón de secuencia de codificación se superponen.

Usando algo como bedtools intersect es sencillo calcular la superposición entre las anotaciones a nivel de gen .

Sin embargo: no estoy seguro de cómo seleccionar genes superpuestos cuando solo se superponen sus exones de secuencia codificante (características de CDS).

¿Por qué no extrae las coordenadas de sus regiones CDS de sus archivos bed / gff y luego se cruzan las herramientas de la cama?
Eso todavía me dejaría con las funciones de CDS superpuestas. Al final quiero conocer los _genes_. ¿Por qué no escribir tu comentario en una respuesta?
One responder:
Gus
2017-05-17 19:56:36 UTC
view on stackexchange narkive permalink

Respuesta corta: En mi opinión, mi enfoque sería extraer los exones de CDS y ejecutar herramientas de cama en ellos.

Algunos detalles más: cuando extraiga los exones, asegúrese de asignarles todos los ID si aún no los tienen asignados y registre qué ID "pertenecen" a qué genes. Ahora, cuando obtiene exones que se superponen, sabe que están codificando y puede relacionarlos con los genes de los que se originan.



Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...