Tengo dos anotaciones del mismo genoma generadas con diferentes canales de anotaciones. Quiero identificar modelos genéticos superpuestos.
Una característica importante de este genoma es que hay muchos 'genes dentro de los genes', es decir, un modelo de gen en el intrón de otro modelo de gen . Por lo tanto, solo quiero contar dos modelos de genes como superpuestos cuando sus anotaciones de exón de secuencia de codificación se superponen.
Usando algo como bedtools intersect
es sencillo calcular la superposición entre las anotaciones a nivel de gen .
Sin embargo: no estoy seguro de cómo seleccionar genes superpuestos cuando solo se superponen sus exones de secuencia codificante (características de CDS).