Estoy interesado en obtener secuencias de codificación de mi gen favorito en todos los individuos de 1000Genomes (y proyectos similares). Utilizo GATK para obtener el subconjunto correcto de variantes, vcf-consent para mapear estas variantes en el genoma de referencia y finalmente samtools para extraer los exones individuales. Esto funciona bien si las variantes son SNP, pero si hay indeles, esto cambia las coordenadas de los exones y termino obteniendo la región incorrecta. ¿Existe alguna forma genérica de reasignar las coordenadas genómicas para dar cuenta de los cambios creados por indels?