Tengo una matriz de distancias generada por hierfstat, por lo tanto, con un enlace al archivo fasta aquí:
biblioteca (adegenet) biblioteca (hierfstat) snps < - fasta2DNAbin ('test.fa', chunkSize = 50) gi <- DNAbin2genind (snps) # definir manualmente las poblaciones para pasar a pares.fstp <- c ('Botswana', 'Botswana', 'Botswana', 'Botswana' , 'Francia', 'Francia', 'Vietnam', 'Vietnam', 'Uganda', 'Uganda', 'Uganda', 'Uganda', 'Vietnam', 'Vietnam', 'Laos', 'Laos', ' Laos ',' Vietnam ',' Vietnam ',' Vietnam ',' Vietnam ',' Vietnam ') f <- pairwise.fst (gi, p, res.type = c (' dist ',' matrix ')) as .matrix (f)
que produce
1 2 3 4 51 0 0.2189008 0.225567409 0.1821518 0.2594097222 0.2189008 0 0.130736953 0.1648034 0.1910507723 0.2255674 0.130737 0 0.1669077 0.006396789480 0.182 0.166907683 0 0.2039314575 0.2594097 0.1910508 0.006396789 0.2039315 0
¿Es seguro asumir que 1 = Botswana, 2 = Francia, 3 = Vietnam, 4 = Uganda y 5 = Laos? es decir, que las filas / columnas de la matriz de distancia siguen el orden en que cada población apareció por primera vez en p
?
¿Hay alguna manera de determinar con certeza qué fila / columna en la matriz de distancia? ¿A qué población corresponde?