Estoy usando agrupamiento de Louvain (1,2) para agrupar células en datos scRNAseq, tal como lo implementa scanpy.
Uno de los parámetros necesarios para este tipo de agrupamiento es el número de vecinos utilizados para construir el gráfico de vecindad de celdas ( documentos).
Los valores más grandes dan como resultado una vista más global de la variedad, lo que lleva a un menor número de clústeres, mientras la reducción del número de vecinos va en sentido contrario. Sin embargo, no está claro cómo elegir este parámetro.
El parámetro de resolución parece funcionar de manera opuesta.
¿Conoce alguna metodología y / o regla general? definir estos parámetros? P.ej. dependiendo del tamaño del conjunto de datos?
- Levine, Jacob H., et al. "La disección fenotípica de la LMA basada en datos revela células parecidas a progenitoras que se correlacionan con el pronóstico". Cell 162.1 (2015): 184-197.
- Blondel, Vincent D., et al. "Despliegue rápido de comunidades en grandes redes". Revista de mecánica estadística: teoría y experimento 2008.10 (2008): P10008.