Pregunta:
validar subpoblaciones identificadas de células en scRNA-seq
Deffiz
2017-06-03 00:22:35 UTC
view on stackexchange narkive permalink

En los análisis de datos de secuencia de ARN de una sola célula, existen diferentes enfoques no supervisados ​​para identificar subpoblaciones putativas (por ejemplo, las disponibles con los paquetes Suerat o SCDE).

¿Existe una buena forma de validar computacionalmente las soluciones de clúster? Los diferentes métodos pueden dar como resultado resultados de agrupación ligeramente diferentes. ¿Cómo saber cuál es el mejor, es decir, representativo de subpoblaciones biológicas?

Hay un poco de locura al tratar de validar computacionalmente métodos computacionales sin un conjunto de datos de verdad conocido ...
Cambié el ARNc por ARN unicelular (ya que el ARNc también significa ARN condicional pequeño).
@Kamil "scRNA-seq" es un nombre establecido para RNA-seq de una sola célula.
Dos respuestas:
#1
+6
olga
2017-06-03 00:50:22 UTC
view on stackexchange narkive permalink

Un enfoque SC3, agrupación de consenso de una sola célula, podría ser útil aquí. Su objetivo es lograr "alta precisión y robustez mediante la combinación de múltiples soluciones de agrupación mediante un enfoque de consenso" https://www.nature.com/nmeth/journal/v14/n5/full/nmeth.4236.html

#2
+2
Alec
2017-06-14 06:38:02 UTC
view on stackexchange narkive permalink

Si bien los mejores métodos para evaluar sus clústeres serían utilizar un conjunto de datos externo o un conjunto de datos con la verdad conocida, existe una variedad de métricas de validación interna que se pueden usar para comparar soluciones de clústeres sin otro conjunto de datos.

Aquí hay algunas métricas:

  • Índice de Davies-Bouldin
  • Índice de Calinski-Harabasz
  • Desviación estándar de la raíz cuadrada media

Se pueden encontrar muchos más en esta revisión de agrupamiento: http://stke.sciencemag.org/content/9/432/re6

Estos Las métricas de validación califican su solución de agrupación en clústeres en función de tres medidas: compacidad, conectividad y separación. Cuando utilice estas métricas para comparar soluciones de agrupación en clústeres, asegúrese de considerar qué métrica es adecuada para sus resultados, ya que algunos algoritmos funcionan optimizando ciertas medidas.



Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...