Pregunta:
Clasificación de muestras según la expresión del gen marcador
GWW
2017-05-24 20:41:28 UTC
view on stackexchange narkive permalink

Tengo algunos conjuntos de genes marcadores que puedo clasificar muestras de RNA-seq mediante agrupación semi-supervisada. Me gustaría automatizar el proceso, sin embargo, estoy luchando por encontrar el algoritmo ideal que pueda generar algún tipo de puntuación para el conjunto de genes marcadores a partir de una muestra determinada.

Supongo que este es un análisis estándar en muchos grupos, pero no estoy seguro de qué métodos están dando buenos resultados en la práctica.

Recientemente hubo una pregunta similar en Biostars que no arrojó respuestas: https://www.biostars.org/p/239228/
Estoy sorprendido. Parece un problema tan importante. Especialmente con scRNA-seq ganando popularidad.
Como mencionó los datos de scRNA-seq, es posible que le interese [Buettner * & al. *] (Https://www.nature.com/nbt/journal/v33/n2/full/nbt.3102.html): “ El análisis computacional de la heterogeneidad de célula a célula en datos de secuenciación de ARN de célula única revela subpoblaciones ocultas de células ”. No resuelve del todo su problema, pero muestra algunos de los problemas asociados con la identificación de poblaciones de células en scRNA-seq en particular, que se suavizan en gran medida en la masa de RNA-seq.
One responder:
#1
+7
Peter Humburg
2017-05-25 04:32:41 UTC
view on stackexchange narkive permalink

Consideraría usar firmas de expresión genética para clasificar muestras (especialmente subtipos de cáncer, pero los mismos principios se aplican a otros problemas de este tipo) uno de los problemas clásicos de la bioinformática. Se ha trabajado bastante en métodos para derivar conjuntos de genes que proporcionan un buen rendimiento de clasificación. Esto es ligeramente diferente de su problema, ya que ya tiene una firma genética, pero aún puede resultar útil.

Estos métodos generalmente se ajustan a un modelo que selecciona una (pequeña) cantidad de genes de datos de expresión de todo el genoma que distinguen entre los tipos / condiciones de células en cuestión, es decir, derivan una firma genética. El modelo resultante permite la clasificación de nuevas muestras. Tuve éxito usando GeneRave para este propósito (pero tenga en cuenta que esto fue diseñado para datos de microarrays, no lo he usado con datos de RNA-seq y no sé qué tan bien se mantiene allí ). Puede encontrar un documento más reciente relacionado con este problema aquí.

Entonces, ¿cómo le ayuda eso? Una opción sería ajustar uno de estos clasificadores a los datos de expresión génica de los genes que ya conoce para obtener un modelo que luego se pueda aplicar a nuevas muestras automáticamente.

Eso es realmente útil, muchas gracias. Les daré una oportunidad o al menos veré cómo puedo adaptar sus métodos.
Siguiendo la advertencia de @Peter Humberg de que GeneRave está diseñado para datos de microarrays, podría "voom" transformar sus conteos usando "limma" para hacerlos * como microarrays *.
Cuando necesito comparar la expresión cDNASeq con microarrays, uso una normalización de la longitud de la transcripción aplicada a la transformación VST de DESeq (que llamo 'VSTPk'). Se pueden encontrar más detalles de eso en la sección de métodos de nuestro artículo Th2 RNASeq: http: //dx.doi.org/10.1084/jem.20160470


Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...