Pregunta:
¿Cómo se puede estimar la contribución de la línea celular a partir de los datos de RNASeq?
llrs
2017-05-30 12:30:54 UTC
view on stackexchange narkive permalink

Usando una microdisección de captura con láser de células, se secuenció un grupo de células teñidas con el marcador de interés. En otra cohorte de pacientes (todo esto es tejido de hígado humano) se secuenció todo el tejido (RNA-seq en ambos casos)

¿Puedo estimar la contribución de las células marcadas en todo el hígado ("peso de estas células "en el hígado en palabras de mi IP)?

Mi intuición es que no se puede hacer de esta manera, se requeriría tanto la secuenciación de una sola célula como la secuenciación de tejido completo para estimar la contribución de cada línea celular. Pero tal vez haya una herramienta que, dadas las líneas celulares o la expresión principal de otras líneas celulares, se pueda comparar con el uso de GSVA o alguna herramienta similar.

¿Ha buscado herramientas para la estimación de mezclas (eso es lo que está haciendo)? ¿Qué tan precisa necesita que sea la estimación?
No he oído hablar de la estimación de mezclas, por lo que no he buscado herramientas con esa palabra clave. No tengo un requisito de precisión, cuanto más, mejor: D. Pero sospecho que mis datos no son demasiado buenos (solo tengo 6 réplicas técnicas de la microdisección láser), así que no puedo esperar mucho.
Cuatro respuestas:
#1
+6
Iakov Davydov
2017-06-01 14:01:04 UTC
view on stackexchange narkive permalink

Hay un par de métodos computacionales que intentan hacer esto (nunca los usé, así que no tengo experiencia):

  1. CellMix, basado en conjuntos de genes marcadores listas
  2. Predicción de subconjuntos a partir de la correlación de enriquecimiento, que se basa en correlaciones con genes específicos de subconjuntos en un conjunto de muestras.
  3. Enriquecimiento de tipo celular, que utiliza nuestra base de datos de genes específicos de células altamente expresada
  4. Análisis de significación específico del tipo de célula mediante expresión genética diferencial para cada tipo de célula
  5. ol >

    Es posible que deba obtener algunos niveles de expresión de referencia de bases de datos o artículos públicos para algunos de los métodos.

    Una cosa a tener en cuenta: no se puede calcular realmente la proporción de células, solo la proporción de ARN. Si tiene una buena razón para suponer que la cantidad de ARN por célula es muy similar, este es un buen indicador de la proporción de células en un tejido.

Buenas referencias. Tendré esa limitación en mente. Gracias
#2
+4
gringer
2017-06-01 17:48:19 UTC
view on stackexchange narkive permalink

La deconvolución celular se menciona en esta publicación de Biostars, que menciona CIBERSORT para mezclas de células inmunes, y el paquete Bioconductor DeconRNASeq.

En cuanto a Soy consciente de que, en el mejor de los casos, solo es posible obtener una representación proporcional para la expresión de la transcripción a partir de los resultados de secuenciación estándar de alto rendimiento, porque los secuenciadores y el flujo de trabajo de preparación de muestras están diseñados de tal manera que se generan la misma cantidad de lecturas independientemente de la cantidad de entrada.

CIBERSORT suena como una buena herramienta, vale la pena intentarlo.
#3
  0
Dr_Hope
2020-08-18 19:18:02 UTC
view on stackexchange narkive permalink

Puede descargar datos públicos de la secuencia de ARN de una sola célula o de la secuencia de ARN a granel para las células primarias purificadas como referencia y luego usar CIBERSORT o MuSiC para deconvolucionar. compatible, TPM de RNA-seq se puede comparar con CPM en datos de celda única de 3 '(10X, Drop-seq, etc.) y TPM en datos de celda única de longitud completa (SMARTseq, etc.)

#4
  0
Reza Rezaei
2020-08-18 21:31:11 UTC
view on stackexchange narkive permalink

En realidad, hace un mes, estaba buscando la misma pregunta y encontré algunos paquetes que se pueden usar. En primer lugar, la funcionalidad de ellos puede ser la estimación de la proporción celular, la estimación de la expresión génica específica de la célula o ambas funciones. En segundo lugar, su entrada principal, como se esperaba, son datos de secuencia de ARN a granel y algunos también quieren datos de secuencia de ARN de una sola célula como entrada secundaria. El más popular es el hijo del famoso cibersort, CIBERSORTX. Revisé su sitio web y leí los tutoriales. Tienen varios conjuntos de datos de ejemplo que se pueden usar para aprender su plataforma. Sin embargo, las dos fallas más grandes fueron que no han compartido su código fuente, lo que significa que no podemos reproducir el resultado en nuestros propios sistemas y tenemos que cargar todos nuestros datos en los servidores de Stanford (¡preocupaciones de seguridad!). El segundo problema es que no hay acceso API a su servidor y todo debe hacerse en línea, lo que significa una compatibilidad muy baja con otras herramientas.

La idea, usar la deconvolución y el aprendizaje profundo para inferir subpoblaciones de celdas de forma masiva RNA-seq, es genial. Entonces, busqué para ver si otros también habían hecho algo similar y tal vez incluso mejor. Encontré otras tres herramientas:

  1. MuSiC: https://www.nature.com/articles/s41467-018-08023-x
    Publicado en comunicación de la naturaleza y unos meses más antiguo que cibersortx. Todavía no he estudiado su algoritmo, por lo que no puedo decir si su método es mejor que cibersortx o no. Sin embargo, la parte que marca la diferencia es que todos sus trabajos, incluido su código fuente, son de código abierto. Entonces, puedo acceder a su código y no necesitamos cargar nuestros datos no publicados en un servidor en línea no seguro (a diferencia de cibersortx). La segunda cosa buena es que está implementado en lenguaje R que utilizo para la mayoría de mis análisis de datos RNA-seq, por lo que es fácilmente compatible con otras herramientas.

  2. Scaden: https://advances.sciencemag.org/content/6/30/eaba2619.full Este también es de código abierto y accesible fácilmente. Está escrito en Python y se ejecuta en el shell. Entonces, es algo compatible con otras herramientas (no tan compatible como MuSic). Nuevamente, podemos procesar nuestros datos localmente y no necesitamos cargar nuestros datos en ningún servidor (lo cual es bueno). Afirman que su método tiene una mejor correlación con los datos de scRNA-seq reales que tanto cibersortx como MuSic (¡no siempre!). Ejecutar sus herramientas parece fácil según sus tutoriales (¡todavía no lo he ejecutado en mi sistema!). Sin embargo, sus tutoriales parecen ser un poco confusos y parece que todavía están en la versión preliminar y tienen errores.

  3. CDSeq: https: / /github.com/kkang7/CDSeq_R_Package Finalmente, encontré el paquete CDSeq que no necesita ninguna entrada de scRNA-seq para encontrar proporciones de células individuales y expresión génica específica de células en datos masivos. Simplemente obtiene su recuento de buld como entrada e información sobre muy pocos parámetros y lo hace todo automáticamente, y sorprendentemente bien, ¡lo verifiqué! Si puede encontrar el patrón de expresión génica de sus células específicas y también usarlo como entrada, es opcional, le dará una estimación aún mejor.



Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...