Pregunta:
¿Por qué el genoma del coronavirus del SARS-Cov2 termina en aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa (33 as)?
Rebecca J. Stones
2020-01-25 06:55:20 UTC
view on stackexchange narkive permalink

Se lanzó el genoma del coronavirus SARS-Cov2 y ahora está disponible en Genbank. Mirarlo ...

  1 attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 61 gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 121 cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc ... 29761 acagtgaaca atgctaggga gagctgccta tatggaagag ccctaatgtg taaaattaat29821 tttagtagtg ctatccccat gtgattttaa tagcttctta ggagaatgac aaaaaaaaaa29881 aaaaaaaaaa aaaaaaaaaa aaa  

Wuhan mariscos mercado aislado del virus de la neumonía Wuhan-Hu-1, genuboma completo ,

Vaya, eso es un montón de a nucleótidos --- No creo que sea simplemente aleatorio. Supongo que es un artefacto del proceso de secuenciación o hay alguna razón biológica subyacente.

Pregunta : ¿Por qué el genoma del coronavirus del SARS-Cov2 termina en 33 a?

No es un biólogo, pero parece terriblemente similar al mecanismo de un trineo NOP, solo uno que ocurre naturalmente en la naturaleza. https://en.wikipedia.org/wiki/NOP_slide
29821 - 29881 (aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa)
@PedroA no es desconocido, https://en.uncyclopedia.co/wiki/AAAAAAAAA!
Creo que es porque cuando el científico se enteró del virus dijo "aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa".
La pregunta es EXACTAMENTE cómo se inician los grandes proyectos de bioinformática viral, que involucran muchos enfoques diferentes. Lo que se busca es una observación genética que resulte anómala y valore una correlación con fenotipos virológicos. En este caso, no me embarcaría en este proyecto, pero alguien más podría estar en desacuerdo. Por ejemplo, hace mucho tiempo detectamos que una región no traducida de un virus determinado (no Cov) estaba involucrada en la atenuación (anomalías de la cepa de la vacuna). Hoy en día, el concepto es una vacuna diseñada en ensayos de etapa III que se ve bien. Cuando los bioinformáticos dicen cosas, otros virólogos escuchan
¿El científico [debe haber muerto mientras lo secuenciaba] (https://sites.google.com/site/lucidenglish74/castle-of-aaargh--monty-python-and-the-holy-grail)?
@NONONO, la analogía del trineo NOP tendría sentido al comienzo del gen, pero este es el final.
"¡Ayuda, estoy atrapado en un laboratorio de secuenciación de genes!"
Murió por el virus y se sintió en el botón
Cuatro respuestas:
#1
+143
Cody Gray
2020-01-25 17:49:00 UTC
view on stackexchange narkive permalink

¡Buena observación! La cola 3 'poli (A) es en realidad una característica muy común de los virus de ARN de cadena positiva, incluidos los coronavirus y los picornavirus.

Para los coronavirus en particular, sabemos que la cola poli (A) es necesaria para replicación, que funciona junto con la región no traducida 3 '(UTR) como una señal que actúa en cis para la síntesis de hebras negativas y la unión al ribosoma durante la traducción. Los mutantes que carecen de la cola poli (A) están gravemente comprometidos en la replicación. Jeannie Spagnolo y Brenda Hogue informan:

La cola 3 ′ poli (A) juega un papel importante, pero aún no definido, en la replicación del genoma del Coronavirus. Para examinar más a fondo el requisito de la cola poli (A) de Coronavirus, creamos ARN interferente defectuoso (DI) mutante poli (A) truncado y observamos los efectos sobre la replicación. Se replicaron ARN DI de coronavirus bovino (BCV) y coronavirus A59 (MHV-A59) de hepatitis de ratón con colas de 5 o 10 residuos A, aunque con cinética retardada en comparación con los ARN DI con longitudes de cola de tipo salvaje (residuos >50 A). Un ARN DI de BCV que carecía de una cola poli (A) no pudo replicarse; sin embargo, un DI de MHV que carecía de cola se replicó después de múltiples pases de virus. La extensión / reparación de la cola de poli (A) fue concurrente con la replicación robusta de los mutantes de la cola. La unión de la proteína de unión a poli (A) del factor huésped (PABP) pareció correlacionarse con la capacidad de replicación de los ARN DI. Los mutantes de cola de poli (A) que estaban comprometidos para la replicación, o que eran incapaces de replicarse en absoluto, mostraron menos interacción PABP in vitro. Los datos respaldan la importancia de la cola poli (A) en la replicación del coronavirus y delinean aún más los requisitos mínimos para la propagación del genoma viral.

Spagnolo J.F., Hogue B.G. (2001) Requisito de la cola poli (A) en la replicación del genoma del coronavirus. En: Lavi E., Weiss S.R., Hingley S.T. (eds) Los Nidovirus. Advances in Experimental Medicine and Biology, vol 494. Springer, Boston, MA

Yu-Hui Peng et al. también informan que la longitud de la cola poli (A) se regula durante la infección:

Similar al ARNm eucariota, el El genoma del coronavirus de cadena positiva de ~ 30 kilobases está protegido en 5 'y poliadenilado en 3'. Se ha demostrado que la longitud de la cola del poli (A) coronaviral no es estática sino que está regulada durante la infección; sin embargo, se sabe poco sobre los factores implicados en la poliadenilación del coronavirus y su regulación. Aquí, mostramos que durante la infección, el nivel de alargamiento de la cola poli (A) del coronavirus depende de la longitud inicial tras la infección y que la longitud mínima para iniciar el alargamiento puede estar entre 5 y 9 nucleótidos. Por análisis de mutagénesis, se encontró que (i) el hexámero AGUAAA y la cola poli (A) son dos elementos importantes responsables de la síntesis de la cola poli (A) del coronavirus y pueden funcionar en conjunto para lograr la poliadenilación y (ii) la función de el hexámero AGUAAA en la poliadenilación coronaviral depende de la posición. Basándonos en estos hallazgos, proponemos un proceso sobre cómo se sintetiza y varía la cola de poli (A) coronaviral. Nuestros resultados proporcionan la primera evidencia genética para obtener información sobre la poliadenilación coronaviral.

Peng YH, Lin CH, Lin CN, Lo CY, Tsai TL, Wu HY (2016) Caracterización del papel del hexámero Cola de AGUAAA y poli (A) en la poliadenilación del coronavirus. PLoS ONE 11 (10): e0165077

Esto se basa en el trabajo anterior de Hung-Yi Wu et al , que demostró que el coronavirus 3 ' La cola de poli (A) tiene aproximadamente 65 nucleótidos de longitud tanto en ARNm genómico como en ARNm en el pico de síntesis de ARN viral, y también se observó que la longitud precisa variaba a lo largo de la infección. Lo más interesante es que informan:

Los análisis funcionales de la longitud de la cola de poli (A) en especies de ARN vírico específicas, además, revelaron que la traducción, in vivo, de ARN con la cola de poli (A) más larga se mejoró sobre aquellos con la poli (A) más corta. Aunque se desconocen los mecanismos por los cuales varían las longitudes de la cola, los resultados experimentales juntos sugieren que la longitud de las colas poli (A) y poli (U) está regulada. Una función potencial de la longitud de la cola de poli (A) regulada podría ser que para el genoma del coronavirus un poli (A) más largo favorece la traducción. La regulación de la traducción del coronavirus por la longitud de la cola de poli (A) se asemeja a la que ocurre durante el desarrollo embrionario, lo que sugiere que puede haber paralelismos mecánicos.

Wu HY, Ke TY, Liao WY, Chang NY. Regulación de la longitud de la cola de poli (A) coronaviral durante la infección. Más uno. 2013; 8 (7): e70548. Publicado el 29 de julio de 2013. doi: 10.1371 / journal.pone.0070548

También vale la pena señalar que las colas poli (A) en el extremo 3 'del ARN no son un característica inusual de los virus. El ARNm eucariota casi siempre contiene colas de poli (A), que se agregan postranscripcionalmente en un proceso conocido como poliadenilación. Por lo tanto, no debería sorprender que los virus de ARN de cadena positiva también tuvieran colas poli (A). En el ARNm eucariota, el motivo de secuencia central para identificar una región de poliadenilación es AAUAAA, identificado en la década de 1970, con investigaciones más recientes que confirman su ubicuidad. Proudfoot 2011 es un buen artículo de revisión sobre señales poli (A) en ARNm eucariota.

Quizás valga la pena señalar que la cola poli (A) en los ARNm eucariotas sirve como una región de unión para la proteína de unión poli (A) que ayuda a sacar el ARNm del núcleo.
El usuario NONONO mencionó en los comentarios un "trineo NOP", un truco utilizado en virus informáticos, que se utiliza para aumentar la probabilidad de que un fragmento de código (inyectado aleatoriamente en el host) se ejecute realmente. En ese contexto, siempre es un punto de partida. ¿Es posible que esta cola de As, como se describe aquí, en realidad no sea una "cola" (final de datos, última pieza traducida, etc.), sino una "cabeza" en su lugar? Una "cabeza" que es "atrapada" o "detectada" por algo y luego es donde el proceso comienza y procede con la lectura / procesamiento / replicación, o falla si la cadena A es demasiado corta y el proceso "pierde su comprensión" ¿en eso?
Sabiendo que todas estas entidades comparten una cola poli (A) 3 'similar y que ayuda en la replicación, ¿es posible unir esencialmente el extremo con una molécula sintética, o eso interferiría con el funcionamiento normal del anfitrión?
¿Qué significa el apóstrofe en "3"? ¿Eso es "Tres pies", "Tres Prime"?
@JPhi1618 [3-prime] (https://en.wikipedia.org/wiki/Directionality_ (molecular_biology) # 3% E2% 80% B2-end)
Los genes @HouseCat se traducen en ARN, que tiene una cola poliA 3 '. Si lo hace, evitaría la síntesis de proteínas en sus células, y eso no lo desea. La ricina es un veneno que bloquea la síntesis de proteínas, aunque lo hace a través de un mecanismo diferente
#2
+30
Michael
2020-01-26 01:33:51 UTC
view on stackexchange narkive permalink

Esta pregunta es bastante general, así que intentaré relacionarla con la bioinformática.

Antecedentes El árbol del coronavirus actual está aquí, mostrando que está estrechamente relacionado con el coronavirus de murciélago y, en particular, con el SARS.

Pregunta La pregunta bioinformática para el coronavirus actual es por qué este virus parece ser capaz de infectar y transmitir a humanos.

Tamaño del genoma En primer lugar, dijo que 30 kb era grande ... este es un tamaño estándar para un genoma de coronavirus, aunque es inusual que la familia Coronaviridae sea el genoma más grande para un virus de ARN monocatenario, por ejemplo, los flavivirus son 10 kb . Por tanto, todos los coronavirus tienen aproximadamente 30 Kb. Algunos coronavirus no infectan a los humanos (cero síntomas), algunos causan síntomas muy leves, otros son MERS y SARS con tasas de mortalidad del 40-60% y 10%, respectivamente. Por lo tanto, en mi opinión, el tamaño del genoma tiene poco interés bioinformático.

Poliadenilación La poliadenilación y el taponamiento (metilación 5 ') permiten que los ribosomas traten y transcriban el ARN y el mecanismo es ampliamente utilizado por virus. La metilación también evitaría la respuesta inmune innata de la trituración del ARNv. Koonin y Moss (2010), interpretaron un mecanismo de limitación dado como algo común a los Mononegavirales, una orden viral que incluye sarampión, paperas y ébolavirus. Es una gran afirmación, pero independientemente de la poli-A y la limitación, simplemente imitan el ARNm del huésped que usan muchos virus. Poly-A y la limitación per se no son realmente interesantes.

Evolución y SARS Un examen más detallado de la evolución de 2019-nCov y su epidemiología en la relación con el SARS se puede encontrar aquí

Conclusión La cuestión de la bioinformática es el tamaño del genoma extraño; no, su estándar para un coronavirus, es el poli-A extraño; no, es genérico entre muchos virus, ya que es el límite. ¿Es la longitud de la poli-A excesiva (33 As), parece extraño, pero un genetista / bioinformático humano debe responder que ... entonces, está (potencialmente) relacionado con su epidemiología / síntomas clínicos?

No creo que 33 poli-A estén relacionados con algo bioinformáticamente interesante. Esto se debe a que probablemente variará drásticamente entre genomas (no simplemente cepas epidémicas o no epidémicas). No conozco el mecanismo de la poliadenilación, pero creo que el deslizamiento es una posible mutación que da como resultado grandes variaciones entre los genomas individuales, en particular para el poli-A, que es conocido por el deslizamiento.

Entonces, en última instancia, ¿podría el poli-A estar relacionado con la capacidad del nuevo coronavirus para infectar / transmitir y, por lo tanto, podríamos explorar eso bioinformáticamente? Personalmente, creo que las mutaciones de deslizamiento evitarían la aparición de un linaje clonal, es decir, que el tamaño del poli-As no es estable entre genomas, pero eso supondría un mecanismo de poliadenilación dado. Por lo tanto, como cuestión de bioinformática, no la seguiría, porque no creo que haya una justificación biológica suficiente. Estoy de acuerdo en que se deben cuestionar las cosas raras y esa parte del genoma salta ... pero dudo que vaya a alguna parte.

Deslizamiento La definición de una mutación de deslizamiento es aquí, pero básicamente significa que este genoma tiene 33 poli-As, sin embargo, otro aislado de la misma epidemia podría decir que tiene 30 poli-As (solo un ejemplo), otro podría tener 25 poli-As y así sucesivamente.

Solo mis dos centavos

¿Alguien puede darme algunos consejos sobre cómo entender ese árbol de relaciones? Parece que el virus actual se separó de un virus de murciélago. Y que el mismo virus ancestral también es ancestral de varios otros virus tanto en humanos como en murciélagos. ¿Es eso correcto?
@puppetsock esta es una pregunta separada y la regla de BioSE es una pregunta por publicación, de lo contrario, será moderada. Si publica la pregunta, le proporcionaré una respuesta detallada, con detalles adicionales sobre el receptor del SARS compartido.
#3
+19
Zoë Sparks
2020-01-27 15:37:05 UTC
view on stackexchange narkive permalink

Algunas de las otras respuestas aquí parecen bastante buenas; al mismo tiempo, creo que la respuesta principal a la pregunta del OP es quizás un poco difícil de sacar de ellos, por lo que me gustaría tratar de expresarlo de manera más clara. Vale la pena señalar que una respuesta verdaderamente completa a esta pregunta parece ir más allá de la investigación actual, pero cualquier tipo de "¿Por qué?" es inevitablemente un tipo de pregunta difícil o incluso imposible de responder completamente en biología. Sin embargo, tenemos algunas ideas al respecto.

El ARNm se usa como plantilla para la síntesis de proteínas dentro de una célula. Un solo ARNm se usa repetidamente, pero finalmente se "agota" y se desarma. En eucariotas, las colas de poli (A) casi siempre se encuentran en los ARNm producidos en el núcleo. La cola de poli (A) se acorta en última instancia durante el proceso de transcripción, y este acortamiento contribuye a la degradación del ARNm. (Consulte aquí para obtener más información).

Los coronavirus también tienen una cola poli (A), similar al ARNm de eucariotas. Las funciones mecánicas precisas de esta cola poli (A) y los medios de su síntesis son objetos de investigación en curso, pero la investigación ha demostrado que su presencia aumenta en gran medida el grado en que la célula huésped replica el ARN del coronavirus. La investigación también ha demostrado que las colas más largas aumentan la replicación en comparación con las colas más cortas. Es muy probable que la presencia de la cola ayude a reclutar la maquinaria de síntesis de proteínas de la célula y permita que el ARN dure más tiempo dentro de la célula huésped, tal como lo hace en el propio ARNm de la célula.

Curiosamente, el patrón en el que la longitud de la cola poli (A) del Coronavirus se regula durante la infección, en la que comienza más corta, se alarga y luego se vuelve mucho más corta, se asemeja a la regulación de la longitud de la cola poli (A) del ARNm durante la embriogénesis eucariota, sugiriendo paralelismos (vea el artículo en el enlace "colas más largas" para más información sobre esto también). La longitud de la cola de poli (A) más larga está estrechamente relacionada con una mayor eficiencia de traducción en ese contexto.

Ha habido cierta especulación en los comentarios sobre si la cola poli (A) del Coronavirus se parece o no a un trineo NOP en la programación de computadoras. Creo que el parecido es principalmente una coincidencia. Los trineos NOP se utilizan en exploits porque un procesador, al encontrar un NOP, pasa a la siguiente instrucción sin realizar ninguna otra acción. Una cadena larga de NOP, si el procesador la ingresa en cualquier punto dentro de ella, lo llevará a las instrucciones en la "parte inferior", después de los NOP. Esto es ventajoso de usar si no puede hacer que el procesador vaya exactamente a donde quiere pero sabe que terminará en algún lugar cercano, porque aumenta sus posibilidades de ejecutar su carga útil.

Es inusual ver un largo trineo NOP en código legítimo, hasta el punto de que las personas que los escriben normalmente tienen que disfrazar su función para evitar la detección automática. (ver pág. 183 aquí) En contraste, una cola de poli (A) se encuentra casi universalmente en el ARNm de eucariotas nucleares (y en algunos ARNm de casi todos los organismos hasta cierta capacidad, incluso las mitocondrias). Además, las funciones de la cola de poli (A) son lo suficientemente complejas como para seguir siendo objeto de investigación en curso décadas después de su descubrimiento inicial, mientras que un trineo NOP hace algo muy mecánico. Dado que el entorno dentro de una celda es tan diferente del entorno de un procesador que interactúa con la memoria, creo que es difícil hacer comparaciones tan granulares como para tratar con un conjunto específico de instrucciones de la máquina, al menos en este tipo de contexto: una El procesador es un tipo de máquina muy sencillo en comparación con una celda.

Hola Zoe, dijiste "el patrón en el que la longitud de la cola poli (A) del Coronavirus se regula durante la infección, en el que comienza más corta, se alarga y luego se acorta mucho ...". La analogía que usó fue el desarrollo de Drosophila desde el huevo hasta la maduración del ovocito. Idea interesante. ¿Podría citar la variación de poli-A para el coronavirus, por favor? El contexto no está claro si está dentro de un ciclo de vida dentro de una célula, dentro de una infección (paciente) o entre pacientes (transmisión). Sospecho que es una observación in vitro y representa la infección de una línea celular establecida.
Está en [este documento] (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3726627/). Específicamente: "En este estudio informamos que la longitud de la cola del poli (A) terminal 3 'del coronavirus en el ARN viral total, ARNsgm7 y ARN DI es relativamente corta (~ 26-45 nt) en las células infectadas a 0-2 hpi, aumenta hasta la longitud máxima (~ 65 nt) a ~ 6-10 hpi, y disminuye gradualmente de tamaño (~ 30-45 nt) después de ~ 10 h de infección ". También trazan la analogía con el desarrollo embrionario en su resumen. Tiene razón sobre el contexto: es in vitro utilizando células de adenocarcinoma humano confluentes (HRT-18).
Gracias a que es una serie de tiempo in vitro durante ~ 5 días, donde la cola de poli-A alcanza un pico de tamaño bastante temprano en la serie de tiempo, aunque la desintegración en el tamaño de poli-A a partir de entonces no es, en mi opinión, un gran análisis de su Northern blot y sería han sido mejor analizados por un científico de datos. El mensaje clave es claro que la longitud de la cola poli-A es dinámica para Cov para el modelo in vitro y, por lo tanto, posiblemente durante el curso de una infección de un solo paciente.
@ZoëSparks, me interesan sus comentarios sobre [este comentario] (https://bioinformatics.stackexchange.com/questions/11227/why-does-the-wuhan-coronavirus-genome-end-in-aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa # comment15245_11229), específicamente '¿Es posible que esta cola de A, como se describe aquí, en realidad no sea una "cola" (final de datos, última pieza traducida, etc.), sino una "cabeza" en su lugar?'. Interpretemos "cabeza" como "anterior, causalidad", ya que la biología molecular no tiene "arriba" o "abajo".
@daveloyall Bueno, en este caso, hay una parte superior e inferior en el sentido de dónde comienza y termina la traducción en el ARNm; comienza más allá del límite de 5 'y termina antes de la cola de poli (A), de ahí los términos (ver [este diagrama] (https://www.ncbi.nlm.nih.gov/books/NBK6413/figure/A19517/? report = objectonly) para una buena ilustración). En lo que respecta a la "captura o detección" de la cola para comenzar la síntesis, es parte de lo que hace que se absorba el ARNm, pero no es el único factor: la tapa también juega un papel importante, por ejemplo (ver [aquí] (https://www.ncbi.nlm.nih.gov/books/NBK6413/#_A19518_) para obtener más información).
@daveloyall Como nota al margen, la cola poli (A) solo promueve el reclutamiento en eucariotas; en procariotas, así como en orgánulos eucariotas como mitocondrias y cloroplastos, la presencia de una cola de poli (A) promueve la degradación del ARNm (ver [aquí] (https://www.ncbi.nlm.nih.gov/books/NBK6253/ # _A18929_) por ejemplo).
#4
+13
merv
2020-01-25 08:09:16 UTC
view on stackexchange narkive permalink

No es un experto, pero algunas búsquedas de virus de ARN de cadena positiva eucariotas parecen mostrar que la poliadenilación no es infrecuente. Por ejemplo, Steil, et al., 2010 .



Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 4.0 bajo la que se distribuye.
Loading...