Pregunta:
¿Cómo puedo extraer nombres de genes para una vía metabólica de KEGG?
becko
2017-09-24 16:14:22 UTC
view on stackexchange narkive permalink

Nota: esta pregunta también se ha hecho en Biostars

Necesito obtener la lista de nombres de genes implicados en la glucólisis (para poner un ejemplo). No manualmente, necesito hacer esto en un script. Idealmente con Python. Creo que KEGG es la base de datos adecuada para hacer esto, pero cualquier otra sugerencia (gratuita) sería suficiente.

¿Cómo puedo hacerlo?

Que usted sepa, existen otras vías metabólicas, como metaCyc, reactome, ...
Pude ver que esta pregunta se ha vuelto a publicar en Biostars. Aquí está la solución, [https://www.biostars.org/p/274321/#274326](https://www.biostars.org/p/274321/#274326)
Tres respuestas:
terdon
2017-09-24 17:39:49 UTC
view on stackexchange narkive permalink

Creé este pequeño script usando la API de KEGG:

  #! / usr / bin / env python3import urllib.requestimport reimport syspathway = 'hsa00010' # glycolysisurl = "http://rest.kegg.jp/get/" + pathwaywith urllib.request.urlopen (url) as f: lines = f.read (). decode (' utf-8 '). splitlines () want = 0 for line in lines: fields = line.split () ## La lista de genes comienza aquí si fields [0] ==' GENE ': want = 1 ## La línea con GENE es diferente print (fields [2] .rstrip (';')) ## Llegamos a la siguiente sección del archivo elif want == 1 y re.match ('^ \ S', line): sys.exit (); ## Todavía estamos en la lista de genes si queremos == 1 y len (campos) >1: print (fields [1] .rstrip (';'))  
Pierre
2017-09-24 19:20:25 UTC
view on stackexchange narkive permalink

utilizando la API REST de togows: se puede obtener una estructura json de los genes asociados a una vía kegg. por ejemplo: http://togows.org/entry/kegg-pathway/hsa00010/genes.json

  [{"3101": "HK3; hexokinase 3 [ KO: K00844] [EC: 2.7.1.1] "," 3098 ":" HK1; hexoquinasa 1 [KO: K00844] [EC: 2.7.1.1] "," 3099 ":" HK2; hexoquinasa 2 [KO: K00844] [EC: 2.7.1.1] "," 80201 ":" HKDC1; dominio de hexocinasa que contiene 1 [KO: K00844] [EC: 2.7.1.1] "," 2645 ":" GCK; glucoquinasa [KO: K12407] [EC: 2.7.1.2] "," 2821 ":" GPI; glucosa-6-fosfato isomerasa [KO: K01810] [EC: 5.3.1.9] "," 5213 ":" PFKM; fosfofructoquinasa, músculo [KO: K00850] [EC : 2.7.1.11] "," 5214 ":" PFKP; fosfofructoquinasa, plaquetas [KO: K00850] [CE: 2.7.1.11] "," 5211 ":" PFKL; fosfofructoquinasa, tipo de hígado [KO: K00850] [CE: 2.7.1.11] "," 2203 ":" FBP1; fructosa-bisfosfatasa 1 [KO: K03841] [CE: 3.1.3.11] "," 8789 ":" FBP2; fructosa-bisfosfatasa 2 [KO: K03841] [CE: 3.1.3.11] "," 230 ":" ALDOC; aldolasa, fructosa-bisfosfato C [KO: K01623] [CE: 4.1.2.13] "," 226 ":" ALDOA; aldolasa, fructosa-bisfosfato A [KO: K01623 ] [CE: 4.1.2.13] ", "229": "ALDOB; aldolasa, fructosa-bisfosfato B [KO: K01623] [EC: 4.1.2.13] "," 7167 ":" TPI1; triosafosfato isomerasa 1 [KO: K01803] [EC: 5.3.1.1] "," 2597 ":" GAPDH; gliceraldehído-3-fosfato deshidrogenasa [KO: K00134] [EC: 1.2.1.12] "," 26330 ":" GAPDHS; gliceraldehído-3-fosfato deshidrogenasa, espermatogénica [KO: K10705] [EC: 1.2.1.12] "," 5232 ":" PGK2; fosfoglicerato quinasa 2 [KO: K00927] [EC: 2.7.2.3] "," 5230 ":" PGK1; fosfoglicerato quinasa 1 [KO: K00927] [EC: 2.7.2.3] "," 5223 ":" PGAM1; fosfoglicerato mutasa 1 [KO: K01834] [EC: 5.4.2.11] "," 5224 ":" PGAM2; fosfoglicerato mutasa 2 [KO: K01834] [EC: 5.4.2.11] "," 441531 ":" PGAM4; miembro de la familia de fosfoglicerato mutasa 4 [KO: K01834] [EC: 5.4.2.11] "," 2027 ":" ENO3; enolasa 3 [KO: K01689] [CE: 4.2.1.11] "," 2026 ":" ENO2; enolasa 2 [KO: K01689] [EC: 4.2.1.11] ",
"2023": "ENO1; enolasa 1 [KO: K01689] [EC: 4.2.1.11]", "5315": "PKM; piruvato quinasa, músculo [KO: K00873] [EC: 2.7.1.40]", "5313 ":" PKLR; piruvato quinasa, hígado y glóbulos rojos [KO: K12406] [CE: 2.7.1.40] "," 5161 ":" PDHA2; piruvato deshidrogenasa alfa 2 [KO: K00161] [CE: 1.2.4.1] ", "5160": "PDHA1; piruvato deshidrogenasa alfa 1 [KO: K00161] [EC: 1.2.4.1]", "5162": "PDHB; piruvato deshidrogenasa (lipoamida) beta [KO: K00162] [EC: 1.2.4.1] "," 1737 ":" DLAT; dihidrolipoamida S-acetiltransferasa [KO: K00627] [CE: 2.3.1.12] "," 1738 ":" DLD; dihidrolipoamida deshidrogenasa [KO: K00382] [CE: 1.8.1.4] ", "160287": "LDHAL6A; lactato deshidrogenasa A como 6A [KO: K00016] [EC: 1.1.1.27]", "92483": "LDHAL6B; lactato deshidrogenasa A como 6B [KO: K00016] [EC: 1.1.1.27] "," 3939 ":" LDHA; lactato deshidrogenasa A [KO: K00016] [EC: 1.1.1.27] "," 3945 ":" LDHB; lactato deshidrogenasa B [KO: K00016] [EC: 1.1.1.27] ", "3948": "LDHC; lactato deshidrogenasa C [KO: K00016] [EC: 1.1.1.27]", "124": "ADH1A; alcohol deh ydrogenasa 1A (clase I), polipéptido alfa [KO: K13951] [EC: 1.1.1.1] "," 125 ":" ADH1B; alcohol deshidrogenasa 1B (clase I), polipéptido beta [KO: K13951] [EC: 1.1.1.1] "," 126 ":" ADH1C; alcohol deshidrogenasa 1C (clase I), polipéptido gamma [KO: K13951] [EC: 1.1.1.1] "," 131 ":" ADH7; alcohol deshidrogenasa 7 (clase IV), polipéptido mu o sigma [KO: K13951] [EC: 1.1.1.1] "," 127 ":" ADH4; alcohol deshidrogenasa 4 (clase II), polipéptido pi [KO: K13980] [EC: 1.1.1.1] "," 128 ":" ADH5; alcohol deshidrogenasa 5 (clase III), polipéptido chi [KO: K00121] [EC: 1.1.1.1 1.1.1.284] "," 130 ":" ADH6; alcohol deshidrogenasa 6 (clase V) [KO: K13952] [EC: 1.1.1.1] "," 10327 ":" AKR1A1; 1 miembro de la familia de aldo-ceto reductasa A1 [KO: K00002] [EC: 1.1.1.2] "," 217 ":" ALDH2; familia de la aldehído deshidrogenasa 2 (mitocondrial) [KO: K00128] [EC: 1.2.1.3] "," 224 ":" ALDH3A2; miembro de la familia de la aldehído deshidrogenasa 3 A2 [KO: K00128] [EC: 1.2.1.3] ",
"219": "ALDH1B1; miembro de la familia de aldehído deshidrogenasa 1 B1 [KO: K00128] [CE: 1.2.1.3]", "501": "ALDH7A1; miembro de la familia de aldehído deshidrogenasa 7 A1 [KO: K14085] [CE: 1.2. 1.3 1.2.1.8 1.2.1.31] "," 223 ":" ALDH9A1; aldehído deshidrogenasa 9 miembro de la familia A1 [KO: K00149] [EC: 1.2.1.3 1.2.1.47] "," 221 ":" ALDH3B1; aldehído deshidrogenasa 3 miembro de la familia B1 [KO: K00129] [EC: 1.2.1.5] "," 222 ":" ALDH3B2; miembro de la familia de aldehído deshidrogenasa 3 B2 [KO: K00129] [EC: 1.2.1.5] "," 220 ":" ALDH1A3 ; miembro de la familia de la aldehído deshidrogenasa 1 A3 [KO: K00129] [EC: 1.2.1.5] "," 218 ":" ALDH3A1; miembro de la familia de la aldehído deshidrogenasa 3 A1 [KO: K00129] [EC: 1.2.1.5] "," 84532 ":" ACSS1; miembro 1 de la familia de cadena corta de acil-CoA sintetasa [KO: K01895] [EC: 6.2.1.1] "," 55902 ":" ACSS2; miembro 2 de la familia de cadena corta de acil-CoA sintetasa [KO: K01895] [ EC: 6.2.1.1] "," 130589 ":" GALM; galactosa mutarotasa [KO: K01785] [EC: 5.1.3.3] "," 5236 ":" PGM1; fosfoglucomutasa 1 [KO: K01835] [EC: 5.4. 2.2] "," 55276 ":" PGM2; phosphogluc omutase 2 [KO: K15779] [EC: 5.4.2.7 5.4.2.2] "," 2538 ":" G6PC; subunidad catalítica de glucosa-6-fosfatasa [KO: K01084] [EC: 3.1.3.9] "," 57818 ":" G6PC2; subunidad catalítica de glucosa-6-fosfatasa 2 [KO: K01084] [EC: 3.1.3.9] "," 92579 ":" G6PC3; subunidad catalítica de glucosa-6-fosfatasa 3 [KO: K01084] [EC: 3.1.3.9] "," 83440 ":" ADPGK; Glucoquinasa dependiente de ADP [KO: K08074] [EC: 2.7.1.147] "," 669 ":" BPGM; bisfosfoglicerato mutasa [KO: K01837] [EC: 5.4.2.11 5.4.2.4] "," 9562 ":" MINPP1; inositol-polifosfato fosfatasa múltiple 1 [KO: K03103] [EC: 3.1.3.80 3.1.3.62] "," 5105 ":" PCK1; fosfoenolpiruvato carboxiquinasa 1 [KO: K01596] [EC: 4.1.1.32] "," 5106 ":" PCK2; fosfoenolpiruvato carboxiquinasa 2, mitocondrial [KO: K01596] [EC: 4.1.1.32] "}]  
gringer
2018-01-12 08:29:44 UTC
view on stackexchange narkive permalink

Respuestas de Biostars:

GeneSCF 'El módulo' prepare_database 'extraerá todas las rutas con los genes correspondientes como formato de tabla simple en un archivo de texto sin formato. Marque 'Proceso de dos pasos' (subtítulo) en el enlace provisto (el primer paso hará su trabajo).


Puede usar KEGG REST API para extraer genes nombres de la vía. La biblioteca de solicitudes de Python se puede utilizar para realizar llamadas REST a la API REST de KEGG y consultar información. Siga este tutorial si es un novato en la programación Python y los servicios web REST.



Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...