Pregunta:
Descarga varios archivos SRA
user2300940
2017-10-17 00:23:49 UTC
view on stackexchange narkive permalink

Quiero descargar todos los archivos SRA del siguiente proyecto. ¿Existe algún método para descargar todos los archivos SRA al mismo tiempo?

Puede utilizar el paquete R / Bioconductor [SRAdb] (https://www.bioconductor.org/packages/release/bioc/html/SRAdb.html)
@JohnBlischak Esta podría ser una respuesta si se amplía explicando cómo SRAdb ayuda a responder la pregunta
Cinco respuestas:
benn
2017-10-17 12:46:11 UTC
view on stackexchange narkive permalink

Un vistazo rápido a su enlace me dice que los números SRR van desde SRR837819 hasta SRR837856. Puede usar fastq-dump del sratoolkit y hacer un bucle for alrededor en bash.

Algo como esto debería funcionar:

  for ((i = 19; i < = 56; i ++)) do fastq-dump --accession SRR8378 $ idone  

Después de leer la respuesta de Devon Ryan, me doy cuenta de que solicitó Archivos SRA en lugar de fastq. Esto también se puede hacer con la captación previa del sratoolkit:

  for ((i = 19; i < = 56; i ++)) do prefetch SRR8378 $ idone  
Eric A Brenner
2017-10-17 04:35:59 UTC
view on stackexchange narkive permalink

Suponiendo que en última instancia solo desea los archivos fastq y conoce los números de SRR (ejecución), los descargaría desde aquí: ftp://ftp.sra.ebi.ac.uk/vol1/fastq/

En cuanto a la descarga de varios archivos, acabo de utilizar varios comandos wget. No conozco una forma de descargar todos los archivos juntos en una carpeta comprimida o algo así: /

Devon Ryan
2017-10-17 13:19:28 UTC
view on stackexchange narkive permalink

Le sugiero que siga los consejos de la respuesta de Eric A Brenner y simplemente descargue los archivos fastq. Sin embargo, si realmente desea utilizar los archivos SRA por algún motivo, tenga en cuenta que puede utilizar paralelo-fastq-dump para acelerar las cosas. Siga sus consejos sobre el uso de prefetch.

Debería combinar eso con la respuesta de b.nota (es decir, poner los comandos en un bucle for ).

Kai Fung
2020-04-24 03:06:45 UTC
view on stackexchange narkive permalink

Pude encontrar una solución para esto usando Entrez Direct y el kit de herramientas SRA :) Si tiene el número de proyecto o el número de proyecto SRA, el suyo sería SRP022054 en En este caso para las 36 SRA, puede utilizar esearch para realizar una consulta como esta y canalizarla al kit de herramientas de la SRA con esta línea:

esearch -db sra -query SRP022054 | efetch --format runinfo | cortar -d ',' -f 1 | grep SRR | cabeza -5 | xargs fastq-dump --skip-technical --readids --read-filter pass --dumpbase --split-3

rightskewed
2020-04-24 08:36:29 UTC
view on stackexchange narkive permalink

Puede descargar un proyecto completo usando pysradb:

  pysradb download -p SRP022054  

Conserva el mismo esquema como SRA.



Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...