Quiero descargar todos los archivos SRA del siguiente proyecto. ¿Existe algún método para descargar todos los archivos SRA al mismo tiempo?
Quiero descargar todos los archivos SRA del siguiente proyecto. ¿Existe algún método para descargar todos los archivos SRA al mismo tiempo?
Un vistazo rápido a su enlace me dice que los números SRR van desde SRR837819 hasta SRR837856. Puede usar fastq-dump del sratoolkit y hacer un bucle for alrededor en bash.
Algo como esto debería funcionar:
for ((i = 19; i < = 56; i ++)) do fastq-dump --accession SRR8378 $ idone
Después de leer la respuesta de Devon Ryan, me doy cuenta de que solicitó Archivos SRA en lugar de fastq. Esto también se puede hacer con la captación previa del sratoolkit:
for ((i = 19; i < = 56; i ++)) do prefetch SRR8378 $ idone
Suponiendo que en última instancia solo desea los archivos fastq y conoce los números de SRR (ejecución), los descargaría desde aquí: ftp://ftp.sra.ebi.ac.uk/vol1/fastq/
En cuanto a la descarga de varios archivos, acabo de utilizar varios comandos wget. No conozco una forma de descargar todos los archivos juntos en una carpeta comprimida o algo así: /
Le sugiero que siga los consejos de la respuesta de Eric A Brenner y simplemente descargue los archivos fastq. Sin embargo, si realmente desea utilizar los archivos SRA por algún motivo, tenga en cuenta que puede utilizar paralelo-fastq-dump para acelerar las cosas. Siga sus consejos sobre el uso de prefetch
.
Debería combinar eso con la respuesta de b.nota (es decir, poner los comandos en un bucle for
).
Pude encontrar una solución para esto usando Entrez Direct y el kit de herramientas SRA :) Si tiene el número de proyecto o el número de proyecto SRA, el suyo sería SRP022054 en En este caso para las 36 SRA, puede utilizar esearch para realizar una consulta como esta y canalizarla al kit de herramientas de la SRA con esta línea:
esearch -db sra -query SRP022054 | efetch --format runinfo | cortar -d ',' -f 1 | grep SRR | cabeza -5 | xargs fastq-dump --skip-technical --readids --read-filter pass --dumpbase --split-3
Puede descargar un proyecto completo usando pysradb:
pysradb download -p SRP022054
Conserva el mismo esquema como SRA.