下载百度网盘数据至服务器(bypy + aria2)
生物信息学研究通常必要处理大量的数据集,如基因组序列、RNA-Seq 数据、蛋白质布局等,而这些数据往往被测序公司放置在百度网盘中。
使用 bypy 可以方便地从百度网盘获取这些数据,并将其下载到服务器进行进一步分析,确保数据管理的高效性和组织性。aria2 作为一个高效的下载工具,支持多线程下载,可以显著提高大文件的下载速度,同时如果网络制止或出现其他问题,aria2 支持断点续传,确保了下载的完整性和可靠性,对于长时间的下载使命可以制止重复下载已完成的部门。
联合使用 bypy 和 aria2 下载百度网盘数据至服务器极大地提拔了数据获取的服从。
bypy + aria2
1. 安装
- conda create -n aria2
- conda activate aria2
- # conda install -c conda-forge pip
- conda install -c conda-forge aria2
- pip install bypy
复制代码 2. 获取自身百度网盘的授权码
输入 bypy info 会提示必要访问网址获取 API key(必要用百度网盘账号登录),然后复制或输入到命令行中即可。
- bypy info
- # Please visit:
- # https://openapi.baidu.com/oauth/2.0/authorize?scope=basic+netdisk&redirect_uri=oob&response_type=code&client_id=q8WE4EpCsau1oS0MplgMKNBn
- # And authorize this app
- # Paste the Authorization Code here within 10 minutes.
- # Press [Enter] when you are done
复制代码 输入 Key 之后回车确认,如果提示 Successfully authorized 而且列出空间使用情况即乐成。
3. 底子使用
bypy 命令布局很简朴,就是 bypy [操作],操作除了上面的 info 之外,常用的还有 list、download、upload。
- # 查看文件
- bypy list
- # 上传文件
- bypy upload [localpath] [remotepath]
- # 下载文件
- bypy downfile <remotefile> [localpath]
- # 下载文件夹
- bypy downdir [remotedir] [localdir]
- # 取消授权
- bypy -c
复制代码 注意:下载转存的文件必要放置在 我的应用数据 下的 bypy 文件夹中。
4. Aria2 加速
默认情况下 bypy 没有调用 aria2 下载,此时下载速度不能最大化,因此必要先配置 aria2。bypy 默认配置的 aria2 使用 4 个毗连数下载,可以修改成最大的 16。此处可以使用参数 --downloader aria2 让 bypy 调用 aria2 下载,--downloader-arguments 来设置 aria2 的参数,默认为 '-c -k10M -x4 -s4 --file-allocation=none'。
- bypy --downloader aria2 download <remotefile> [localpath]
- bypy --downloader aria2 download [remotedir] [localdir]
- # 修改参数使速度最大化
- bypy --downloader aria2 --downloader-arguments='-c -k10M -x16 -s16 --file-allocation=none' download <remotefile> [localpath]
复制代码 参考
- 『 百度网盘下载之bypy』 有槽必吐 - 不吐槽,毋宁死 (tsukkomi.org):https://tsukkomi.org/post/download-baidu-pan-with-bypy
- Centos系统下bypy+aria2下载百度网盘实现百度云转存方案 - 天下无鱼-资源博客 (shikey.com):https://shikey.com/2020/07/10/baidu-to-google-drive-onedrive.html
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |