NCBI blast 数据库本地安装

打印 上一主题 下一主题

主题 993|帖子 993|积分 2979

blast软件安装

从NCBI下载安装包https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/。下载2.16.0 linux版本,下载并解压,解压之后BLAST就安装好了。用户需要设置环境变量,目的是为了告诉体系在哪里可以找到安装好的BLAST软件。
  1. wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.16.0+-x64-linux.tar.gz
  2. wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.16.0+-x64-linux.tar.gz.md5
  3. md5sum -c ncbi-blast-2.16.0+-x64-linux.tar.gz.md5
  4. tar -zxvf ncbi-blast-2.16.0+-x64-linux.tar.gz
  5. #加入到环境变量
  6. export PATH=$PATH:$PWD/ncbi-blast-2.16.0+/bin
复制代码
nt/nr fasta下载

从NCBI(Index of /blast/db/FASTA)下载nt、nr fasta文件。
  1. nohup wget https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz > nt.log 2>&1 &
  2. [2] 1144458
  3. nohup wget https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz > nr.log 2>&1 &
  4. [3] 1145214
  5. wget https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz.md5
  6. wget https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz.md5
  7. md5sum -c nt.gz.md5
  8. md5sum -c nr.gz.md5
  9. tar -xzvf nr.gz
  10. tar -xzvf nt.gz
  11. mkdir nr_db
  12. mkdir nt_db
  13. makeblastdb -in nr -dbtype prot -title make_nr -parse_seqids -out ./nr_db/nr -logfile make_nr.log
  14. makeblastdb -in nt -dbtype nucl -title make_nt -parse_seqids -out ./nt_db/nt -logfile make_nt.log
复制代码
大概使用NCBI处理好的db。
wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/db/nt*
wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/db/nr*


作者:像鸟一样飞过你的高山
链接:https://www.jianshu.com/p/471a4fbcdd48
来源:简书
著作权归作者所有。商业转载请接洽作者得到授权,非商业转载请注明出处。
序列比对



  • blastp:卵白序列与卵白库作比对,直接比对卵白序列的同源性。
  • blastx:核酸序列与卵白库作比对,将核酸序列先翻译成卵白序列,再将其与卵白库作比对。
    -blastn:核酸序列与核酸库的比对,直接比对核酸序列的同源性。
  • tblastn:卵白序列对核算库的比对,现将核酸库翻译成卵白库,再将卵白序列与翻译后的卵白库进行比对。
  • tblastx:核酸与核酸数据库在卵白质水平比较
如果是fastq先转为fasta序列格式在进行比对,比对结果如下图1所示。将相同序列复制到NCBI网站进行比对,如下图2,两种结果最前面的比对条目基本一致。

  1. awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' test.fastq > test.fasta
  2. blastn -query test.fasta -out test.result -db ./nt_db/nt
复制代码

图1 本地blast比对结果

图2 NCBI blast比对结果
使用NCBI网站下载的db进行比对。

  1. wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/db/nr*
  2. for i in `ls nt_db_NCBI/*gz`do;tar -zxvf $i;done
  3. ## 输出一条最优比对结果
  4. blastn -query test1.fa -out test1.align -db ./nt_db_NCBI/nt -outfmt 6 -subject_besthit -num_threads 4
复制代码
自建索引文件

创建索引需要输入为序列的fasta文件,可以是卵白大概核酸,输出索引带前缀名称,最终生成比对索引数据库。


  • in 输入文件(test.fa)
  • dbtype 选择类型,卵白大概核酸(prot、nucl)
  • out 输出索引文件

  1. makeblastdb -in test.fa -dbtype nucl -out ./test
复制代码


作者:像鸟一样飞过你的高山
链接:https://www.jianshu.com/p/471a4fbcdd48
来源:简书
著作权归作者所有。商业转载请接洽作者得到授权,非商业转载请注明出处。








免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

卖不甜枣

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表