blast软件安装
从NCBI下载安装包https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/。下载2.16.0 linux版本,下载并解压,解压之后BLAST就安装好了。用户需要设置环境变量,目的是为了告诉体系在哪里可以找到安装好的BLAST软件。
- wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.16.0+-x64-linux.tar.gz
- wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.16.0+-x64-linux.tar.gz.md5
- md5sum -c ncbi-blast-2.16.0+-x64-linux.tar.gz.md5
- tar -zxvf ncbi-blast-2.16.0+-x64-linux.tar.gz
- #加入到环境变量
- export PATH=$PATH:$PWD/ncbi-blast-2.16.0+/bin
复制代码 nt/nr fasta下载
从NCBI(Index of /blast/db/FASTA)下载nt、nr fasta文件。
- nohup wget https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz > nt.log 2>&1 &
- [2] 1144458
- nohup wget https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz > nr.log 2>&1 &
- [3] 1145214
- wget https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz.md5
- wget https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz.md5
- md5sum -c nt.gz.md5
- md5sum -c nr.gz.md5
- tar -xzvf nr.gz
- tar -xzvf nt.gz
- mkdir nr_db
- mkdir nt_db
- makeblastdb -in nr -dbtype prot -title make_nr -parse_seqids -out ./nr_db/nr -logfile make_nr.log
- makeblastdb -in nt -dbtype nucl -title make_nt -parse_seqids -out ./nt_db/nt -logfile make_nt.log
复制代码 大概使用NCBI处理好的db。
wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/db/nt*
wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/db/nr*
作者:像鸟一样飞过你的高山
链接:https://www.jianshu.com/p/471a4fbcdd48
来源:简书
著作权归作者所有。商业转载请接洽作者得到授权,非商业转载请注明出处。
序列比对
- blastp:卵白序列与卵白库作比对,直接比对卵白序列的同源性。
- blastx:核酸序列与卵白库作比对,将核酸序列先翻译成卵白序列,再将其与卵白库作比对。
-blastn:核酸序列与核酸库的比对,直接比对核酸序列的同源性。
- tblastn:卵白序列对核算库的比对,现将核酸库翻译成卵白库,再将卵白序列与翻译后的卵白库进行比对。
- tblastx:核酸与核酸数据库在卵白质水平比较
如果是fastq先转为fasta序列格式在进行比对,比对结果如下图1所示。将相同序列复制到NCBI网站进行比对,如下图2,两种结果最前面的比对条目基本一致。
- awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' test.fastq > test.fasta
- blastn -query test.fasta -out test.result -db ./nt_db/nt
复制代码
图1 本地blast比对结果
图2 NCBI blast比对结果
使用NCBI网站下载的db进行比对。
- wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/db/nr*
- for i in `ls nt_db_NCBI/*gz`do;tar -zxvf $i;done
- ## 输出一条最优比对结果
- blastn -query test1.fa -out test1.align -db ./nt_db_NCBI/nt -outfmt 6 -subject_besthit -num_threads 4
复制代码 自建索引文件
创建索引需要输入为序列的fasta文件,可以是卵白大概核酸,输出索引带前缀名称,最终生成比对索引数据库。
- in 输入文件(test.fa)
- dbtype 选择类型,卵白大概核酸(prot、nucl)
- out 输出索引文件
- makeblastdb -in test.fa -dbtype nucl -out ./test
复制代码
作者:像鸟一样飞过你的高山
链接:https://www.jianshu.com/p/471a4fbcdd48
来源:简书
著作权归作者所有。商业转载请接洽作者得到授权,非商业转载请注明出处。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |