麻花痒 发表于 2024-6-21 13:07:54

blast安装及简单使用

目录
一、安装blast
1.Ubuntu情况
2.conda情况
二、比对序列
1.创建数据库
2.举行序列比对 
三、总结
BLAST(Basic Local Alignment Search Tool)是一种常用的生物信息学工具,用于比对核酸或蛋白质序列,以寻找相似性并推断两个序列之间的进化关系。
BLAST 可以在数据库中搜刮序列,查找与查询序列最相似的序列,从而确定两个序列的相似性和进化关系。它通过比对两个序列的碱基或氨基酸组成,寻找相同的区域,并盘算匹配度和相似性得分。
一、安装blast

1.Ubuntu情况

   # 下载blast
wget https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.9.0/ncbi-blast-2.9.0+-x64-linux.tar.gz
# 解压blast压缩包
tar -xzvf ncbi-blast-2.9.0+-x64-linux.tar.gz 
# 测试
./bin/blastp -h
https://img-blog.csdnimg.cn/direct/46a5a832cccd460d80bb0c1dd61f1e9e.png
这里就代表安装成功了,但是执行命令就有点贫苦必要用全路径的blastp运行,如果想直接用blastp还必要安装另一个插件:
   apt install ncbi-blast+
这样安装成功之后才可以使用blastp命令
2.conda情况

如果你的情况是conda的,那安装blast就很简单了
   conda install blast 
一行命令搞定! 
二、比对序列

BLAST(Basic Local Alignment Search Tool)可以用于比对序列的数据库有许多,其中一些常用的数据库包罗:

[*] NCBI(National Center for Biotechnology Information)提供的数据库,如:

[*]GenBank:包含已发布的核酸序列数据。
[*]RefSeq:包含参考序列数据,包罗基因组、mRNA 和蛋白质序列。
[*]nr(Non-Redundant Protein Sequence Database):非冗余蛋白质序列数据库。

[*] UniProt:包含了各种生物学和生物化学信息的综合性蛋白质数据库。
[*] Ensembl:包含了多种物种的基因组数据和注释信息。
[*] PDB(Protein Data Bank):包含了已知蛋白质的三维结构数据。
[*] Swiss-Prot:是 UniProt 数据库中的一个子数据库,包含手工注释的高质量蛋白质序列数据。
除了上述数据库之外,还有许多其他公共和专业数据库可供 BLAST 使用,具体选择数据库取决于您的研究目的和必要比对的序列类型。在使用 BLAST 举行序列比对时,选择合适的数据库可以进步比对结果的正确性和可靠性。
1.创建数据库

   # 运行这个命令创建数据库
makeblastdb -in 数据库.fa -dbtype prot
2.举行序列比对 

   blastp -query 自己的序列文件 -db 数据库.fa -out 输出的序列比对文件名.blast.out 
https://img-blog.csdnimg.cn/direct/5f26e38dc8fa4c9c87939d3ceeeba81f.png
三、总结

BLAST 常用于以下领域:

[*] 生物学研究:BLAST 可以资助生物学家比对 DNA 或蛋白质序列,以研究生物进化和系统发育等问题。
[*] 基因组学研究:BLAST 可以资助研究人员在基因组数据库中搜刮和比对基因序列,以研究基因功能和基因组结构等问题。
[*] 药物研究:BLAST 可以资助药物研究人员比对蛋白质序列,以寻找靶标蛋白并设计药物分子。
总之,BLAST 是一个非常有用的生物信息学工具,可以资助生物学家、基因组学研究人员和药物研究人员等快速比对序列并举行分析。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: blast安装及简单使用