【生物信息】CARD数据库预测耐药基因

打印 上一主题 下一主题

主题 561|帖子 561|积分 1683

1 CARD数据库先容

官网:The Comprehensive Antibiotic Resistance Database (mcmaster.ca)
   综合抗生素耐药性数据库(“CARD”)提供与抗菌素耐药性分子底子相关的数据、模型和算法。CARD提供通过抗生素耐药性本体(“ARO”)组织的精选参考序列和SNP。这些模型可以在线下载或用于使用抗性基因标识符(“RGI”)分析基因组序列,也可以作为独立工具使用。
  CARD: Expert-curated collection of molecular sequences and mutations underlying AMR, organized by the Antibiotic Resistance Ontology. 
  RGI: Prediction of complete resistome from genomic and metagenomic data. 
  Resistomes & Variants: Pre-compiled resistomes, allelic variants, and AMR gene prevalence data for priority pathogens. 
  Annotation Services: Have the CARD team annotate your genomic data. 
  Hosting Services: Host your own genome sequence collections on the CARD website, private & password-secure, with annotation constantly updated by RGI. 
  Bait Capture: Hybridization bait enrichment of AMR alleles for your metagenomic sequencing projects.
  2 数据预备

2.1 获取基因组数据

示例数据:CP002956.1,使用diamond进行比对的数据必要为编码卵白质的氨基酸序列,这里下载的是一株已经完成开放阅读框预测的鼠疫菌氨基酸序列。

2.2 获取抗生素抗性基因数据库

下载CARD Data

解压后文件夹包含以下文件:

选择protein_fasta_protein_homolog_model.fasta作为ARGs数据库。
关于不同模型,官网解释如下:
   
The Comprehensive Antibiotic Resistance Database uses bioinformatic models for the detection of molecular determinants. For example, a Protein Homolog Model (PHM) can contain sequences of antimicrobial resistance genes that do not include mutation as a determinant of resistance, whereas a Protein Variant Model (PVM) will contain reference wild-type sequences used for mapping mutations conferring antimicrobial resistance. The Comprehensive Antibiotic Resistance Database additionally uses meta-models for the detection of combinations of individual molecular determinants. For example, efflux pump systems consist of multiple subunits and regulators that are detected together using the the Efflux Pump System Meta-Model (EPS). In CARD, detection models are applied to the detection of antimicrobial resistance elements, but they are broadly applicable to other systems as well, with modifications.
  3 ARGs预测

   软件版本:
  Linux 3.10.0-1160.el7.x86_64 #1 SMP Mon Oct 19 16:18:59 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux
  conda 23.10.0
  diamond version 2.1.8
  rgi main version 6.0.3
  我们可以选择使用传统的比对工具DIAMOND或者CARD提供的专门用于ARGs预测的工具rgi来进行ARGs的预测。
3.1 使用DIAMOND

  1. diamond makedb --in protein_fasta_protein_homolog_model.fasta --db homolog
  2. diamond blastp --db homolog.dmnd --query sequence.txt --evalue 1e-5 --query-cover 90 --subject-cover 90 --range-cover 90 --id 60 --out args.txt
复制代码
部分结果:

ARO:Antibiotic Resistance Ontology 可以通过ARO编号在aro_index.tsv中找到关于该条抗性基因的详细信息,如耐药种类、耐药机制等。
3.2 使用rgi

rgi:https://github.com/arpcard/rgi?tab=readme-ov-file
   Resistance Gene Identifier (RGI). Software to predict resistomes from protein or nucleotide data, including metagenomics data, based on homology and SNP models.
  RGI提供了3种预测标准,即Perfect、Strict和Loose;通过选择同源比对的判定标准,可以得到不同可信度和数量的潜伏耐药基因,有助于发现新的耐药基因。
  1. #### 安装rgi
  2. conda create --name rgi rgi
  3. conda activate rgi
  4. # 载入本地card数据库
  5. rgi load --card_json card.json --local
  6. # 进行预测
  7. rgi main --input_sequence sequence.fasta --output_file rgiargs --local --clean --include_loose -t protein
复制代码
部分结果:

rgi输出的预测结果比力详细,loose模式下,会同时输出含有strict和loose的结果,可以根据identity的大小作后续的筛选。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

去皮卡多

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表