ToB企服应用市场:ToB评测及商务社交产业平台

标题: 收藏！分享10个基因功能表明的数据库 [打印本页]

作者: 泉缘泉 时间: 2025-1-26 09:35
标题: 收藏！分享10个基因功能表明的数据库
不管是组卵白修饰的靶基因，还是转录组的差异基因，我们都需要通过基因表明的方式，了解基因的功能或作用。在这个过程中各种公开的数据库起着相称紧张的作用，今天就由小爱带领各人来了解下常用数据库吧~

GO数据库

该数据库由基因本体论联合会创建，将全世界所有与基因有关的研究结果进行分类汇总。对差别数据库中关于基因和基因产物的生物学术语进行标准化，对基因和卵白功能进行同一的限定和描述，算是转录组分析中表明和富集最常用的数据库了。
该数据库紧张有三个部门组成：BP（Biological Process），生物过程；MF（Molecular Function）分子功能；CC（Cellular Component），细胞组分。这三大分支下一级又分许多小层级，级别数字越大，功能描述越细致。

KEGG

KEGG是一个包含生物信息学数据库和相关工具的综合性资源，旨在资助我们明白生物系统的功能和组成。KEGG数据库包含了多种生物信息学数据，包括基因组、代谢途径、疾病和药物等信息。数据库分为三个级别，第一级分为七个大类：代谢途径（Metabolic Pathways）、遗传信息处理（Genetic Information Processing）、情况信息处理（Environmental Information Processing）、细胞过程（Cellular Processes）、有机系统（Organismal Systems）、人类疾病（Human Diseases）和药物开发（Drugs Development），富集分析结果中我们常见的**pathway属于第三级描述。
数据库还提供了一系列工具和资源，如KEGG Pathway，KEGG BRITE，KEGG Orthology等，资助我们进行生物信息学分析和研究。
常见KEGG数据库比对结果解读：善用KEGG数据库挖掘目的基因

NR全称为Non-Redundant Protein Database，是一个非冗余的卵白质数据库，由NCBI创建并维护，内容比较全面，涵盖了广泛的生物物种，包括细菌、真菌、植物、动物等。同时表明结果中会包含有物种信息，可作物种分类用。
使用Diamond软件，把目标物种的氨基酸序列，与NR数据库进行比对，把目标物种的基因和其相对应的功能表明信息结合起来，得到表明结果。该数据库可从NCBI上直接下载使用，下载地址为：ftp://ftp.ncbi.nlm.nih.gov/blast/db/fasta/nr.gz。

Pfam

Pfam数据库是一个大型的卵白质家族集合，此中每个家族都由多序列比对和隐马尔可夫模型（HMMs）来表现。卵白质通常由一个或多个功能区域组成，这些区域通常被称为结构域。差别结构域的组合产生了天然界中发现的各种卵白质。因此，确定卵白质中出现的结构域可以深入了解其功能。
该数据库的使用方式多样，例如可以分析卵白质序列以查找Pfam匹配、查看Pfam表明和比对、查看相关条目组、查看卵白质序列的结构域组织、查找 PDB 结构上的结构域，或通过关键字查询 Pfam 等。

KOG

KOG数据库（euKaryotic Orthologous Groups）是真核生物的直系同源卵白数据库，它是由NCBI创建并维护的。通过对多种真核生物的卵白质序列进行比较和分析构建而成的。该数据库可以将某个卵白序列与KOG数据库进行比对，可以推测序列的功能。构成每个KOG的卵白被假定为来自于一个祖先卵白，这些卵白可能是orthologs（来自于差别物种的由垂直家系进化而来的卵白，通常保留与原始卵白雷同的功能）或者paralogs（在一定物种中泉源于基因复制的卵白，可能进化出新的与原来有关的功能）。
在生物学研究中，KOG表明常用于功能表明、代谢途径分析、推导特定的代谢途径是否存在、进化关系研究。

EggNOG

EggNOG（evolutionary genealogy of genes: non-supervised orthologous groups）数据库是由EMBL创建并维护的直系同源卵白分组比对数据库，它是对NCBI的COG数据库的拓展。EggNOG采用基于图状结构的非监督聚类算法，构建了真核、原核、病毒等差别物种的同源卵白簇。
该数据库提供了差别分类水平卵白的直系同源分组（orthologous groups，OG），并对每个同源基因类进行了系统发育树构建、HMM模型构建、GO表明、KEGG pathway表明、SMART/FPAM结构域表明、CAZyme表明等。通过判定卵白与该数据库的比对，可以预测卵白质的功能。

EggNOG的最新版本为eggNOG 5.0，新版本不再使用物种名称缩写，而是使用更加规范的ncbi taxid来进行物种分类。下载地址：http://eggnog5.embl.de/indexof/download/eggnog_5.0/

Swissprot

Swissprot数据库是颠末表明的卵白序列数据库，由欧洲生物信息学研究所（EBI）维护。每个条目包含卵白质序列、引用文献、分类学信息和详细表明等。表明内容包括卵白质的功能、转录后修饰、特别位点、二级结构等信息，具有较高的正确性和可靠性。
Swissprot数据库中的数据颠末了人工校验，冗余度较小，是一个高质量的卵白质序列数据库。它紧张来自文献中的研究结果和颠末e-value校验过的计算分析结果，只有有质量保证的数据才会被参加该数据库。
需注意的是，该数据库文件较大，下载可能需要一些时间。下载地址为：ftp://ftp.ncbi.nlm.nih.gov/blast/db/fasta/swissprot.gz

TrEMBL

TrEMBL是UniProt（Universal Protein Resource，通用卵白质资源）数据库的一部门。
TrEMBL数据库包含了大量的卵白质序列，这些序列紧张是通过计算机预测或从核酸序列翻译而来，其表明信息相对较少。它的作用是补充Swissprot中未包含的卵白质序列，以增长卵白质数据的覆盖范围。下载地址：ftp://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_trembl.fasta.gz

String

STRING数据库是一个用于检索已知卵白和预测卵白之间相互作用的综合性数据库。它收集了多个公共数据库的信息，并整合了这些数据来生成卵白质相互作用网络。
该数据库涵盖了来自5090个物种的两千四百多万种卵白质（截至2019年，包含5090个物种、24,584,628个卵白、3,123,056,667个相互作用），其数据泉源包括基因组预测、高通量实验、共表达实验、自动化文本挖掘以及其他数据库等；不仅提供了卵白质相互作用网络的可视化，还能提供卵白质家族、途径、亚细胞定位等信息，而且具有一些分析工具，如聚类分析、GO富集分析和KEGG富集分析等，可资助使用者更好地分析网络图，找到有意义的生物学命题。

UniProt

UniProt (Universal Protein)是一个信息丰富、资源广泛的卵白质数据库。它由Swiss-Prot、TrEMBL和PIR-PSD三大数据库的数据整合而成，其数据紧张来自于基因组测序项目完成后获得的卵白质序列，包含了大量来自文献的卵白质生物学功能信息。
Uniprot的一大特征是具有强盛的搜刮功能，可以通过以下两种方式进行检索：
（1）搜刮框：在页面的上半部门有一个搜刮框，可以通过输入关键词进行搜刮。
（2）高级搜刮：点击页面上方的“Advanced”按钮，可以使用更复杂的搜刮选项，如物种、序列等。
搜刮功能详细使用步调：打开UniProt页面后在顶部搜刮栏中输入卵白质名称或编号，根据需要选择数据库和高级筛选后，点击search即可进入搜刮结果页面。这里我们以小鼠FABP卵白为例：

进入卵白详细信息界面后，可以起首看到FABP卵白的[Function]即功能先容，该板块总结了FABP卵白的基本功能和紧张到场的生物学过程。

之后是[Names&Taxonomy]即名称与分类板块，这里先容了FABP卵白的定名和泉源种属、NCBI分类编号、分离族谱、种属详细信息、卵白组学信息等。

再接下来的几个板块和卵白实验息息相关，包括[Subcellular location]亚细胞定位、[PTM/Processing]翻译后修饰、[Expression]表达情况、[Interaction]卵白相互作用等
在做WB实验时我们往往会发现一些卵白的现实检测分子量和盼望分子量有一定的差异，这时我们就可以运用[Sequence]卵白序列与翻译后修饰板块进行比对，有了这些信息我们便能轻松预测正确的WB条带位置。例如FABP卵白，Mass(Da)显示其分子量约为15kDa。还有一种可能，现实的WB条带比15kDa更大，造成这样差值的缘故原由可能是翻译后有修饰残基。

总之，基因功能表明的数据库在生物学领域发挥着至关紧张的作用，是生物学家们不可或缺的工具，为我们揭示基因的奥秘提供了有力支持。随着技术的不停进步，这些数据库将不停美满和更新，为生物学研究带来更多的惊喜和突破。
欢迎有分析需求的各位老师前来咨询，爱基强盛的生信分析团队将尽可能为您提供资助。
关于我们
武汉爱基百客生物科技有限公司（简称爱基百客），位于武汉高农生物园，是一家专业提供表观组学科研服务、单细胞与空间组学测序分析和高通量测序分析的新型生物科技服务企业。公司先后引入ChIP、WGBS、ATAC-seq、DNBSEQ-T7、10x Genomics、SeekOne® DD、DNBelabC-TaiM4和Stereo-seq等实验平台，不停提升公司的科研服务能力。
运营至今互助的科研客户超2000家，涵盖国内知名科研院所、高校以及相关生物企业，科研结果曾多次在Science、Cancer Cell、Nature Communications、J HEMATOL ONCOL、Plant Cell 等国际高水平学术期刊发表，受到了客户广泛好评，是国内发展最迅速的高通量测序科研服务企业之一。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/)