DisGeNET是一个综合性的基因-疾病关联(GDA)关系数据库,它提供了人类疾病的最新知识,包括孟德尔病、复杂疾病和环境疾病。DisGeNET中的信息来自专家解释的知识库、GWAS、动物模型和科学文献。具体地说,其数据来源包括CTD、UnPROT/SWISPROT、ClinVar、Orphanet、 the NHGRI-EBI GWAS Catalog、GAD (Genetic Association Database)、 MGD (the Mouse Genome Database)、 RGD (the Rat Genome Database)、 PsyGeNET、 the Human Phenotype Ontology、 LHGDN (the Literature Human Gene Derived Network), 以及BeFree [80]。DisGeNET给每个GDA多个评分。可靠性分(confidence score)由GDA在所有数据源中重复出现次数的多少,反映该GDA的可靠性;疾病特异性指数(DSI)与该基因相关的疾病数量成反比,而疾病多效性指数(DPI)与该基因相关的差别疾病种别的数量成反比。高DSI的GDA表明该基因对该疾病更为特异,低DPI的GDA意味着该基因对该疾病所属的疾病种别更为特异。DisGeNET(v5.0)包含了20370个疾病(表型)与17074个基因之间的561119个基因-疾病关联关系。