大连密封材料 发表于 2024-7-29 18:14:35

单基因分析 —— 在线数据库使用

单基因分析 —— 在线数据库使用

介绍

对于单个基因,我们可以分析些什么呢?
是癌与正常的差异表达,还是高低表达的生存差异,亦或是与某些特征基因之间的表达相关性呢?
不只,我们能做的不仅仅只有这些。
下面我们将通过一系列的文章来详细的介绍一下单个基因可以做哪些分析。
起首要选择一个爱好基因,选用哪个基因呢?选一个研究比力多,非常著名的癌症相关基因 TP53,这个基因涉及的数据比力多,分析起来比力方便。
起首来介绍点简单的,使用数据库检索单基因的信息。
数据库检索

TCGA

TCGA 数据比力全,所以在线分析网站比力多,我们主要枚举此中广泛使用的几个。
TIMER

TIMER2 网站主要提供了基因表达、CNV、突变以及临床数据的分析,还是比力全的。
另有一个比力有特色的功能,可以分析基因与免疫细胞浸润水平之间的相关性,有许多解卷积的算法所盘算出来的不同范例的免疫细胞浸润水平。
网站访问比力慢,大概需要试试翻墙。
https://img-blog.csdnimg.cn/img_convert/1906ecc3413ceb1d8d6cef6744a6084a.png
基因与免疫细胞浸润水平

点击 Immune 分析模块,选择需要检索的基因以及想要盘算与哪些免疫细胞浸润水平的相关性,然后提交即可。也可以选择是否根据肿瘤细胞的纯度进行相关性的改正,默认是选中的。
https://img-blog.csdnimg.cn/img_convert/13377467109ac8a2f95cce06b62c3c3a.png
分析完后,会返回一个表格。表现不同癌症范例中,目标基因与对应免疫细胞浸润水平的相关性,会展示不同算法的盘算结果。
https://img-blog.csdnimg.cn/img_convert/1e4e2b007228758fd694181d7b9d1258.png
点击此中某个值,会弹出一个窗口,表现基因表达与肿瘤纯度及免疫细胞浸润水平的相关性散点图。
https://img-blog.csdnimg.cn/img_convert/d8b3ea00da6d66bff134c12686aceef5.png
基因组变异与免疫细胞浸润水平

雷同地,可以根据基因是否突变或拷贝数变异分组,并比力不同分组之间免疫细胞浸润水平的差异是否具有显著性


[*]突变
https://img-blog.csdnimg.cn/img_convert/e4286c03b840d0ba353598cfb7865c30.png


[*]拷贝数变异
https://img-blog.csdnimg.cn/img_convert/e49c0282120a6e9e72b208959ff8fac6.png
右侧结果图展示泛癌中基因的基因组变异情况,下方的表格展示分组之间的 logFC。
点击此中的值,可以看到详细分组之间的差异
https://img-blog.csdnimg.cn/img_convert/bbaafea47130ce59abebe055d8e8a222.png
免疫细胞浸润水平与生存分析

Outcome 可以分析基因表达与免疫细胞浸润水平及临床信息的多变量 Cox 回归
https://img-blog.csdnimg.cn/img_convert/fd0bdf2e72dd0c33633783c3d91a1684.png
点击结果表中的值
Z-score 值可以看到在某一个癌症中,多分组 K-M 生存曲线(高低表达与高低浸润水平之间的组合)
https://img-blog.csdnimg.cn/img_convert/d6eb760fb82f256f1fe3eec0a2b5165b.png
基因在泛癌中的表达

在 Exploration 中选择 Gene_DE 可以查看基因在泛癌中癌和正常的表达情况。
https://img-blog.csdnimg.cn/img_convert/88b5be44ba9371ef6b3dc839926d1aa1.png
这里有一个问题,它将配对的癌症和正常样本都放进去查验了,不符合样本的独立性假设。我以为应该在癌症样本中,把那些和正常样本配对的癌症样本去掉。
基因表达与生存的关系

在 Gene_Outcome 模块中可以分析基因表达(可以加上临床特征)与患者的生存时间的相关性。
https://img-blog.csdnimg.cn/img_convert/89521b304eba319e909bf84d5d44d0f4.png
基因突变与基因表达之间的关系

可以选择同一个基因的突变和表达,或者一个基因的突变与另一个基因的表达是否具有显著相关
https://img-blog.csdnimg.cn/img_convert/d85f4042bebd3ba03840b70a26ef7e93.png
结果表中会展示基因突变分组之间基因表达的差异(logFC)
https://img-blog.csdnimg.cn/img_convert/89f0e6628e0620e085ad7be3e2a4a804.png
基因之间表达的相关性

Gene_Corr 可以盘算一个基因与其他基因在泛癌中的相关性水平
https://img-blog.csdnimg.cn/img_convert/e12dd73ebe4fa64b9c8d5abc874ff212.png
评估样本中免疫细胞浸润水平

末了一个功能是上传自己的表达谱,让它来盘算样本中免疫细胞的浸润水平
https://img-blog.csdnimg.cn/img_convert/b7c9b41461fbd8d20149066612f41dcb.png
GEPIA2

GEPIA2 是整合了 TCGA 癌症样本以及 GTEx 的正常样本
https://img-blog.csdnimg.cn/img_convert/a32cbb5c8d8a13efa97aa6236992f1ec.png
在首页,选择单基因分析,起首会跳出基因在肿瘤和正常的不同组织器官中的表达情况,颜色越深表达越高。
https://img-blog.csdnimg.cn/img_convert/0557d8ec086d8efb803f44adba372696.png
然后是泛癌与正常样本表达的点图
https://img-blog.csdnimg.cn/img_convert/f5965b0aa7ab7b0ff306543f98b56e17.png
基因表达结果绘制

左侧选择 Expression Analysis,选择 Expression DIY,然后选择基因以及对应的癌症范例
https://img-blog.csdnimg.cn/img_convert/279c90511d3d8b96598d6628e01581dd.png
这个只是上面泛癌单图的加强版,用处不大
可以换成箱线图
https://img-blog.csdnimg.cn/img_convert/295727575eddb094d2bb195c905d2e9b.png
结果好看了不少
https://img-blog.csdnimg.cn/img_convert/50c2f3ad1cd5404d22dbb9a0da36868d.png
查看基因在不同临床分期中的表达情况
https://img-blog.csdnimg.cn/img_convert/a71fd93a8571fcbed12c558c4d8296a0.png
基因表达的生存分析

基因表达与生存的关系,可以选择使用均值、分位数等对样本分组,也可以看 OS 或 DFS 生存信息,选择比 TIMER 多一点
https://img-blog.csdnimg.cn/img_convert/fc76a7b886fc6cd38eb538c911bb5829.png
结果图就比力方正,信息都挤一块了,不太好看
https://img-blog.csdnimg.cn/img_convert/14e75a9696a311bfc5eaaad402a807aa.png
不同转录本的表达情况

Isoform Details 可以查看基因的转录本表达情况
https://img-blog.csdnimg.cn/img_convert/fceabc8d1aed799de8e1753207926605.png
表达相关性分析

Correlation Analysis 可以选择不同的相关性盘算方法
https://img-blog.csdnimg.cn/img_convert/e350a0713489ce93b4138e5f1ca6fa74.png
但是固然可以选择不同的样本范例,但是在图中并没有用颜色区分
https://img-blog.csdnimg.cn/img_convert/8c49d31419e96bab424a9c9ff790db64.png
Similar Genes Detection 可以探求在某些癌症中,和目标基因的表达具有相关性的基因。
https://img-blog.csdnimg.cn/img_convert/75caf762c68a32be450425e2b4eff02a.png
LinkedOmics

LinkedOmics 网站主要提供了对基因的相关性分析,并对相关性结果进行富集分析。
https://img-blog.csdnimg.cn/img_convert/d41e5d9abada22450100c0ac49c278e3.png
进入主页之后,不需要注册,直接游客登录即可
分析主要包括 5 个步骤:选择癌型,选择数据集,选择基因或其他特征,选择目标数据集,末了选择统计方法。
例如,我们选择 BRCA,点击选中后会自动跳出下一步
https://img-blog.csdnimg.cn/img_convert/38b8c9e5dbf39af3e94f55c944b616c6.png
第二步,选择 mRNA 表达数据
https://img-blog.csdnimg.cn/img_convert/f428af984d29839aa89cc0a1fea1ed55.png
第三步,输入目标基因(2b 用于过滤样本的,可选)
https://img-blog.csdnimg.cn/img_convert/086945150dd34b16211351bc54130f30.png
第四步,选择目标数据,一般是同一种范例的数据看相关性,也可以 mRNA 和 miRNA 之间的相关性,看详细情况
第五步,选择分析方法,我们选择 Spearman 相关性算法
https://img-blog.csdnimg.cn/img_convert/e6a6397797bc0328b4b5220be00fca78.png
选完之后就可以点击提交了,等待分析完成
完成之后,选择这个分析任务
https://img-blog.csdnimg.cn/img_convert/3c1c575ae1bb19f2e7a62348873b9419.png
可以看到分析结果,表格展示了与每个基因的相关性,并根据相关系数从大到小排序。右边是相关系数与 P 值的火山图,最下面两张是正负显著相关基因的表达热图。
https://img-blog.csdnimg.cn/img_convert/42d8c4fa61527e0a675ddccbb09a7da9.png
选择 LinkInterpreter,可以进行基因富集分析,有 ORA 和 GSEA 两种富集方式。可以选择不同的通路数据库以及正负相关基因,另有一些显著性指标等
https://img-blog.csdnimg.cn/img_convert/b59309b2a0f77f3b1817892bcb65a3a2.png
分析完成之后,会展示出一个通路列表信息
https://img-blog.csdnimg.cn/img_convert/b95aabdd41e3cced43d7553ae5d9612d.png
点击 GO Slim summary for the user uploaded IDs 可以看到 GO 通路富集结果的柱状图
https://img-blog.csdnimg.cn/img_convert/0f17f6fbda6bddf11d12752b35a95349.png
细胞系

DepMap

DepMap 数据库主要提供了细胞系多组学数据的检索和分析。
https://img-blog.csdnimg.cn/img_convert/9f92355fc0bfc43d968ceb4ca4353b83.png
查询目标基因会返回许多信息图表,比如基因在细胞系中的表达、拷贝数变异、突变以及细胞依赖性等
https://img-blog.csdnimg.cn/img_convert/4e5ef44b24804daefe4415c7c3b9501c.png
翻到最小面可以看到基因的共依赖性最显著的几个基因
https://img-blog.csdnimg.cn/img_convert/ebaa9f4218e10719423408c58ee8fab7.png
点击 plot 就可以看到两个基因在不同细胞系中的影响分数散点图
https://img-blog.csdnimg.cn/img_convert/789e195a517495b35f547f9836608b74.png
点击 Show pre-computed associations 可以看到一些根据相关性从大到小排序的基因,以及对象的数据范例。
https://img-blog.csdnimg.cn/img_convert/eca02197cd1c595582801dce06f42ef5.png
可以看到 TP53 的依赖性与 EDA2R 的表达相关性很高
我们也可以自由选择 X 轴和 Y 轴的数据,例如选择表达数据
https://img-blog.csdnimg.cn/img_convert/3abfdca746c13c0044bb705d09689365.png
盘算与药物之间的相关性
https://img-blog.csdnimg.cn/img_convert/e90f53f81c24c9b79424af526a5c2c1f.png
也可以选择不同的细胞范例等
https://img-blog.csdnimg.cn/img_convert/90a2773e47d1f08ecd5cd4380ab3a884.png
这个网站一般只能看基因和其他特征的相关性,在多组学层面进行探索。
蛋白质

HPA

HPA 数据库提供了丰富的基因或蛋白信息,包括组织、单细胞、病例图形、免疫荧光图片、细胞系等多种数据的检索。
查询完目标基因之后,起首是基因的一些简单的摘要信息,对哪个感爱好就可以点击相应的链接
https://img-blog.csdnimg.cn/direct/9ffee9de403148a1847431f2ad0328db.png
组织中的表达情况

点击 TISSUE 可以查看基因在组织中的表达情况,另有相应的病例图像及蛋白表达等
https://img-blog.csdnimg.cn/direct/92e4bbeced724547a63924b9caf9f194.png
往后面翻可以看到在不同数据集中的表达情况,数据非常的丰富
https://img-blog.csdnimg.cn/direct/a01b6e5f4dd448a0a7cea1c04bbdb334.png
单细胞表达情况

点击 SINGLE CELL 查看在单细胞中的表达情况
https://img-blog.csdnimg.cn/direct/0bc27c7ee21b4b7c8e57cf4ffe7d9576.png
每种组织的每类细胞中的表达情况
https://img-blog.csdnimg.cn/direct/1658abf4aaf6400091471489f67eaabf.png
免疫荧光图像

https://img-blog.csdnimg.cn/direct/3ae38eeef9e546d6b6f5395c3b6a780e.png
对于部分基因,还会包罗不同细胞周期中基因表达的变化。可以看到蛋白表达与细胞周期有关,mRNA 表达与细胞周期无关
https://img-blog.csdnimg.cn/direct/0dbdcedd7a9c46b0961a26f4d2b7d39c.png
基因互作

末了一个 INTERACTION 可以查看与目标基因互作的基因,并且可以根据亚细胞定位和预测位置等对基因进行着色。可以看到,TP53 与许多基因在核内共定位。
https://img-blog.csdnimg.cn/direct/196616054df848dabf0f76df05fa25ae.png
后面的表格可以查看与每个基因的互作情况
https://img-blog.csdnimg.cn/direct/3932ed0596204d8386b1bd8e8e42407f.png
互作网络

互作网络分析,可以快速搜刮与目标基因存成互作关系的基因,通过其他基因的功能来说明目标基因大概存在的一些功能作用
STRING

STRING 数据库主要收录了一些从数据库、文章或算法预测的蛋白质互作网络。
https://img-blog.csdnimg.cn/img_convert/f75baadfa31c5ce304a078347185a62a.png
检索目标基因并选择物种
https://img-blog.csdnimg.cn/img_convert/190c26d64e491f5048879d60af69fcc5.png
查看互作网络图
https://img-blog.csdnimg.cn/img_convert/5fa491050eb87a71e884a4cb8be54792.png
下方可以选择对应的分析模块
https://img-blog.csdnimg.cn/img_convert/03398eaa631177c43e6411c5fe7705c1.png
共表达分析
https://img-blog.csdnimg.cn/img_convert/794a80dbb64e333c1b74423dc0c15d9e.png
分析模块可以看网络中的基因在通路、蛋白质数据库等中的富集情况
https://img-blog.csdnimg.cn/img_convert/b9438bab0bca605dd059351c22463d37.png
也可以将数据导出,用其他软件绘制互作网络图
https://img-blog.csdnimg.cn/img_convert/8e0322b6158a312d62b2f56bb5d9b574.png
KEGG

KEGG Mapper – Color 工具是 KEGG 提供的用于检索基因在通路中的位置,可以输入多个基因或上传文件。
https://img-blog.csdnimg.cn/img_convert/4c4b24f91905b213f881862f516a1b54.png
注意,要输入基因名称,人类要选择 hsa,以及是否支持别名等选项。
然后可以看到基因出现的通路列表
https://img-blog.csdnimg.cn/img_convert/147970e4f8a66d9ac58e85f03fa9c8f9.png
选择此中一个,查看基因所在通路中的位置。目标基因将会标注上对应的颜色
https://img-blog.csdnimg.cn/img_convert/ebcb4cd6dfa127f8971d48dfe2f5502c.png
方便查看目标基因在通路中的功能。
BioPlex

BioPlex 是蛋白质谱分析生成的基因互作网络,可以检索与目标基因直接互作的基因。
https://img-blog.csdnimg.cn/img_convert/c6e5088b16a03e5d05424046d6a9ad27.png
检索之后会有三个网络,分别是在两种细胞系中检测到的基因互作关系,以及归并两个结果的互作图。
https://img-blog.csdnimg.cn/img_convert/adad9813bf08ede82e00b4fb32012a23.png
点击网页下方的 GO Ontology 可以查看互作网络富集到的通路
https://img-blog.csdnimg.cn/img_convert/aed986905724ee2e032df817b25fdcb2.png
Interaction Table 可以查看更详细的互作信息
https://img-blog.csdnimg.cn/img_convert/17ef85ccfd07faa24e91ab40eb32f176.png

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 单基因分析 —— 在线数据库使用