最近有小伙伴经常询问怎么预测转录因子的下游靶基因,以及预测一些组卵白修饰影响的靶基因信息。本日就给大家介绍一下Cistrome数据浏览器(Cistrome Data Browser)。
Cistrome DB是来自人类和小鼠的ChIP-seq、ATAC-seq和DNase-seq数据的资源,提供了转录因子、辅因子、染色质重塑因子、组卵白翻译后修饰和可用于核酸内切酶活性的染色质区域的全基因组位置图。Cistrome DB包含大约45000个人类和44000个小鼠样本;我们可以通过关键字、菜单和数据驱动的搜刮工具找到信息丰富的染色质图谱。
浏览器搜刮功能可以预测查询基因的调节因子以及潜在顺式调节元件的细胞范例和因子依靠性功能。而且网站另有toolKit可以检索哪个因子调控了我们感兴趣的基因、哪些因子结合在感兴趣的区域;检察哪些转录因子的结果与输入peak的结果有明显的重叠,用于转录因子的colocation分析。Cistrome-GO还可以做ChIP数据集靶基因的功能富集分析。
话不多说,我们来开始操作吧。
网站:http://cistrome.org/db/#/
01 搜刮感兴趣的转录因子
打开界面。我们可以在红框里输入感兴趣的转录因子,以CBFB为例。
Species代表物种,Biological Sources 代表生物来源,Factors代表转录因子/组卵白修饰范例。
这里选择人的造血细胞CBFB的结果进行展示:
每个ChIP-seq和DNase-seq样本都有一个唯一的数据集ID, Cistrome DB为每个数据集(包含手动管理的元数据)进行注释,包括物种、因素、生物来源、发布时间和处置处罚状态。点击单个数据集可获取分析结果和质控指标,点击多个数据集可提取批量数据检察,选择感兴趣的数据集后我们可以将数据发送到genome browser(WashU Browse:、UCSC Browse)进行团结分析,如辅因子、染色质调节因子与组卵白修饰之间的关系等。
Result下面另有Inspector部分,在红框地方,我们可以点击WashU Brower以及UCSC Browser进行浏览。必要注意的是篮框,我们用到的是CistromeDB:37606的数据。
1. 点击WashU Browser表现如下:
我们可以点击黑灰色部分(上图赤色圈圈),弹出如下窗口,进去可以搜刮感兴趣的靶基因。
我们也可以直接选中界面区域,进行左右拖动,看整个基因组的可视化情况。下图界面展示CEP20和MYH11的基因可视化情况,可以看到这两个基因的启动子区域都有peak(红框展示)。此中基因上的箭头表示基因的方向性。
2. 点击UCSC Browser
直接可以搜刮CEP20或MYH11,得到同样的可视化情况。也可以通过点击move的<>等箭头来看整个基因组上的可视化情况。
3. 还可以点击Downlod的BED Peaks 以及BIGWIG File部分进行下载,后用IGV可视化进行浏览(公众号往期文章具体介绍了IGV使用教程)。
找到感兴趣的靶基因后,根据peak的位置提取peak序列后就可以设计引物进行验证了。不外这也只是其他研究者对应的细胞材料的数据,发起大家自己研究还是从ChIP-seq开始,再做ChIP-qPCR,这样更好一些哦。
别的Tools部分还展示了QC reports,QC motifs,Get top putative targets,Check a putative target。
QC reports可以检察数据质量情况:
Motif信息
可以点击检察具体的motif
Get top putative targets
得到排分靠前的靶基因,可以用WashU以及UCSC浏览
点击PER1对应的可视化浏览器得到以下结果:
Check a putative target
查找感兴趣的靶基因,搜刮MYH11得到该基因的得分、位置等信息。
02 搜刮感兴趣的组卵白修饰范例
在红框里输入H3K27ac
以3T3-L1(用于贮存脂肪的前脂肪细胞)为例;
点击后
1. 点击WashU Browser表现:
搜感兴趣的基因,以Tcaf1为例;可以看到在启动子区域有明显的peak。
2. 点击UCSC Browser
也定位到Tcaf1这个基因,可以看到同样的peak
3. 还可以点击Downlod的BED Peaks 以及BIGWIG File部分进行下载,后用IGV可视化进行浏览。
别的Tools部分:
QC reports可以检察数据质量情况:
Get top putative targets
得到排分靠前的靶基因,可以用WashU以及UCSC浏览
点击Eef2k,看对应的可视化,结果如下:
Check a putative target
查找感兴趣的靶基因;搜刮得到Tcaf1该基因的得分、位置等信息
03 Toolkit使用
点击主页面的ToolKit
可以进入以下界面:
- 1. 检察哪些转录因子靶向感兴趣的基因
- 2. 检察哪些转录因子靶向感兴趣的区域
- 3. 检察哪些转录因子的结果与输入peak的结果有明显的重叠,可以用于转录因子的colocation分析。
在第一个找哪些转录因子靶向感兴趣的基因中,输入E2F1为示例,得到结果如下:
可以看到有许多预测到的转录因子靶向E2F1。
点击Result in figure得到以下信息:
- 1.调节潜能(RP)是一种评估因子调节基因的可能性的分数。
- 2.X轴表示RP得分。Y轴表示不同的因素。y轴线上的点表示相同的因子。
- 3.双击某个区域或滚动鼠标放大,然后单击“重新设置”返回。
- 4.点击每个点提示框中的GSM号码,查找样本信息。
04 Cistrome-GO
为了识别TF直接调控的基因,该网站还开发了一个名为Cistrome GO的网络服务器,该服务器答应用户输入ChIP-seq峰值,并通过加权基因周围峰值的贡献来输出基因得分,以指示TF的调控潜力。重要的是,Cistrome GO使用盘算的全基因组评分进一步进行基因本体分析和途径富集。
它有两种工作模式。假如用户同时提供了TF的ChIP-seq文件和差异表达分析文件(基于TF),则Cistrome-GO将基于两种数据范例的整合实行集成模式分析。假如我们仅上传TF ChIP-seq文件,则Cistrome-GO将以单独模式实行分析。
我们可以导入peak的bed文件进行分析。
这里我们直接看一下示例的demo吧
选择GATA4 ChIP的数据
表现的是72934_peaks analysis 前10000个peak
8.941%的峰位于启动子区。这小于20%启动子范例阈值,因此衰减距离设置为10.0kb,得当于加强子范例分析。衰减距离可以在选项中指定。
表现关联基因的信息:
KEGG富集结果
GO结果
总之,Cistrome DB可以找我们感兴趣的转录因子以及组卵白修饰位点的靶向基因信息,还可以通过toolKit进行可以检索哪个因子调控了我们感兴趣的基因、结合在该区域;检察哪些转录因子的结果与输入peak的结果有明显的重叠,可以用于转录因子的colocation分析。Cistrome-GO还可以做ChIP数据集靶基因的功能富集分析。大家是不是心动了,赶紧用起来吧,趁便提一下做ChIP、CUT&Tag找爱基百客哦,目前CUT&Tag还在春季大促哦。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |