网络药理学:6、零基础复现一篇生信文章:中药-身分-靶点网络/同心圆图制作
媒介数据库网址
本文复现论文步骤
[*]对交集靶点做PPI网络,对应步骤【一】和【二】和【三】
一、String获得活性身分-靶点网络tsv文件
String数据库重要是用来检索已知蛋白和推测蛋白之间相互作用的数据库。一样平常和Cytoscape联合利用来做图,构建蛋白质-蛋白质相互作用(PPI)网络。
网站首页和搜索
网站首页如下:
https://i-blog.csdnimg.cn/direct/b89cedfb77914b03a33975b76608e793.png
点击SEARCH后出现如下界面,假如我们有一个目标蛋白/基因,想要检察这个蛋白/基因的可能的相互作用蛋白可以选择Protein by name;假如我们有很多蛋白/基因,想要检察这些蛋白/基因之间的相互作用关系,那就可以选择Multiple proteins。
我们输入上一步得到的身分潜伏靶点和疾病作用靶点的交集靶点基因(注意:该数据库不支持一次性输入高出2000个基因),将Organisms选为智人种,点击搜索。
https://i-blog.csdnimg.cn/direct/7558496957a1421183c00133e4f15e1c.png
然后页面弹出如下,此时我们需要一直往下拉页面,在最下面看到continue这个按钮,点击后个才算是加载完了。
https://i-blog.csdnimg.cn/direct/280ca18078a14c2489950734008e7eaf.png
然后可以看到网络图如下:
https://i-blog.csdnimg.cn/direct/b60394a4a02e472886bcd6fd6fdd99a7.png
搜索结果处理
往下拉可以看到Settings选项,这里我们需要关注的是minnimun required interaction score,即调节置信度/置信区间的地方。置信度越高,结果正确性越高,在这我们将它调节到0.9(一样平常是0.4),然后再勾选上hide disconnected nodes in the network,隐藏掉没有毗连的节点。末了选择UPDATE等候更新整张图。
https://i-blog.csdnimg.cn/direct/6c4627094a7e4d68a270f15c6d9accf6.png
可以看到图变成如下,干净了很多:
https://i-blog.csdnimg.cn/direct/78480a5946b448e1942d07a85813d347.png
能看出是三部分构成。
然后我们选择Exports,假如我们已经提前打开了Cytoscape软件,那么可以点击右上角直接发送到Cytoscape。
同时我们生存PNG格式和tsv格式文件(用于在Cytoscape打开)https://i-blog.csdnimg.cn/direct/a3b7d3fb03d74c128d9713bda28ae9ac.png
二、PPI网络(中药-身分-靶点)前置数据处理
身分-靶点文件
可以简单就有两列,第一列是身分对应的MOL ID或者身分名,第二列是靶点基因名。
也可以比较复杂,如下,第一列是身分名称,第二列是靶点基因名,第三列是靶点的Uniprot ID,第四列是身分的mol ID:
https://i-blog.csdnimg.cn/direct/29db05068aa840f2840a3147fd159c79.png
注意在这里,可以把同一个身分对应到的多个靶点举行去重。但是不同身分对应到同一个靶点不算重复,需要保存。这里的靶点就是直接来自于SwissTargetPrediction等数据库根据标准筛选后的结果,而不是和疾病靶点的交集。
网络文件
就是PPI网络图中会出现的节点,由于我们要构建的网络图是“中药-身分-靶点”的图,所以节点一共会有三种,分别是“中药”、“身分”、“靶点”。
那么这个网络文件有两列,共分为两部分。而且一定需要表头,无论表头名字是什么。
第一部分就是把“身分-靶点文件”的身分名和靶点基因名复制过来,如图的蓝框部分,第二部分就是中药名和对应的身分名,如图的红框部分。
https://i-blog.csdnimg.cn/direct/d7718c480f2d429981681515b30b70f4.png
属性文件
然后新建一个excel文件,将刚刚网络文件的第二列复制过来为第一列,去重,
怎么确定同心圆的层数和每层节点数
检察一共有多少个数据,譬如这里我是88个数据(只看靶点,不算身分和中药),那么会是大概会是两圈,第一圈是30个数据,第二圈是58个数据如许。
所以新建第二列,将前30个靶点的第二列输入为1。背面58个数据输入为2,然后再把身分粘贴过来放到第一列,对应的第二列输入为3,末了粘贴中药名作为第一列,对应的第二列输入为4。(这里的第二列的1、2、3、4只是作为区分,你也可以改成a、b、c、d等等),最终如下:
https://i-blog.csdnimg.cn/direct/8c76378988a44221b6f267bc17eaf556.png
https://i-blog.csdnimg.cn/direct/1ead566a4628483eac6650871c0391ce.png
注意表格也是一定要列名的。
假如同心圆一个有200个节点,那么一样平常是4层(不包罗圆心),分别是20、40、60、80个。
Cytoscape处理
点击后导入网络文件。
https://i-blog.csdnimg.cn/direct/ea0a5b7837814f4f823c1267c0a150d6.png
题目1:导入网络文件报错Could not Initialize Preview
假如导入网络文件报错如下:
https://i-blog.csdnimg.cn/direct/597af227661a4f2cbc699adb827d4771.png
https://i-blog.csdnimg.cn/direct/c58558eef75f438ea799301d60c9b012.png
那么说明网络文件存在以下环境:
[*] 电脑上的excel版本过老,导致生存的.xlsx或者.xlx文件格式不兼容,建议生存为CSV格式重试。或者一开始就是CSV格式的话,改成以UTF-8编码的CSV:
选择【文件】/【另存为】/选择【所有文件格式】/选择【CSV UTF-8】格式
https://i-blog.csdnimg.cn/direct/53b29fa5dfab433b8564c35659295ccc.png
[*] 文件中存在特殊字符,譬如逗号、换行符、分号、空格等,用替换换掉:
关于换行符怎么打:按Ctrl+J
将第一列设置为绿色实心圆圈(这里的Ingredient是我网络文件第一列列名)
https://i-blog.csdnimg.cn/direct/80c16d85ef04406fb5a0771119116149.png
将第二列设置为黄色圆圈(这里的Common name是我网络文件第二列列名)
https://i-blog.csdnimg.cn/direct/9c763c708b4c471da8690996c2fdd732.png
最终网络图如下:
https://i-blog.csdnimg.cn/direct/310bff6b9cb340b6b8b640f4d3c51656.png
题目2:出现一些空缺节点或者全是空缺节点
假如出现一些空缺节点说明该节点没有连线,可能是Uniprot校正基因名时出错了。可以单独检察并校正下基因名,或者删去。
假如发现全都是空缺节点,如下,那么建议鼠标滚轮放大一下视图,可能只是Cytoscape为了预览性能没有表现而已。
https://i-blog.csdnimg.cn/direct/0cbf9b5903a949a4b0b6e732690b77ee.png
然后点击如下导入属性文件,然后直接点击OK
https://i-blog.csdnimg.cn/direct/a9e0f5b9ef3645eba26ba5f24b50c878.png
然后点击左侧栏的Filter,选择Column Filter
https://i-blog.csdnimg.cn/direct/b294f35474f04f9bb763ce73596eed3f.png
再选择Node:type
https://i-blog.csdnimg.cn/direct/df24d656e03f438f87844ffff2074888.png
我们将搜索范围调为1到1,是我们刚刚第一圈定义的type值,可以看到变黄的节点就是那些节点。
https://i-blog.csdnimg.cn/direct/bd93723768574881a3eb8cd5d3e6801c.png
然后选择Layout/Attribute Circle Layout/Selected Nodes Only/type
https://i-blog.csdnimg.cn/direct/70810594dc354a5fbdefbaa650a8f566.png
就可以看到刚刚选中的节点变成了一个圈
https://i-blog.csdnimg.cn/direct/d5f40814be254553bf0c39879aca4162.png
接着如法炮制处理第二圈,现在网络图长如许:
https://i-blog.csdnimg.cn/direct/436a617d4f8f41c8935d851b194f6cec.png
接着我们将范围变为3到3,是我们的中药身分,选中身分的节点后,选择Layout /Grid Layout/Selected Nodes Only,将节点分列为两列。
https://i-blog.csdnimg.cn/direct/8fca44f47fcb4f3eb927b951d40e8620.png
我们调解下字体巨细和同心圆的半径,最终如下:https://i-blog.csdnimg.cn/direct/14d0c7533cb94dcc86711d434cad7fcd.png
然后我们来到侧栏的Style,选择Fill Color的Map列(不选择Def.列,由于它是调解整个网络图),然后将Column选择为type,将Mapping Type选择为Discrete Mapping,然后给type分别为1、2、3、4的选择上不同的颜色。
同时我还调解了Size、Shape属性(注意有时间要勾选Lock node width and height才气调解Size属性),如下:
https://i-blog.csdnimg.cn/direct/e4fa5744d5064b14b17178ca42ac1696.png
最终网络图如下:
https://i-blog.csdnimg.cn/direct/742e91b33bcf43ca9e76bc72f7e98a91.png
导出时记得看下右下角缩略图,网络图是否在图片正中心。然后点击图标导出。
https://i-blog.csdnimg.cn/direct/3dfd88c15280471089adddfb4eb0a7f8.png
记得Network to file和Network to PNG都要导出,前者是sif工程文件(备份用),后者是图片。导出图片时将Image Size拉满到500%,这是清楚度的意思。
https://i-blog.csdnimg.cn/direct/409dd2ef0b0a400faf38637956ccb2e4.png
三、Cytoscape制作PPI网络
Cytoscape利用
File/Import/network from file,导入我们在String网站上下载的.tsv文件,页面如下:
https://i-blog.csdnimg.cn/direct/c7f3ad6ce05e42cfa3672f9a81283bd1.png
Style/Create New Style调解网络图格式:
https://i-blog.csdnimg.cn/direct/92020e9eb31a44b69a068fcabd9d2512.png
然后将Label标签下的Column调解为shared name,Mapping Type调解为Passthrough Mapping,可以看到每个节点上都出现了基因名,如下:
https://i-blog.csdnimg.cn/direct/95004e5af7294494ae75f75d248cfa15.png
点击Tools/Analyze Network,然后直接点击OK,可以看到网络图下方和右侧有分析结果的出现。双击下方Degree列,让结果从大到小分列。
https://i-blog.csdnimg.cn/direct/9932645df30e4af3b7830681b55a945d.png
然后还是在左侧Style选项,选中Fill Color,将Column选为Degree,将Mapping Type选为Continuous Mapping。然后点击Currengt Mapping的颜色卡片,点击Current Palette的None,将颜色色柱选为自己喜欢的,一样平常选择红色。
https://i-blog.csdnimg.cn/direct/ef203a5aa5b144639f16d762f6599d90.png
然后可以看到网络图变为雷同如下的形式:
https://i-blog.csdnimg.cn/direct/c57fdbfdcb45461fa853a22c92f578a7.png
然后还是在左侧Style选项,选中Size,将Column选为Degree,将Mapping Type选为Continuous Mapping。然后点击Current Mapping背面的小图,在这里我们可以双击最大值和最小值的方框,输入对应的同心圆的半径,在这里我最大输入了120,最小输入了50,可以看到网络图不同权重的节点也有了巨细之分。
https://i-blog.csdnimg.cn/direct/e09e0555b5814d1a8bf10ad77f3c7f85.png
然后我们来到最下方的数据栏,选中最大Degree值(或者最大的几个值),右键选择Select nodes from selected rows(或者我们直接在网络图中点击节点,假如有多个节点就ctrl点击多个)
https://i-blog.csdnimg.cn/direct/f9783328332548789bb3b57d0ae0a20c.png
然后可以看到网络图中我们选中的节点变成了黄色,同时下方数据栏也只剩选中的行。
https://i-blog.csdnimg.cn/direct/4f4a8b3d19fa40cf99dc7349c119cf35.png
然后我们选择Layout/Attribute Circle Layout/Selected Nodes Only/Selected,此时可以让我们之前选中的节点和其他节点都产生联系(连线),然后我们将这个节点拖拽到一旁,点击空缺处退出选中状态。
https://i-blog.csdnimg.cn/direct/2350eb2081694272a5e5d802d4863ff4.png
如下,我是选择了两个点(由于有两个子图)
https://i-blog.csdnimg.cn/direct/d27e6114f36c4a80b4e2efa1f3438796.png
然后我们再选择次大的一批Degree值对应的节点(相当于同心圆的第二圈),重复上述步骤,可以看到网络图变成如下:
https://i-blog.csdnimg.cn/direct/3d299dbc697f47cf9fb018ba27f84ba3.png
好的,接下来,我们选择最小的一批Degree值对应的节点(相当于同心圆的第三圈)
同心圆半径过大或过小
如下,遇到了一个题目,就是这第三圈同心圆的半径着实是太小了,和第二圈挨得很近。
https://i-blog.csdnimg.cn/direct/b7146a8fd20c41b79e495d42ca5bf331.png
这时间我们选择Layout/Layout Tools,然后选中侧栏的Filgter/Degree Filter,将我们第三圈节点对应的Degree值的范围输入进去,可以看到它选中了我们的第三圈
https://i-blog.csdnimg.cn/direct/1b0b23cd4ed443088eccb26552dc53de.png
然后我们拖动调节同心圆的巨细
https://i-blog.csdnimg.cn/direct/f940fd6eb0be472ca80f5bdb927333c4.png
最终调解竣事如下:
https://i-blog.csdnimg.cn/direct/12951b4e27f544588d5fa12374748f12.png
当然,也可能遇到一种环境,就是可以看到LayoutTools是有上下限的,譬如下调到1/8时,同心圆的半径还是过大的话,建议把前面SwissTargetPrediction等的标准进步一下,从而减小药物靶点的数量。
或者可以将同心圆设置为更多层。
我们点击Style/Label Font Size,然后直接点击数字12(默认字体巨细是12),输入我们想要的字体巨细,一样平常是18。
https://i-blog.csdnimg.cn/direct/0db91f886dc94fc4bbadfbb0eb6f0b6b.png
末了选择File/Export/Network to file和Network to Image分别到处成sif工程文件做备份和PNG格式图片。
CytoHubba分析PPI网络得到Hub genes
在App/App Manage中下载CytoHubba插件
https://i-blog.csdnimg.cn/direct/2d1520c10c4645fd8caeeb3b9f170bd2.png
选择Calculate,然后选择根据Degree值排序后的前10个基因作为Hub genes,点击Export可以将网络图中所有节点拓扑分析的结果生存为csv文件。我们先生存一下,然后再点击Submit举行前十个的筛选。
https://i-blog.csdnimg.cn/direct/94dddad6a24143318e7a4ea0c8196f77.png
可以看到页面变成如下:
https://i-blog.csdnimg.cn/direct/bae35d2c67764d01887aa6d498a718ee.png
点击Save Current Rank可以生存筛选的结果。这里一样的可以这10个节点的网络图生存为工程文件或图片。
https://i-blog.csdnimg.cn/direct/dbe38e651d5c4b51a2805d238edb1eae.png
最下方切换到Unassigned Tables实在也可以看到我们刚刚点击Export的内容
https://i-blog.csdnimg.cn/direct/baff1a19d70b49d9a540b3523e3ae07b.png
打开Export出来的文件看看,也是一样的。
https://i-blog.csdnimg.cn/direct/09b8afe146f548bdac0e9f47135079d1.png
在这里我们只要degree排前10的节点,和其Closeness、Betweenness,最终表格如下:
https://i-blog.csdnimg.cn/direct/d0b3a0023bc845acbf86e49eaf66380c.png
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]