网络药理学:11、分子对接之PDB数据库使用、PubChem如果没有3D结构、autodo
PDB数据库使用官方地址:https://www.rcsb.org/
首页如下:
https://i-blog.csdnimg.cn/direct/a2084c232fb34d039cf58c266fc1f75a.png
我们以热休克蛋白HSP90AA1为例,其PDB ID为7DHG,所以我们在搜索栏输入7DHG:
https://i-blog.csdnimg.cn/direct/492eef92e0584423bf2c3e356f1848eb.png
主要关注红框里的几个地方。
[*]Download 下载文件,一般选择PDB Format即可
[*]Released 发表时间
[*]Method 一般只有X-Ray(X射线)和NMR两种。此中X射线最常见也最好
[*]Resolution 分辨率相干的指标,越小说明分辨率越高。一般小于2A就足够好了,具体看论文的指标。
再往下翻,主要看该蛋白有几条链,而且右下角Go to UniProtKB可以直接跳转到UnitProt数据库
https://i-blog.csdnimg.cn/direct/e7e2ac0c64c14340b98b64dac5151717.png
https://i-blog.csdnimg.cn/direct/4fa4e1e1c1834d6d880bf4a07177e4ff.png
可以看到,这里该蛋白是有两条链的。
同时,对于一些有小分子的蛋白也最好看看相干信息,这里我展示另一个7A2O示例:
一般要记住这里的ID,在处置惩罚蛋白的时候要去除。
https://i-blog.csdnimg.cn/direct/440fbf6bea7442af9daaaf5f0ca7a071.png
PubChem数据库如果没有3D结构
PubChem数据库如果没有3D结构,只有2D结构的SDF,我们可以下载Chem3D软件,将2D结构的SDF文件导入进去,而且Calculations/MM2/Minimize Energe实现能量最小化。
但是该软件只有windows版本,属于ChemOffice百口桶的一部门,资源比较难找。
推荐直接去其他数据库再找找小分子配体的mol2结构。
然后再通过OpenBabel/mgltools转化为pdbqt的格式。
分子对接前言
我们这里要复现的是一篇大黄素对食管癌的影响的论文。
大分子蛋白这里以ESR2蛋白为例,其PUB ID为7XVY。
小分子配体这里以大黄素emodin为例,其分子ID为MOL000472。
B站相干推荐视频如下:https://www.bilibili.com/video/BV1NK411i7No/
Autodock tools和autodock自己下载和留意事项这里并不涉及,后续会单独出一个博客讲解。
文章的快速实践命令总结位于:http://t.csdnimg.cn/hGanb
大分子蛋白准备
PDB数据库下载蛋白
不会操作的具体可见我的另一篇博客:http://t.csdnimg.cn/QDEAS
pymol前置处置惩罚
不会操作的具体可见我的另一篇博客:http://t.csdnimg.cn/i0vpE
其他处置惩罚(添加分子伴侣、判断是否删去同源肽链)
蛋白质的层级结构
回顾一下蛋白质的层级结构:
一级结构、二级结构、超二级结构、结构域、三级结构、四级结构(亚基)
[*] 一级结构:氨基酸序列,无空间意义。可以在Uniprot数据库查询。
主要作用力:肽键、二硫键
[*] 二级结构:肽链主链骨架的空间位置(α-螺旋、β-折叠、β-转角、无规则卷曲)。
主要作用力:氢键
https://i-blog.csdnimg.cn/direct/d5730ae329c9441fbdb3d7456f28e33b.png
[*] 超二级结构:相邻的二级结构单元形成的有规则的组合体。例如:αα(两个α-螺旋)。仍旧没有活性。
[*] 结构域:肽链上几个相邻的超二级结构单元的组合,每个结构域分别代表一种功能单位。是拥有活性的。一般说的蛋白口袋/活性位点就是一个结构域。
[*] 三级结构:多肽链中全部氨基酸残基的相对空间位置。结构域是三级结构条理上的独立功能区。
主要作用力:疏水作用、盐键、二硫键、氢键、离子键。
[*] 四级结构:蛋白质含有2条或2条以上多肽链。每一条多肽链都有其完备的三级结构,称为亚基。亚基与亚基之间呈特定的三维空间排布,并以非共价键相毗连。蛋白质分子中各个亚基的空间排布及亚基打仗部位的结构和相互作用,称为蛋白质的四级结构。
主要作用力(亚基之间的作用力):氢键、离子键。
在2个亚基组成的四级结构蛋白质中,若亚基结构雷同、氨基酸序列雷同、三级结构雷同(又称同源),称之为同二聚体,若亚基分子不同,则称之为异二聚体,多个亚基可以此类推。
总结:
[*]一级结构:氨基酸序列
[*]二级结构:碳链碳骨排挤间位置,α-螺旋等。
[*]超二级结构:二级结构组合体,αα(两个α-螺旋)等。
[*]结构域:超二级结构组合体。开始有生物活性。
[*]三级结构:多肽链中氨基酸的空间位置。
[*]四级结构:亚基(有完备三级结构的多肽链)之间的相对空间位置。
分子伴侣
理论上讲,如果蛋白质的多肽链随机折叠,可能产生成千上万种可能的空间构象。而实际上,蛋白质合成后,只形成一种正确的空间构象。除一级结构为决定因素外,还需要在一类称为分子伴侣的蛋白质辅助下,合成中的蛋白质才能折叠成正确的空间构象。只有形成正确的空间构象的蛋白质才具有生物学功能。
所以在分子对接之前,我们可能需要添加分子伴侣。
判断是否需要删去同源肽链
如果一个蛋白有多个同源的肽链,分子对接可以只保存一条吗?
同源的意思是指,这多条肽链氨基酸序列一样,构象一样。
要看分子对接的位点是否处于多个亚基的结合区域,如果是,则不能删。
如果否,就能删。
Autodock tools前置处置惩罚
加载蛋白
打开Autodock tools,如果页面如下
https://i-blog.csdnimg.cn/direct/52b17eb3839440c3ba0f7b98f81ac7b3.png
即在Dashboard/Scenario/Tools这一行没有
https://i-blog.csdnimg.cn/direct/f745ae89819c4205afc5fd5d540e3de5.png
那么就意味着你没有把adt.bat文件和Autodock4、Autogrid4两个文件放在一起。
留意Autodock tools不可以直接将pdb文件拖入中加载(也是很垃圾的一点……
选择File/Read Molecule后选择文件加载,如下:
https://i-blog.csdnimg.cn/direct/b251270537a541b8a9f4ff359f436018.png
加氢
选择Edit/Hydrogens/Add进行加氢,如下会弹出一个页面,直接选择YES即可。
https://i-blog.csdnimg.cn/direct/4869a65a8e0c46349896d96e261bdbf8.png
然后是进一步的配置界面,也直接选择Yes即可。
https://i-blog.csdnimg.cn/direct/eeb1e24b712a4482bcc7a8ca37bc6bb7.png
着实加氢分为几种环境,可以加全氢/极性氢/活性位点附近氨基酸残基加氢。
从左到右的精准度会越来越高,速度越来越快,但相应的也需要提前查询文献,知道的信息越多。
计算总电荷
再选择Edit/Chargs/Compute Gasteiger,即可计算总电荷,如下:
https://i-blog.csdnimg.cn/direct/a10d1e2a27074074858189fc8532a766.png
指定原子范例
选择Edit–Atoms–Assign AD4 type,即可指定原子范例。
转为pdbqt文件
选择File/save/write PDBQT后出现如下。
https://i-blog.csdnimg.cn/direct/2575ca9534934a0eb6063a899baa2d1d.png
直接点击OK,转为pdbqt格式
小分子配体准备(如果事先准备好了小分子的pdbqt文件,可以跳过)
加载配体
重新打开autodock tools软件,大概点击Edit/Delete/Delete All Molecules清空页面。
留意也是不能将小分子配体下载好的mol文件直接拖拽进autodock tools界面里的。
而是选择Ligand/Input/Open(可能跳出弹窗,直接选择yes即可),加载成功如下:
https://i-blog.csdnimg.cn/direct/a84615c52b894f40896ace06e5719810.png
选择并判断配体的 Root
选择Ligand > Torsion Tree > Choose Root”和“Ligand > Torsion Tree > Detect Root。
https://i-blog.csdnimg.cn/direct/a2105ed824a04321be753945346c18b5.png
然后选择Ligand > Torsion Tree > Show Root Expansion,如下:
https://i-blog.csdnimg.cn/direct/feb99ffb17cd4503bb8afbc2a51bf021.png
查看可旋转的键
选择Ligand > Torsion Tree > Choose Torsion,绿色的表示可以旋转,然后点击Done。
https://i-blog.csdnimg.cn/direct/aa05e0eaf863406c99382f1a8fc70c0d.png
生存成PDBQT
点击Ligand—Output > Save as PDBQT即成功生存pdbqt文件
随后点击Edit/Delete/Delete All Molecules清空软件页面(页面留下绿色小球不影响后续操作)
Grid map准备
重新打开autodock tools软件,大概点击Edit/Delete/Delete All Molecules清空页面。
加载大分子蛋白和小分子配体
点击Grid > Macromolecule > Open,导入大分子蛋白的pdbqt文件,提示是否保存分子中的电荷,选择Yes(之后可能再次冒出两个提示的弹窗,全都选择Yes即可)
https://i-blog.csdnimg.cn/direct/36096b99ac8143bb8afc7b5c09cc9c5b.png
如果你是刚刚根据上文用autodock tools处置惩罚小分子配体为pdbqt格式文件的话,选择Grid > Set Map Types > Choose Ligand…导入小分子配体的pdbqt格式文件
如果你是之前就处置惩罚好了小分子配体的pdbqt格式文件的话,直接选择Grid > Set Map Types > Open Ligand…
最终页面如下(如果没看到小分子配体的话,可以旋转缩放一下界面,可能挡住了而已):
https://i-blog.csdnimg.cn/direct/a8fba06ee218423d966f03c9d07071ae.png
移动小分子配体
https://i-blog.csdnimg.cn/direct/5b8d256dff9641f9842613fe8c2c24ea.png
点击Preference,选择取消Transf. Root Only后可以看到mouse transforms apply ...前面的勾也被取消了。
https://i-blog.csdnimg.cn/direct/ff1be098e5be45f8be68da9ff8dc19f4.png
此时我们就可以鼠标右键选择小分子配体了,把小分子配体移动到合适的位置(即远离大分子蛋白一定的间隔),如下:
https://i-blog.csdnimg.cn/direct/66e6a06e11454c408f431f34d7b3c8dc.png
然后我们把Transf. Root Only选项再勾上。
设置对接口袋
选择Grid > Grid Box…,打开Grid Options对话框。
鼠标中键滚轮可以调整x,y,z三维大小及Spacing(也就是前四个选项)
此中Spacing (angstrom)是团体缩放盒子大小的。
最终调整盒子大小和位置为完全包裹住大分子且不打仗小分子配体(如果明确蛋白活性口袋位置,那么也可以只包裹住该位置),如下:
https://i-blog.csdnimg.cn/direct/2a6fb36f28934041888d9d956e458bcb.png
点击Grid Options弹窗的File > Close saving current退出。
生存GPF文件
选择Grid > Output > Save GPF...,文件名需要手动加上后缀名.gpf。
我一般文件名命名为蛋白质PUB ID_小分子配体MOL ID后四位.gpf的格式,譬如这里的7xvy_0472.gpf
运行Grid
[*]选择Run > Run AutoGrid,在Program Pathname框中选择atuogrid4.exe文件所在位置。留意:一定要自己选择一下,固然这个窗口打开后这里默认有值autogrid4.exe!
[*]Parameter Filename框中选择上一步生成的 .gpf 文件。留意:也是要自己选择一下,固然窗口打开后这里默认有值!选中之后可以发现Log Filename也会检测到值。
[*]最后点击Launch。等待窗口的任务完成,弹窗会自动消散(需要一定时间),此时工作目次会多出一堆文件。
https://i-blog.csdnimg.cn/direct/32e47909485a4a189d392b833311244f.png
正式分子对接
点击Edit/Delete/Delete All Molecules清空软件页面。
加载大分子蛋白和小分子配体
[*] 导入 Receptor(即大分子蛋白):Docking > Macromolecule > Set Rigid Filename…(导入后页面没有什么变化是正常的)
[*] 导入Ligand(即小分子配体):
同样的,如果你是刚刚根据上文用autodock tools处置惩罚小分子配体为pdbqt格式文件的话,选择Docking > Ligand > Choose...导入小分子配体的pdbqt格式文件
如果你是之前就处置惩罚好了小分子配体的pdbqt格式文件的话,选择Docking > Ligand > Open...。选择后,对话框显示如下,选择Accept。
https://i-blog.csdnimg.cn/direct/cb947ab27c6e482686ad69c3abc0525d.png
设置算法
一般算法选择:Docking > Search Parameters > Genetic Algorithm,默认设置,点击Accept。
但是如果你对于准确度要求不是很高,可以选择Docking > Search Parameters > Local Search Parameters,这样会快一些。
导出DPF文件
设置对接参数。ADT菜单栏:Docking > Docking Parameters…,默认设置,点击Accept。
生存算法:Docking > Output > Lamarckian GA (4.2)…。
(如果你在设置算法一步选择了Local Search Parameters,那么这里选择Local Search(4.2))
留意文件名需要手动加上后缀名.dpf。
我一般文件名命名为蛋白质PUB ID_小分子配体MOL ID后四位.dpf的格式,譬如这里的7xvy_0472.dpf
运行Dock
运行:Run > Run AutoDock,和运行Grid一样的留意事项。
如下,点击Launch后等待弹窗的任务完成,弹窗会自动消散(会比运行Grid快一些),对接完成。
https://i-blog.csdnimg.cn/direct/7e29b2ec9c9f42abb0bded8d47bc2621.png
点击Edit/Delete/Delete All Molecules清空软件页面
效果分析
打开.dlg文件:Analyze > Dockings > Open...。(可能有warning弹窗,直接选择ok就好)
显示 Receptor大分子蛋白:Analyze > Macromolecule > Open...,显示窗口自动导入 Receptor。
查看分子对接效果:Analyze > Conformations > Play, ranked by energy...。
[*]查看第一个结合点位。由于是按照能量大小的绝对值来排序的,绝对值越大的放在越前面,说明分子对接的效果越好。所以一般我们看第一个就行了。
[*]点击倒数第二个图标显示Set Play Options面板
[*]点击Show Info图标显示Conformation 1 info面板。此中我们最关注的就是binding_energy的值,这里它= -7.71
[*]点击Build H-bonds图标显示Hydrogen Bonds面板
[*]点击Write Complex图标生存成pdbqt格式文件。需要加上.pdbqt后缀,我一般命名为7xvy_0472.pdbqt
https://i-blog.csdnimg.cn/direct/1dee555bc57b4ba3b1636e0aff6bc683.png
(图中数字表示第几步调,箭头表示点击后显示什么面板。
结合能(键能)增补知识
结合能(键能):将1摩尔气态分子完全离解为气态原子所吸收的能量,单
位通常为千焦每摩尔(KJ/mol),反映了形成或断裂一个化学键所需要或释放
的能量大小,因此是化学键强度的直接体现。
结合能排序:
离子键 > 共价键 > 金属键 >> 氢键 ≈ π-cation键 > π-π堆积 > 范德华力
此中离子键、共价键、金属键属于化学键。氢键及以后属于次级键。
https://i-blog.csdnimg.cn/direct/f307353cc79e4bddad94bcf9d3582e77.png
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]