Bioinformatics|PocketDTA:一种先进的多模态架构,通过靶标联合口袋的3D结 ...

打印 上一主题 下一主题

主题 990|帖子 990|积分 2970

本日给大家分享一篇发表在Bioinformatics上的论文:“ PocketDTA: an advanced multimodal architecture for enhanced prediction of drug−target affinity from 3D structural data of target bindin g pockets”。该论文提出了一种基于先进多模态架构的PocketDTA模型,用于从目的联合口袋的3D布局数据中增强药物-目的亲和力的预测。
1介绍

药物-目的亲和力预测是药物发现过程中的关键环节,它依赖于对药物(配体)与目的(通常是卵白质)之间相互作用强度的正确评估。传统的计算方法,如分子对接(molecular docking)和分子动力学模拟(molecular dynamics simulation),固然可以大概准确模拟药物与目的的联合过程,但在面临复杂多变的生物分子布局时,其计算服从和正确性往往受到限定。
近年来,随着人工智能和深度学习的飞速发展,多模态架构在药物-目的亲和力预测中显现出了巨大的潜力。其中,PocketDTA作为一种先进的多模态架构,可以大概从目的联合口袋的3D布局数据中提取关键信息,从而显著增强药物-目的亲和力的预测能力。在本文中,作者提出了一种名为PocketDTA的新方法,该方法不仅融合了药物和目的的序列与布局信息,还通过几何深度学习技术准确捕获了目的联合口袋的3D特性。与传统方法相比,PocketDTA在保持较低计算复杂度的同时,实现了更高的预测精度。在与当前最优方法(SOTA)的比较中,PocketDTA在多个评估指标上均显现出了显著优势。
值得注意的是,PocketDTA的成功不仅在于其先进的模型架构,更在于其对数据质量的深刻理解和优化。作者通过提取高置信度的卵白质3D坐标,并对联合口袋举行预处理惩罚,显著提高了模型对药物-目的亲和力的预测能力。这一发现进一步强调了数据质量在推动药物发现范畴进步中的重要性。
2模型方法


PocketDTA的总体流程如下:
(A)数据预处理惩罚模块:包罗更新目的序列、移除冗余样本、获取目的的三维坐标、提取高精度卵白质布局域以获取准确的三维坐标,以及获取目的联合口袋等步骤。
(B)多模态表现与特性提取模块:涉及药物和目的的序列与布局表征,随后举行特定的特性提取过程。
(C)交互融合模块:将(B)中提取的药物和目的特性举行融合,并使用双线性注意力网络模拟它们之间的相互作用。
GraphMVP-decoder

为了准确捕获分子3D布局的细微特性,作者开辟了GraphMVP-Decoder。该解码器起首根据药物布局表现计算位置嵌入,然后将其整合以保存空间位置信息。接着,解码器使用全毗连层举行降维,并对局部特性举行开端提取:
接着作者采用CNN滑动窗口机制对药物局部特性举行进一步细化。别的,为了适应数据的复杂性,作者使用了GLU激活函数,其门控机制相比其他激活函数更有效地过滤输入并突出关键信息。同时,为了提高练习的稳定性并加速收敛速度,作者引入了残差毗连、缩放因子和LayerNorm。解码器可以表现为:

GVP-GNN层

为了深入探究目的口袋的几何与空间特性,作者采用了先进的几何向量感知机来建模卵白质图。GVP被视为线性变换的扩展,可以大概将特性元组处理惩罚成新的元组。最关键的是,GVP具有一个理想的特性:其标量和向量输出在三维欧几里得空间中的旋转和反射操作下体现出稳定性和等变性。具体而言,如果,那么对于任何旋转和反射变换R,都有。稳定性表明,在变换R下,标量s保持稳定,即输出标量不受此类变换的影响。等变性确保对向量应用的任何变换R都会在输出向量中产生相应的变换。这一特性使得GVP在学习三维空间中的几何特性时,相比其他神经网络模型具有更强的表达能力。
GVP-GNN使用GVP来增强模型对几何布局特性的识别能力,通过消息传递机制来更新节点嵌入。GVP-GNN架构包含两层:图流传层和前馈层。图流传层起首根据节点和边嵌入计算一个消息,然后应用这个消息来更新节点嵌入。具体而言,第l层的图流传层可以表现为:
其中,表现第 层中节点 的嵌入, 代表从节点 到节点 的边嵌入, 表现三个堆叠的GVP(几何向量感知机)层, 象征在第 层中从节点传递到节点的消息,而 表现节点的邻接节点聚集。随后,前馈层继承对节点嵌入举行细化,这一过程可以形貌为:
其中,表现两个堆叠的GVP(几何向量感知机)层。
为了进一步学习目的联合口袋的三维布局信息,作者开辟了定制的GVP-GNN层,该层联合了GVP(几何向量感知机)和GVP-GNN,以卵白质图 作为输入。起首,通过一个单独的GVP层对边和节点特性嵌入举行开端提取。随后,这些数据被共同输入到N层的GVP-GNN中举行信息融合以及节点和边嵌入的更新。最后,通过GVP层对整合后的信息进一步处理惩罚,该框架可以形貌为:

为了促进后续的特性融合,作者采用了与目的序列表现中相同的操作来转换 。

双线性注意力网络

为了构建包含全局和局部信息的药物靶点多模态表现,实验以下操作:
其中, 和 。
输入D = [d1, d2, …, dm+1]ᵀ 和 T = [t1, t2, …, tp+1]ᵀ 分别通过简单的线性层和ReLU激活函数映射到一个共享的特性空间。然后,使用Hadamard积计算它们之间的成对交互矩阵
其中, 表现可学习的权重向量,表现Hadamard积(元素对应相乘),权重矩阵,,以及Dropout操作 是一个随机扬弃操作。为了更清晰地理解双线性交互权重矩阵,矩阵A中的元素可以表现为:
接着,为了得到交互表现,作者通过双线性乘积来构造:
随后,对交互表现向量J举行池化和归一化操作:
最后,将交互表现J0直接输入到多层感知机(MLP)中,以生成预测值y:

3实验与结果

数据集与评估指标

实验中,使用了两个公开可用的基准数据集,即 Davis 和 KIBA ,来评估 PocketDTA 的性能。
评价指标包罗均方偏差(MSE)、一致性指数(CI)、决定系数(r²)、皮尔逊相关系数(Pearson)和斯皮尔曼品级相关系数(Spearman)等统计指标。
对比实验

各种表现方法的比较分析



  • 在实验中研究了各种药物及其靶标的序列和布局特性,以确定最适合药物-靶标亲和力(DTA)任务的特性。
  • 在药物序列表现方面,评估了Morgan指纹、Mol2Vec和Mole-BERT等分子嵌入方法。研究结果表明,在两个基准数据集上,根据所有性能评价指标,Morgan指纹的体现均优于其他方法
  • 在药物布局表现方面,比较了GraphMVP、GraphMVP-C、GraphMVP-G和3Dinfomax等方法。在这些方法中,GraphMVP体现最佳,逾越了其他技术
  • 在靶标序列表现方面,评估了领先的卵白质预练习模型的嵌入:ESM-2、ProtBert和ProtT5。图3C表现,在Davis数据集上,ProtBert的体现优于其他模型,而ESM-2在KIBA数据集上体现最佳。
  • 在靶标布局表现方面,评估了从原始和处理惩罚后的卵白质三维坐标预测中得出的前三个联合口袋的总序列长度和平均pLDDT值分布。结果表明,更高置信度的布局信息可以提高性能,这表明数据质量的改进对于推动药物-靶标亲和力(DTA)范畴的发展至关重要。
图1.基准数据集上各种表现方法的MSE条形箱形图比较分析
评估口袋数量变化的影响

表1. 基准数据集上差异口袋数量情境下预测结果的比较分析。

如表1所示,在所有评估指标中,使用前3个预测的联合口袋作为靶标布局输入得到了最佳性能。别的,由于前3个口袋已经包含了大多数的联合位点,因此决定选择前3个联合口袋。
与SOTA方法的性能比较评估

表2. PocketDTA与其他SOTA模型在基准数据集上的性能比较分析。
如表2所示,在两个基准数据集上,采用一致的实验设置,对PocketDTA与当前最优技术方法(包罗DeepDTA、GraphDTA、FusionDTA、MGraphDTA、3DProtDTA、NHGNNDTA和MDFDTA)举行了比较评估。
冷启动实验

使用了三种新颖的数据集分割计谋:冷药物、冷靶标和全部冷启动,以评估DTA模型的泛化性能。表3展示了KIBA数据集上的冷启动实验结果。与其他基准模型相比,PocketDTA在三种数据分割方法下均体现出良好的预测性能,凸显了模型适应新环境的鲁棒性。
表3. KIBA数据集实际设置下的性能评估。

4总结

本文介绍了一种新的端到端药物-靶标亲和力(DTA)预测方法——PocketDTA,该方法在数据集质量提升、3D布局信息的有效使用、多模态生物表征以及局部相互作用的可解释性方面做出了重要贡献。在实际应用于药物筛选时,该模型仍存在范围性。由于练习集中亲和力值分布不均,导致预测结果也出现了雷同的聚合征象。因此,扩展和多样化DTA基准数据集被以为是提高深度学习DTA模型泛化能力的关键。
怎样学习AI大模型 ?

“开始掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的原理。
我在一线互联网企业工作十余年里,指导过不少偕行子弟。资助很多人得到了学习和成长。
我意识到有很多履历和知识值得分享给大家,故此将并将重要的AI大模型资料包罗AI大模型入门学习思维导图、佳构AI大模型学习册本手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

怀念夏天

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表