文章先容了一种名为“知识图谱结构作为提示”(KG Structure as Prompt)的新方法,该方法旨在增强小型语言模型(SLMs)在知识驱动的因果发现任务中的能力。通过将知识图谱中的结构信息融入到基于提示的学习中,此方法能够提拔SLMs对于因果关系的推理能力。在生物医学和开放领域的数据集上,该方法在少量样本的环境下表现优秀,乃至凌驾了大多数基线和利用完整数据集练习的传统微调方法。此外,研究还展现了SLMs结合知识图谱和提示学习时,有潜力超越参数量更大的语言模型。
1 任务和方法
1. 任务界说
目标: 给定一对实体(e1, e2),猜测它们之间是否存在因果关系。
任务类型: 二分类问题,分类为因果或非因果关系。
数据集: 包含练习实例和关系标签的集合D={X,Y},其中每个实例x包含一个标记的变量对和对应的标签。
2. 方法概览
总体框架: 如图2所示,该方法包括生成图上下文并将其与SLMs结合进行提示学习。
图上下文生成: 从知识图谱中提取结构信息,如邻接节点和共同邻接节点,并将其转换为自然语言情势。
模型输入: 变量对、文本上下文及图上下文共同构成模型的输入。
3. 知识图谱结构作为提示
界说: 将知识图谱中的结构信息转换为自然语言形貌,形成图上下文。
图上下文情势化: 接节点: x “is connected to” [x2]x2∈V2 x,带关系标签的邻接节点: x “has” Ex,x2 “relation with” [x2]x2∈V 2x。
例如: 对于前线腺癌节点,其图上下文包括与之相邻的药物、基因等。
4. 共同邻接节点
界说: 两个节点共享的邻接节点数量越多,它们之间的关系越紧密。
公式表示: CN{x, y} = N(x) ∩ N(y)。
例如: 在Hetionet知识图谱中,乳腺癌和ERBB2之间的共同邻接节点数达到95个,表明它们之间存在密切的关系。
2 结语
本文提出了一种名为“知识图谱结构作为提示”(KG Structure as Prompt)的新方法,通过将知识图谱中的结构信息整合到小型语言模型的提示学习中,有效提拔了这些模型在有限样本条件下进行知识驱动的因果发现任务的能力。
论文题目:Knowledge Graph Structure as Prompt: Improving Small Language Models Capabilities for Knowledge-based Causal Discovery
论文链接: https://arxiv.org/abs/2407.18752
PS: 欢迎大家扫码关注公众号_,我们一起在AI的世界中探索前行,等待共同进步!
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |