大模子+小模子协同处理跨文档理解使命,成本更低,性能更高
“Synergetic Event Understanding: A Collaborative Approach to Cross-Document Event Coreference Resolution with Large Language Models”https://img-blog.csdnimg.cn/img_convert/68d0f0561c475308b1b18b6e86343e5e.png
论文地址:https://arxiv.org/pdf/2406.02148
摘要
跨文档事件核指代剖析(CDECR)涉及将跨多个文档引用的事件提及聚类到同一实际事件。本文提出了一种协作方法,使用大型语言模子(LLM)和使命特定的小语言模子(SLM)的能力。LLM通过提示正确全面地总结事件,然后SLM在微调过程中根据这些见解优化其对事件表现的学习。实验结果表明,该方法在各种数据集上均取得了开始进的性能,突显了其在不同场景中的有用性。
https://img-blog.csdnimg.cn/img_convert/24ccafbcc6745cd6cc2d970203c53f40.png
简介
事件指代消解是信息提取中的一个告急使命,尤其在跨文档事件指代消解方面存在挑衅。现有工作实验通过微调小语言模子来解决跨文档事件指代消解,但仍然面临着复杂多样的语境和学习伪特征的问题。
本文先容了一种协作式的方法,结合了大规模语言模子和有监督序列标注模子,用于解决复杂文本中的事件关系抽取使命。该方法使用大规模语言模子的通用能力,对文本中的事件提取进行总结,然后将这些信息通报给有监督序列标注模子,以提高其对事件的理解和判断能力。实验结果表明,该方法在三个数据集上均取得了最优结果。
相关工作
CDECR早期研究使用机器学习方法和手动计划的特征,最近的神经方法使用SLM对事件提及进行编码,融合了SRL提取的不完整参数作为提及的表现。LLM在信息抽取使命中表现精彩,但与监督式SLM相比仍存在差距。有研究直接使用IE使命的标记数据对LLM进行微调,但与练习SLM相比成本效益较低。
LLM和SLM的整合是一种新兴的方法,已经在一些复杂的信息抽取使命中得到了应用。这种方法的重要挑衅在于怎样找到公道的演示来处理NULL范例的三元组,同时也存在数据分布的偏移问题。与此不同的是,我们的方法只需要LLM执行通用使命,使用其内涵能力来辅助特定使命。同时,其他研究也在使用LLM天生来辅助SLM处理CDECR使命,但这些方法需要处理多个提及对之间的关系,效率不如我们的方法。
方法
使命和基线
CDECR使命的目标是将跨多个文档的共引用事件进行分组并整合。我们将使命形式化如下:
输入:由多个文档构成的语料库,用D表现。设M表现语料库中提及的全部事件,k表现每个文档中提到的事件数,m ij表现文档i中提到的第j个事件。
输出:一组聚类,记作C。对于每一个簇Ck, ek表现簇Ck中包含的全部事件提及,ekj为簇Ck中被提及的第j个事件。
我们的基线包罗两个关键的聚类模块:候选检索和成对分类。这两个模块重要使用RoBERTa编码器对上下文进行编码,并得到事件提及的矢量表现。我们将编码过程形式化如下:
对于每一个提到m ij的事件,其向量表现为:
https://img-blog.csdnimg.cn/img_convert/3683d250b7e15735145bd239461611e7.png
得到的表现hij被输入到后续的神经网络中。
LLM摘要天生
为了处理各种范例的事件并从复杂的上下文中收集特定的细节,我们计划了一个两步工作流来提示LLM。第一步负责为文档上下文中不同范例的事件提取定制的信息。第二步的目标是扩展第一步输出中提到的实体的细节,因为实体细节通常分散在整个文档中。在每个步骤中,我们使用一个直接的提示来完成一个重要使命。我们的提示坚持简单的原则,避免额外的表明,以防止语义转移。与合成的单步工作流相比,我们的两步工作流保证每个步骤都专注于其重要目标,从而防止两个步骤之间的干扰。
https://img-blog.csdnimg.cn/img_convert/d1dd983369d281fa30299b2937fab3c5.png
在第一步中,我们指示LLM代理“详细阐明”事件提及,而不是传统的“总结”指令。术语“论述”意味着一种基于提及词自己概念的表明举动,强调来自文档上下文的细节支持。这表明LLM可以主动从上下文中选择任何相关的细节来支持这种表明,包罗上下文单词、实体提及和事件提及。这提供了一种标准化和可行的方式来理解事件,使用LLM的内涵知识和上下文理解能力,而不需要强加给LLM服从复杂的规则。
在第二步中,我们提示LLM代理使用共同引用剖析来聚合关于实体的详细信息,因为与事件相比,实体共同引用是一项更标准化的使命,并且在文档中执行它可以降低复杂性。此外,我们要求LLM根据文献的发布日期进行时间推理,进一步减少共参考证据比力中的歧义。
在这两个步骤中,我们指定了天生格式,以确保摘要中的提及范围与原始文档之间的同等性。这不仅降低了LLM的天生难度,而且有利于SLM在团结表现学习中创建两者之间的联系。
集成到末了的LLM
SLM将原始文档和天生的摘要作为输入。通过直接团结表现学习技术,新的提及向量表现可以无缝地集成到基线中。
对于提及m ij,设S ij表现天生的摘要,m ij (S)表现其中的提及。通过将原始文档d1和摘要s2毗连起来,形成一个新的文档d1’。设fenc’表现新的编码器网络。它首先对新文档Di’进行编码,得到h ij和h ij (s)的向量表现,mij和mij。然后将这些向量毗连起来,形成融合的提及向量表现h’ ij,它可以无缝地更换基线中的h’ ij,以进行后续操作。
团结表现学习过程可以表现为:
https://img-blog.csdnimg.cn/img_convert/d0d9f72008ad5dcad4610d2df430eb95.png
这种整合方法包罗将原始上下文和天生的摘要毗连起来进行团结表征学习,使得在相同的注意空间中相互学习彼此的上下文,从而增强对真正的参考相关术语的理解。
实验
实验设置
数据集。我们在三个CDECR数据集上进行了实验:事件参考库Plus (ECB+)、枪支暴力语料库(GVC)、和足球参考语料库(FCC)。
评估指标。我们使用包罗MUC、b3、CEAF、CoNLL和LEA在内的指标进行评估。
直接用LLM推测CDECR的结构。我们使用不同的上下文学习方法(包罗few-shot和zero-shot学习),在不同的上下文(如完整上下文和包含提及的句子)下测试GPT-4的性能。
结果
本文的方法并在三个数据集上取得了新的最优结果,比之前的最佳结果和改进后的基线都表现更好,尤其在 FCC 数据集上表现显著。与 GPT-4 相比,该方法使用了 LLM 的潜伏通用能力,结果更好。同时,本文还比力了 LLM 在摘要和结构推测中的效率。
https://img-blog.csdnimg.cn/img_convert/a10c9f515cf69909bef97e38889fd267.png
LLM摘要的影响
本文研究了LLM摘要在减少错误链接方面的结果。错误链接分为两种范例:误报和漏报。误报分为两个子范例:由参数引起的误报和由范例引起的误报。本文方法在减少由参数引起的误报方面表现最佳,对FCC数据集的减少约为90%。相比之下,本文方法在减少漏报方面表现较差。本文方法的有用性受到表达风格差别和缺乏必要细节的影响。与LLM改写相比,LLM摘要在全部数据集上都表现更好。
https://img-blog.csdnimg.cn/img_convert/dabafc7436c55c5a7c90b31d1d86fa09.png
https://img-blog.csdnimg.cn/img_convert/07408ffe11b7643dfa7c194aa6ecdbc3.png
https://img-blog.csdnimg.cn/img_convert/b328a265114e2fc76a5a15e954153909.png
消融分析
两步流程
通过剖析执行步骤的结果,发现第二步的全局信息扩展对于提高摘要质量更为告急,特别是在FCC数据会合。将两个步骤归并成一个步骤会导致性能下降,阐明将多目标使命分解成多个独立步骤是必要的。文章还提供了错误分析和天生摘要长度的比力。
https://img-blog.csdnimg.cn/img_convert/b63b543da3d4ea66446e445e3bd3d9f5.png
GPT-4在CDECR上的表现
结果表明,使用少量示例学习和包含提及的句子作为上下文的方法(FewMIS)可以使GPT-4达到最佳性能,但仅能达到与基于词形匹配的方法相当的结果。同时,使用全文本作为上下文会导致性能显著下降。此外,零样本学习表现出更高的召回率但显著较低的精度。研究还发现,GPT-4在区分相似但非指代性事件方面存在范围性,而在基于语义的显著叙述差别的指代性事件方面也存在困难。
https://img-blog.csdnimg.cn/img_convert/3923ea43b21440805ed71dbae3769e34.png
总结
我们计划了通用使命,以使用LLM在CDECR中的潜力,有用地弥合了LLM的通用功能与特定IE使命的复杂注释之间的差距。结果表明,通过使用LLM固有的知识和理解能力来更深入地理解事件,我们的协作方法可以减轻LLM对复杂上下文理解的挑衅,终极提高性能。
怎样学习大模子 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,以是实际上整个社会的生产效率是提升的。
但是详细到个人,只能说是:
“开始把握AI的人,将会比力晚把握AI的人有竞争优势”。
这句话,放在盘算机、互联网、移动互联网的开局时期,都是一样的原理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。资助很多人得到了学习和发展。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,以是在工作繁忙的情况下照旧坚持各种整理和分享。但苦于知识流传途径有限,很多互联网行业朋友无法得到正确的资料得到学习提升,故此将并将告急的AI大模子资料包罗AI大模子入门学习头脑导图、精品AI大模子学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
https://img-blog.csdnimg.cn/direct/80dfd54ec491457faa956c46afad1163.png#pic_center
第一阶段(10天):初阶应用
该阶段让大家对大模子 AI有一个最前沿的熟悉,对大模子 AI 的理解凌驾 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 谈天,而你能调教 AI,并能用代码将大模子和业务衔接。
[*]大模子 AI 醒目什么?
[*]大模子是怎样得到「智能」的?
[*]用好 AI 的核心心法
[*]大模子应用业务架构
[*]大模子应用技术架构
[*]代码示例:向 GPT-3.5 灌入新知识
[*]提示工程的意义和核心思想
[*]Prompt 典型构成
[*]指令调优方法论
[*]头脑链和头脑树
[*]Prompt 攻击和防范
[*]…
第二阶段(30天):高阶应用
该阶段我们正式进入大模子 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开辟一个完整的基于 agent 对话机器人。把握功能最强的大模子开辟框架,抓住最新的技术进展,适合 Python 和 JavaScript 步伐员。
[*]为什么要做 RAG
[*]搭建一个简单的 ChatPDF
[*]检索的基础概念
[*]什么是向量表现(Embeddings)
[*]向量数据库与向量检索
[*]基于向量检索的 RAG
[*]搭建 RAG 系统的扩展知识
[*]混合检索与 RAG-Fusion 简介
[*]向量模子本地部署
[*]…
第三阶段(30天):模子练习
恭喜你,如果学到这里,你基本可以找到一份大模子 AI相关的工作,自己也能练习 GPT 了!通过微调,练习自己的垂直大模子,能独立练习开源多模态大模子,把握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
[*]为什么要做 RAG
[*]什么是模子
[*]什么是模子练习
[*]求解器 & 丧失函数简介
[*]小实验2:手写一个简单的神经网络并练习它
[*]什么是练习/预练习/微调/轻量化微调
[*]Transformer结构简介
[*]轻量化微调
[*]实验数据集的构建
[*]…
第四阶段(20天):商业闭环
对环球大模子从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种情况下部署大模子,找到适合自己的项目/创业方向,做一名被 AI 武装的产物司理。
[*]硬件选型
[*]带你相识环球大模子
[*]使用国产大模子服务
[*]搭建 OpenAI 代理
[*]热身:基于阿里云 PAI 部署 Stable Diffusion
[*]在本地盘算机运行大模子
[*]大模子的私有化部署
[*]基于 vLLM 部署大模子
[*]案例:怎样优雅地在阿里云私有部署开源大模子
[*]部署一套开源 LLM 项目
[*]内容安全
[*]互联网信息服务算法备案
[*]…
学习是一个过程,只要学习就会有挑衅。天道酬勤,你越积极,就会成为越优秀的自己。
如果你能在15天内完成全部的使命,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模子 AI 的正确特征了。
这份完整版的大模子 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
https://img-blog.csdnimg.cn/direct/16d23a5ac75941ee874df3df7f04dfb4.png#pic_center
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]