最强自动化Agent生成器:Captain Agent

打印 上一主题 下一主题

主题 704|帖子 704|积分 2112

导言

大家好作为一名工程师,我平时致力于提供使用大型语言模型(LLM)的聊天服务,尤其是在改进RAG体系方面,我们每天都面对着各种挑战。
在本文中,我将扼要介绍一种有效构建解决题目的Agent团队的方法——Captain Agent。
 
 
摘要

Captain Agent的特点在于,它能够针对任意题目使用署理进行题目解决,并在得到结果后进行反馈,再重新构建解决题目的署理。由于能够根据每个题目自动构建所需的署理,因此无需事先为特定任务创建署理。别的,通过动态创建署理,能够更加机动地应对各种题目。
有关更详细的内容,请参考以下论文。
https://arxiv.org/pdf/2405.19425
https://arxiv.org/pdf/2405.19425
题目意识

署理的限定

署理是一个框架,使大型语言模型(LLM)能够使用工具执行任意操作或获取外部信息。即使是单一署理,也可以通过调整实现各种操作,比方通过网络搜索信息或发送电子邮件。然而,在处置惩罚复杂任务时,单一署理的精度存在题目。
多署理使用的设计题目

为了克服署理精度方面的题目,创建多个目标明确的署理并根据任务进行组合的方法被认为是有前途的。然而,如何设计这些署理并没有标准化的方法。
针对这一题目,Captain Agent专注于如何构建有效的署理群体以解决题目。终极,这种方法在题目解决能力上表现出比之前提出的多署理方法更高的效率。
方法

Captain Agent 通过以下游程来输出结果:

  • 思量解决任务的步调:针对给定的任务,起首思考解决该任务的具体步调。
  • 分解为子任务:将解决步调细化为多个子任务。
  • 创建多署理团队:为解决子任务,创建一个多署理团队。
  • 署理团队解决子任务:署理团队协作解决子任务。
  • 回首和输出反思:子任务完成后,对整个过程进行回首和反思,并输出反馈。
  • 调整并重新开始或输出终极结果:根据反馈调整子任务或署理团队,然后从第4步重新开始,或竣事任务并输出终极结果。
更详细的方法说明

多署理团队构建
Captain Agent 会将给定任务分解为多个子任务,并确定每个子任务所需的角色。然后从一个包含署理和工具的库中获取所需的署理和工具,构建一个得当的署理团队。如果没有满足要求的署理存在,体系会基于工具新建署理并加以使用。
子任务解决
署理团队使用对话和各自的工具来解决子任务。一旦子任务完成,反思用的LLM会对对话记载进行回首,并向Captain Agent提供反思报告。基于这份报告,Captain Agent决定是否重新构建团队、添加新的子任务指示,或完成任务。
署理团队的对话
选定的署理使用名为AutoGen的框架进行相互对话,以解决子任务。详细内容可以参考AutoGen的相关论文。
https://arxiv.org/pdf/2308.08155
https://arxiv.org/pdf/2308.08155
反省过程的详细说明

反省报告是基于署理团队的对话和输出结果,包含以下内容:

  • 任务概述:扼要说明所解决的任务。
  • 解决结果:详细描述任务的解决结果。
  • 结果的原因:表明为什么得出这些结果。
  • 对话中的题目:指出对话过程中出现的题目。
  • 是否需要再检验:判断是否需要对结果进行重新检验。
  • 其他附加信息:提供其他有助于改进的附加信息。
在反省过程中,重要关注以下几点:


  • 检测对话内容和结果中的矛盾之处。
  • 判断是否需要重新查察解决方案。
  • 提供关于是否需要重新组建署理团队的反馈。
通过以上步调,确保每个子任务的解决过程得到充分的反思和改进,使得Captain Agent能够在任务解决过程中不断优化和进步效率。
结果

在论文中,起首对现有的多智能体任务解决方法在精度方面进行了比力。比力包含6个项目。

这里所提示的比力项目中,全部项目的精度都有3~5%左右的提升。
别的,对于“天下信息检索场景”这一任务,即高效地搜索信息并敏捷收集所需数据或信息,得到了如下结果。

关于这一点,与比力的其他方法相比,所提出的方法取得了最优的结果,并且提到了将提示工程降到最低。
接下来,为了验证动态重组智能体团队的方法是否有效,论文对固定团队和动态生成团队的精度进行了比力。

除物理任务外,几乎全部任务的性能都有所提升,证明白动态生成智能体团队的有效性。
最后,论文比力了预先定义并加载使用的智能体和工具对性能的改善结果。

在天下信息检索场景中,通过事先对智能体和工具进行一定程度的定义,精度得到了明显的提升。
考察

本次介绍的论文讨论了在实际天下中使用LLM(大规模语言模型)来高效解决题目的新方法。比力所用的任务中,许多任务仅靠LLM的简单执行难以解决,需要对任务进行分解。通过比力可以看出,新方法在这些任务上的表现优于传统方法,这表明该方法具有较高的性能。
别的,通过对固定智能体团队和动态变化的智能体团队进行性能比力,发现动态生成智能体团队的性能有所提升,这进一步证明白动态生成智能体团队的有效性。
然而,从结果的最后表格中可以看出,预先定义的智能体和工具对于进步精度是必要的。因此,与其他方法相比,这些结果可能并不完全是由于方法自己的精度差别,而是预先预备的提示工程所带来的差别,因此这一点需要注意。
别的,尽管论文中没有提到执行时间,但可以推测,由于涉及团队的动态构建,执行时间可能会大幅增加。
以上两点在实际应用中需要事先辈行验证。
总结

自从LLM广泛普及以来,关于使用工具智能体的各种研究不断涌现。为了进一步进步精度,研究人员开始探索多智能体协作的方法。本次介绍的Captain Agent方法便是此中的最新研究之一。
这篇论文的亮点在于,动态重组智能体对精度的提升有明显贡献。这表明LLM能够识别并选择得当的解决方案,可能应对更复杂的任务。
希望在使用LLM解决复杂题目时,这篇论文能为您提供参考。


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

北冰洋以北

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表