所以,以前的应用构建逻辑跟以后的会出现很大的差别。以前的应用是我办个事变,顺便玩个游戏。以后的应用大概率都会是找乐子的时间把事给办了。当前最典型的就是正刷着抖音,然后顺部下单购个物。 Agent 架构
特别阐明: 本文中绝大多数对Agent的思想与构建都来自《A survey on large language model based autonomous agents》这篇综述文章,我们对里面的一些理念做了工程实现与落地应用。
我们言归正传,今天我们要讲的是Agent(智能体),更准确的说,是自主智能体。Agent跟Copilot这两个词相信大家都不生疏了,这一年多的时间里面有非常多的干系产品与技术的演进与讲解,在这里我再从架构思索、源码实现、应用以及遇到的挑衅出发,将我们对智能体思索与探索做一个分享。
1、 什么是自主智能体?
An autonomous agent is a system situated within and a part of an environment that senses that environment and acts on it, over time, in pursuit of its own agenda and so as to effect what it senses in the future. ---- Franklin and Graesser (1997)
目标, 设定智能体的目标: Read the provided historical messages, collect various analysis SQLs, from them, and assemble them into professional reports.
性格、社会关系等约束条件设定。You are only responsible for collecting and sorting out the analysis SQL that already exists in historical messages, and do not generate any analysis sql yourself. etc
多路径推理:此方法中,推理步骤生成的终极计划是一棵数结构,其中每一步可能会有多个子步骤,这个方法类似于人类的思索,在每一步上会有多个选择。CoT(Chain Of Thoughts认为每个复杂问题都有多种思维方式来推导出终极答案。因此通过CoT的方式生成一系列的推理步骤。多路径推理中常用的方法有CoT(Chain Of Thoughts)、ToT(Tree Of Thoughts)、GoT(Graph Of Thoughts)、AoT(Algorithm of thoughts)等。在每个步骤中,他们起首生成多个可能的后续步骤,然后根据可接收的行动的距离来确定终极步骤。