【科普篇】LLM、GPT、AIGC、AI Agent、Agentic AI 到底是个啥? ...

打印 上一主题 下一主题

主题 1890|帖子 1890|积分 5670

前言

2024 年可谓是AI 大模型全面开花的一年,各大厂纷纷发布了自己的大模型应用产品,比如:


  • 腾讯的元宝
  • 阿里的通义千问
  • 字节的豆包
  • 百度的文小言
  • 月之暗面的Kimi
  • 等等
可谓是琳琅满目,好不热闹。付一张全景图:

   图引自:https://www.cluebenchmarks.com/
  信赖许多走在科技前沿的人已经实行将 AI 融入到自己的生存和工作的方方面面了,比如办公、编码、写作、搜刮等都可以通过 AI 工具来提效,可以说一旦体验过 AI 带来的提效,你将再也离不开它,它将成为你工作和生存中的得力助手。
但作为互联网从业者,除了学会使用 AI 工具来资助我们工作提效,笔者也对背后支撑它的技术感爱好,本篇文章作为科普篇了解下这些 AI 应用背后的技术要点,方便我们明白目前关于 AI 大模型的发展趋势。
LLM

Large Language Model,大型语言模型。可以说 LLM 是目前 AI 应用的基座,没有它就没有这次 AI 的技术革命。
LLM 是一种基于深度学习的人工智能模型,用于处置惩罚天然语言的各种任务。它们通常由数十亿到数万亿个参数组成的神经网络构成,通过对大量的文本数据进行练习,来学习语言的语法、语义和上下文信息,从而可以或许对天然语言文本进行明白和天生。
特点


  • 巨大的规模:LLM 通常具有巨大的参数规模,可以达到数十亿甚至数千亿个参数,这使得它们可以或许捕捉更多的语言知识和复杂的语法布局。
  • 预练习和微调:LLM 接纳了预练习和微调的学习方法。它们首先在大规模文本数据上进行预练习,学会了通用的语言表示和知识,然后通过微调顺应特定任务,从而在各种 NLP 任务中表现出色。
  • 上下文感知:LLM 在处置惩罚文本时具有强大的上下文感知能力,可以或许明白和天生依赖于前文的文本内容。
  • 多语言支持:LLM 可以用于多种语言,不但限于英语。它们的多语言能力使得跨文化和跨语言的应用变得更加容易。
  • 多模态支持:一些 LLM 已经扩展到支持多模态数据,包括文本、图像和语音。这意味着它们可以明白和天生差异媒体类型的内容,实现更多样化的应用。
  • 涌现能力:LLM 表现出令人惊奇的涌现能力,即在大规模模型中出现但在小型模型中不明显的性能提升。
应用前景

LLM 已经被广泛应用于文本天生、自动翻译、信息检索、摘要天生、聊天呆板人、假造助手等多个范畴,对人们的日常生存和工作产生了深远的影响。随着技术的不断发展,大型语言模型将在未来发挥更大的作用。
练习方式

练习语言模型需要向其提供大量的文本数据,模型利用这些数据来学习人类语言的布局、语法和语义。这个过程通常是通过无监视学习完成的,使用一种叫做自我监视学习的技术。在自我监视学习中,模型通过预测序列中的下一个词或标志,为输入的数据天生自己的标签,并给出之前的词。
技术架构

LLM 通常基于深度学习架构,如 Transformer,这有助于它们在各种 NLP 任务上取得令人印象深刻的表现。Transformer 架构由编码器息争码器组成,通过自注意力机制处置惩罚数据,发现词元之间的关系。
LLM 作为天然语言处置惩罚范畴的焦点技术,正在不断推动人工智能的发展,其潜力和应用前景非常广阔。
国内外 AI 大模型象限:

   来自https://www.cluebenchmarks.com/superclue_2410
  GPT

GPT(Generative Pre-trained Transformer)系列是由 OpenAI 开发的一系列大型语言模型,它们在天然语言处置惩罚(NLP)范畴取得了明显的希望。以下是 GPT 系列的发展脉络:


  • GPT-1(2018 年)

    • GPT-1 是系列中的第一个模型,它基于变更器(Transformer)架构,拥有 1.17 亿个参数。GPT-1 重要依赖于无监视学习,通过预练习和微调相联合的方式,在多种 NLP 任务中显现出了有用性。

  • GPT-2(2019 年)

    • GPT-2 的参数目增长到了 15 亿,显示出强大的文本天生能力。由于担心潜伏的滥用风险,OpenAI 最初并未完全公开该模型,随后在公众压力下渐渐开放了访问权限。

  • GPT-3(2020 年)

    • GPT-3 的参数目达到了 1750 亿,成为当时最大的语言模型。GPT-3 以其出色的文本天生能力和上下文明白能力,敏捷引起了广泛的应用和研究热潮。

  • ChatGPT(2022 年末)

    • 在 2022 年末,OpenAI 推出了 ChatGPT,它基于 GPT-3.5 模型,作为一个免费的研究结果预览向公众开放。ChatGPT 以其对话能力而闻名,可以或许天生连贯、相关的文本复兴。

  • GPT-4(2023 年 3 月 14 日)

    • OpenAI 在 2023 年 3 月 14 日发布了 GPT-4,这是 GPT 系列中的最新模型。GPT-4 包罗了 1.76 万亿个参数,可以或许同时处置惩罚多达 25000 个单词,是 GPT-3 处置惩罚能力的 8 倍。GPT-4 在淘汰幻觉(hallucinations)方面相比之前的版本有所改进,并且可以或许接受文本和图像提示,允许用户在视觉和语言范畴定义任务。

  • GPT-4o(2024 年 5 月 13 日)

    • GPT-4o(“o” 代表“omni”)可以或许处置惩罚和天生文本、图像和音频,实现了文本、视觉、音频的全面打通,成为一个原生的多模态模型。GPT-4o 支持了实时语音交互,得到更像人类的体验。并且针对文件处置惩罚能力、性能和布局化输出有了更多的提升。

  • GPT-o1(2024 年 09 月 13 日)

    • GPT-o1 模型是由 OpenAI 在 2024 年 9 月 13 日发布的。这一模型标志着人工智能在复杂推理任务上的重大进步,被 OpenAI 称为“新范式的开始”。GPT-o1 的发布展示了其在数理化生、英语法律经济等各个科目上的明显改进,特别是在办理博士水平的物理题目时,其表现远超之前的 GPT-4o 模型。

  • 未来发展

    • OpenAI 计划推出 GPT-5, 并致力于提供更好的个性化、更多样化和准确的相应以及加强的创造力。

GPT 系列的发展不但推动了 AI 在明白和天生人类语言方面的能力,而且还引发了关于这些技术伦理影响和社会影响的讨论。随着模型的迭代,GPT 系列不断刷新着 NLP 范畴的基准,并且其应用范围也在不断扩大,从文本完成到故事天生等多个范畴。
AIGC

**AIGC(Artificial Intelligence Generated Content,人工智能天生内容)**是一种利用天生式人工智能技术来自动创作文本、图像、视频等内容的新型内容生产方式。
我们前言所说的 AI 应用实在就是 AIGC 的落地场景,AIGC 技术依赖于 LLM 等 AI 技术来天生内容。LLM 通过学习文本数据,可以或许天生文章、故事、代码等多种情势的内容,是 AIGC 技术焦点组成部分。
对比于我们所熟知的 UGC(用户天生内容)和 PGC(专业天生内容),AIGC 的出现将给内容创作带来巨大的厘革和进步。
AI Agent

AI Agent,即人工智能署理,是一种可以或许感知情况、进行自主明白、决策和执行动作的智能实体。它基于大语言模型(LLM),具备自主明白感知、规划、记忆和使用工具的能力,可以或许自动化执行完成复杂任务的系统。
智能体架构图如下所示:

   引自:https://lilianweng.github.io/posts/2023-06-23-agent/
  LLM Agent 几个焦点组件:


  • Planning:使用 LLM 进行任务拆解,将用户的题目分解为多个子题目
  • Memory:短期记忆和恒久记忆,此中短期记忆指 LLM 的上下文,恒久记忆指外部向量存储
  • Tool:各种各样的工具,例如谷歌搜刮 API、计算器
  • Action:行动模块是智能体实际执行决定或相应的部分。面临差异的任务,智能体系统有一个完整的行动策略集,在决策时可以选择需要执行的行动,比如广为熟知的记忆检索、推理、学习、编程等。
一些出色的 AI Agents 概况

   图引自:https://github.com/e2b-dev/awesome-ai-agents
  Agentic AI

Agentic AI,署理式人工智能。Agentic AI 夸大的是 AI 的自主性和署理性,即 AI 系统可以或许在没有人类直接干预的情况下,自主地完成任务。AI Agent 是实现 Agentic AI 的关键,而 LLM 为 AI Agent 提供了处置惩罚语言和明白情况的能力。
Agentic Workflow 组件:

   图片引自:https://www.vellum.ai/blog/agentic-workflows-emerging-architectures-and-design-patterns
  一些关键特征:

  • 自主性(Autonomy): Agentic AI 系统可以或许在没有人类直接干预的情况下运作。它们可以独立地辨认题目、制定办理方案并执行这些方案。
  • 社会能力(Social Ability): 这些系统可以或许与其他署理(无论是人类照旧其他 AI 系统)进行交互和沟通,以协作完成任务。
  • 反应性(Reactivity): Agentic AI 可以或许感知其情况并对情况变化做出快速反应。它们可以根据外部事件和变化调解自己的行为。
  • 自动性(Pro-activeness): 除了对情况变化做出反应外,Agentic AI 还可以或许自动采取行动以实现其设计目的,甚至在预见到未来的需求或题目时也能自动行动。
  • 推理能力(Reasoning): 这些系统具备逻辑推理能力,可以或许基于可用信息做出决策,并预测其行动的潜伏结果。
  • 学习能力(Learning): Agentic AI 系统可以或许从经验中学习,并随着时间的推移改进其性能和服从。
  • 个性化(Personalization): 它们可以或许根据用户的行为和偏好进行个性化调解,以提供更加定制化的服务。
  • 顺应性(Adaptability): Agentic AI 系统可以或许顺应不断变化的条件和需求,机动调解策略以保持效能。
  • 透明度(Transparency): 只管 Agentic AI 系统可以或许独立运作,但它们通常也设计有透明度,使得人类可以明白和跟踪其决策过程。
  • 伦理和合规性(Ethics and Compliance): Agentic AI 系统在设计时会考虑伦理和法律框架,确保其行为符合社会规范和法律法规。
Agentic AI 的应用范围非常广泛,从自动化客户服务、智能家居控制、自动驾驶汽车到复杂的业务流程管理等。随着技术的进步,Agentic AI 系统正变得越来越复杂和智能,它们在进步服从、优化决策和加强用户体验方面发挥着越来越重要的作用
总结



  • LLM 是这些概念中的底子技术,为其他概念提供了明白和天生天然语言的能力。
  • ChatGPT 是 LLM 的一个具体应用,专注于对话系统。
  • AIGC 依赖于 LLM 等技术来天生内容。
  • AI Agent 是 LLM 的高级应用,联合其他技术实现更复杂的任务。
  • Agentic AI 是目前的发展方向,夸大自主性和署理性,AI Agent 是实现这一目的的关键。
写在末了

在整理这篇文章我也在感叹技术发展的变化之快,自从 OpenAI 发布 ChatGPT 以来,基本隔一段时间就有突破我们认知的事变在发生,然而这些事变到底对于我们平凡人产生什么影响,这是需要我们躬身入局去体验和思考的地方,未来已来,我们需要以更开放和包容的心态去应对天下所发生的变化,打不过就加入吧。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
继续阅读请点击广告

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

北冰洋以北

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表