字节跳动开源 LangManus:不止是 Manus 平替,更是下一代 AI 主动化引擎 ...

打印 上一主题 下一主题

主题 1579|帖子 1579|积分 4737

当 “AI 主动化” 成为科技领域最炙手可热的关键词,我们仿佛置身于一场激动民气的厘革前夜。各行各业都在翘首以盼,期待 AI 技术可以或许真正解放生产力,将人类从繁琐重复的工作中解脱出来。在这个充满无限大概的时代,字节跳动悄然发布了一款重量级开源项目——LangManus

LangManus 的出现,如同在平静的湖面投下了一颗石子,激起了层层涟漪。它不光仅是一个被看作是智能体协作平台 Manus 的 “平替” 项目,更被寄予厚望,有望成为下一代 AI 主动化引擎的基石,推动 AI 主动化技术的遍及和发展。
LangManus 的雄心勃勃,不光仅停顿在标语上。它深度整合了强盛的大语言模子(LLM)能力,并巧妙地将网络搜刮、网页爬取、Python 代码执行等多种实用工具融为一体,目标直指复杂使命的主动化办理。 这不禁让人好奇,LangManus 究竟是如何构建起云云强盛的主动化能力?它又将如何重塑我们对 AI 主动化的认知?又将如何赋能开发者,开启 AI 主动化的新篇章?
今天,就让我们一同拨开 LangManus 的神秘面纱,深入探寻其背后的技术逻辑与无限大概。
AI 主动化的新变量:从 Manus 到 LangManus 的跃迁


在 AI 主动化的发展历程中,智能体(Agent) 扮演着至关紧张的角色。它们如同具备自主意识的 “数字员工”,可以或许理解指令、规划使命、调用工具,并最终完成目标。在众多智能体平台中,Manus 以其独特的智能体协作模式脱颖而出,为复杂使命的处理提供了全新的思绪,展现了 AI 主动化在办理复杂问题方面的巨大潜力。
然而,Manus 并非完美无缺。作为一个相对封闭的平台,其开放性和可定制性受到一定的限制。 正是在如许的配景下,字节跳动开源了 LangManus,试图在 Manus 的基础上,构建一个更开放、更强盛、更机动的 AI 主动化平台。
LangManus 的诞生,不光仅是技术上的简单复刻,更是一次对 AI 主动化将来发展方向的深刻探索。它从一开始就选择了 “开源” 这条道路,将自身置于全球开发者社区的聚光灯下,接受来自各方的审阅和改进。 这种开源的底色,注定了 LangManus 将拥有更强盛的生命力和更广阔的发展远景。
LangManus 的目标不光仅是成为 Manus 的 “平替”,更宏大的愿景是构建一个 AI 主动化开源生态,将 LLM 的强盛能力与各种实用工具以前所未有的方式联合起来,真正实现使命的主动化处理,并将技术红利回馈给整个开发者社区,共同推动 AI 主动化技术的进步。 这,才是 LangManus 真正的野心地点。
LangManus 技术解构:多智能体协作驱动的主动化引擎

LangManus 可以或许承载云云宏大的愿景,绝非空穴来风。其核心竞争力,源于其精良的技术架构和丰富的功能特性。 它不光仅是一个简单的工具集合,更是一个 精心计划的主动化引擎,可以或许驱动多个智能体高效协同工作,共同完成复杂使命。
1. 多智能体体系:精细分工,高效协作
LangManus 的核心架构是 多智能体体系。 它并没有采用 “单打独斗” 的模式,而是将复杂的主动化使命分解为多个子使命,并分配给差别的智能体协同完成。 这种 “分而治之” 的计谋,极大地提升了使命处理的效率和机动性。
在 LangManus 的智能体体系中,各个智能体角色分工明确,各司其职,如同一个高效运转的团队:


  • 协调员 (Coordinator): 作为使命的入口,协调员负责汲取用户的指令,理解用户的意图,并将使命分解并分配给符合的智能体。 它如同团队的 “项目经理”,负责使命的整体调度和分配。
  • 规划员 (Planner): 当汲取到的使命较为复杂,必要多步骤才气完成时,规划员就 역할이 한다. 它负责订定详细的使命执行筹划,将复杂使命拆解为一系列可执行的子使命,并规划好各个子使命的执行顺序和依赖关系。 规划员如同团队的 “战略家”,负责订定使命的整体执行计谋。
  • 主管 (Supervisor): 主管是使命执行的指挥中央。 它负责监督整个使命的执行过程,监控各个智能体的运行状态,并根据使命执行情况动态调整使命分配和执行计谋。 在使命执行过程中,主管还可以根据必要调用其他智能体,比方研究员、步调员、欣赏器等,来协助完成使命。 主管如同团队的 “指挥官”,负责使命的执行指挥和调度。
  • 研究员 (Researcher): 研究员是信息的探索者,负责网络搜刮和数据挖掘。 当使命必要从互联网上获取信息时,研究员就会被调用。 它可以或许利用网络搜刮工具(如 Tavily API)快速准确地找到所需的信息,并将信息提供给其他智能体使用。 研究员如同团队的 “谍报专家”,负责信息的网络和挖掘。
  • 步调员 (Programmer): 步调员是代码的创造者,负责编写和执行 Python 代码。 当使命必要执行特定的计算或逻辑操作时,步调员就会被调用。 它可以或许根据使命需求,编写相应的 Python 代码,并在 LangManus 提供的代码执行环境中运行代码,并将结果返回给其他智能体。 步调员如同团队的 “工程师”,负责代码的编写和执行。
  • 欣赏器 (Browser): 欣赏器是网页的操控者,可以或许模仿用户在欣赏器中的各种操作,比方点击链接、填写表单、滚动页面等。 当使命必要在网页上进行交互时,欣赏器就会被调用。 它可以主动化完成网页上的各种操作,并将网页内容提取出来供其他智能体使用。 欣赏器如同团队的 “网页操作员”,负责网页的主动化操作。
  • 报告员 (Reporter): 报告员是结果的出现者,负责整理使命执行的最终结果,并天生结构化的报告。 报告可以以多种形式出现,比方文本报告、表格报告、图表报告等,方便用户理解和使用使命执行结果。 报告员如同团队的 “信息分析师”,负责结果的整理和出现。
通过以上这些智能体的精细分工和高效协作,LangManus 可以或许有效地处理各种复杂主动化使命,展现出强盛的主动化能力。
2. LLM 深度集成:三层 LLM 体系,机动应对差别场景
LangManus 的核心驱动力,来自于对大语言模子(LLM)的深度集成。 它不光仅简单地调用 LLM 的 API,而是构建了一个 三层 LLM 体系,充分发挥 LLM 在差别场景下的优势。


  • 推理 LLM: 位于最上层的是推理 LLM,它紧张负责 高条理的决议和推理。 比方,协调员智能体和规划员智能体就紧张依赖推理 LLM 的能力,来理解用户指令、订定使命筹划、分配使命等。 推理 LLM 必要具备强盛的语言理解能力、逻辑推理能力和规划能力。 LangManus 兼容多种主流 LLM,比方 Qwen、OpenAI 等,开发者可以根据实际需求选择符合的推理 LLM。
  • 基础 LLM: 位于中央层的是基础 LLM,它紧张负责 基础的语言处理使命。 比方,主管智能体、研究员智能体、报告员智能体等都必要使用基础 LLM 的能力,来进行信息抽取、文本天生、报告撰写等使命。 基础 LLM 必要具备良好的文本天生能力和信息抽取能力。 LangManus 可以机动配置基础 LLM,以顺应差别的使命需求和成本预算。
  • 视觉语言 LLM: 位于最底层的是视觉语言 LLM,它紧张负责 处理视觉信息。 比方,当欣赏器智能体必要处理网页上的图像信息时,就必要调用视觉语言 LLM 的能力,来理解图像内容、辨认图像元素等。 视觉语言 LLM 的集成,使得 LangManus 可以或许处理更加复杂的网页主动化使命,比方图像辨认验证码、网页截图分析等。
通过构建这三层 LLM 体系,LangManus 可以或许充分利用差别 LLM 的优势,机动应对各种复杂的主动化场景,实现更高效、更智能的主动化使命处理。
3. 强盛的工具生态:功能丰富,扩展性强
除了强盛的智能体体系和 LLM 集成,LangManus 还拥有一个 功能丰富的工具生态,为使命的执行提供了强盛的支持。 这些工具涵盖了网络搜刮、信息检索、代码执行、网页操作等多个方面,满足了各种主动化使命的需求。
LangManus 集成的紧张工具包括:


  • 网络搜刮 (Tavily API): 用于从互联网上搜刮信息,支持关键词搜刮、天然语言搜刮等多种搜刮方式。
  • 神经搜刮 (Jina): 用于进行向量相似度搜刮,可以高效地检索与给定向量最相似的文档或信息。
  • Python REPL 和代码执行环境: 用于执行 Python 代码,支持代码的动态执行和结果的实时反馈。
  • 欣赏器控制: 用于主动化控制欣赏器,模仿用户在欣赏器中的各种操作,比方网页欣赏、表单填写、数据抓取等。
这些工具并非是孤立存在的,而是可以被 LangManus 的智能体体系机动调用和组合使用,以完成各种复杂的主动化使命。 别的,LangManus 还具有良好的 扩展性开发者可以根据自己的需求,轻松地添加新的工具,扩展 LangManus 的功能。
4. 可视化工作流管理:清晰掌控使命执行过程
为了方便用户管理和监控主动化使命,LangManus 提供了 可视化的工作流管理功能。 用户可以通过 Web 界面清晰地查看使命的工作流程图,了解使命的执行进度、各个智能体的运行状态、以及使命的执行结果。
工作流程图 以图形化的方式展示了使命的执行流程,包括各个智能体之间的协作关系、使命的执行步骤、以及数据的流转路径。 用户可以通过工作流程图直观地了解使命的整体执行逻辑。
使命分配监控 功能可以实时监控各个智能体的使命分配情况和执行状态。 用户可以查看当前正在运行的使命、已完成的使命、以及使命的执行日记,及时发现和办理使命执行过程中出现的问题。
可视化工作流管理功能的加入,极大地提升了 LangManus 的易用性和可维护性,使得用户可以或许更加方便地管理和监控主动化使命的执行过程。
5. API 服务:便捷集成,机动扩展
为了方便开发者进行二次开发和集成,LangManus 提供了基于 FastAPIAPI 服务,并支持 流式传输开发者可以通过 API 接口,将 LangManus 集成到自己的应用步调或体系中,实现更加机动和定制化的主动化功能。
API 服务支持 流式传输,这意味着在处理大量数据或长时间运行的使命时,可以实时地将结果返回给客户端,而无需等待整个使命执行完成。 流式传输技术可以有效地提升用户体验,并低落体系的资源消耗。
基于 FastAPI 构建的 API 服务,具有高性能、易扩展、易使用等优点,方便开发者快速构建各种基于 LangManus 的主动化应用。
6. 兼容 AWS Graviton 和 Docker:性能与易用性兼顾
LangManus 还特别强调了对 AWS GravitonDocker 的支持。
AWS Graviton 是亚马逊云科技推出的基于 ARM 架构的处理器,具有高性能、低功耗、高性价比等优点。 LangManus 对 AWS Graviton 的支持,意味着用户可以在 AWS Graviton 实例上部署 LangManus,获得更高的性能和更低的成本。
Docker 是一种流行的容器化技术,可以将应用步调及其依赖项打包成一个独立的容器,方便应用步调的部署和管理。 LangManus 对 Docker 的支持,使得用户可以更加方便地部署和运行 LangManus,并实现应用步调的快速迭代和升级。
对 AWS Graviton 和 Docker 的支持,体现了 LangManus 在 性能和易用性 方面的双重寻求,力求为用户提供更加高效、便捷的主动化办理方案。
快速上手:几行命令,开启 LangManus 之旅

想要切身体验 LangManus 的强盛功能吗? 上手 LangManus 非常简单,只需几行命令,即可快速搭建起 LangManus 的运行环境,并开始构建你的主动化应用。
1. 安装依赖
起首,你必要安装 LangManus 运行所依赖的一些软件包。 LangManus 保举使用 uv 包管理器,它比传统的 pip 包管理器更快更高效:
  1. pip install uv   # 推荐使用 uv 包管理器
复制代码
然后,使用 Git 克隆 LangManus 的代码堆栈到本地:
  1. git clone https://github.com/byteplus/lang-manus.git
  2. cd lang-manus
复制代码
进入 lang-manus 目录后,使用 uv pip 安装项目依赖:
  1. uv pip install -r requirements.txt
复制代码
LangManus 的欣赏器智能体依赖于 playwright 库,你必要安装 playwright 欣赏器驱动:
  1. playwright install
复制代码
2. 配置 API 密钥和模子信息
安装完成后,你必要配置 LangManus 所需的 API 密钥和模子信息。 在 LangManus 项目根目录下,有一个 .env 文件,你必要将你的 API 密钥(比方 OpenAI API Key、Tavily API Key 等)以及你想要使用的 LLM 模子信息配置到这个文件中。
.env 文件中大概包含以下配置项(详细配置项大概会根据 LangManus 版本有所变化,请参考 LangManus 官方文档):
  1. OPENAI_API_KEY=your_openai_api_key
  2. TAVILY_API_KEY=your_tavily_api_key
  3. LLM_MODEL_NAME=gpt-3.5-turbo  # 你想要使用的 LLM 模型名称
复制代码
请根据你的实际情况,将 your_openai_api_key、your_tavily_api_key 和 gpt-3.5-turbo 替换为你自己的 API 密钥和模子名称。
3. 启动 LangManus Web UI
完成配置后,你就可以使用以下命令启动 LangManus 的 Web 用户界面了:
  1. python webui.py
复制代码
运行该命令后,LangManus Web UI 将会在本地启动,你可以在欣赏器中访问 http://localhost:8000(默认地址)来体验 LangManus 的各种功能。
4. 更多详细步骤
以上只是 LangManus 的快速上手指南,更详细的安装和配置步骤,以及更多高级功能的使用方法,请参考 LangManus 官方 GitHub 堆栈中的文档。 LangManus 官方文档提供了非常详细的说明和示例,可以资助你更深入地了解和使用 LangManus。
快应用场景:LangManus 的无限大概

LangManus 的应用场景非常广泛,险些涵盖了所有必要主动化使命处理的领域。 无论是企业内部效率提升,照旧个人效率工具的打造,LangManus 都能发挥紧张的作用。 其核心功能是在大模子的基础上完成使命主动化,即主动化处理多步骤、复杂性的使命,让繁琐的工作变得简单高效。
以下是一些 LangManus 的典范应用场景:
1. 主动化周报天生: 告别手动整理数据、撰写周报的繁琐工作。 利用 LangManus,可以主动化地从各种数据源(比方数据库、Excel 表格、在线报表等)网络数据,并使用 LLM 智能分析数据,主动天生内容详实、图文并茂的周报。
2. 智能客服体系: 构建 7x24 小时在线的智能客服体系,快速相应用户问题,提供高效、便捷的客户服务。 LangManus 可以集成到各种客服平台,主动化处理用户咨询、解答常见问题、处理投诉建议等,有效提升客户服务效率和用户满意度。
3. 企业级私密部署方案: 对于对数据安全和隐私有较高要求的企业,LangManus 提供了企业级私密部署方案。 企业可以将 LangManus 部署在自己的私有服务器或云平台上,确保数据安全可控,满足企业内部的主动化需求。
4. 人力资源:智能简历筛选: 在招聘季,HR 部分必要处理大量的简历。 利用 LangManus,可以主动化地筛选简历,根据预设的条件(比方学历、工作经验、技能等)快速筛选出符合要求的简历,大幅提升招聘效率。
5. 房产决议:数据驱动分析: 在进行房产投资决议时,必要网络和分析大量的房产数据。 LangManus 可以主动化地从各种房产网站、数据平台抓取数据,并利用 LLM 分析数据,辅助投资者进行房产投资决议。
6. 观光规划:个性化行程保举: 观光规划每每必要耗费大量的时间和精力。 LangManus 可以根据用户的个性化需求(比方观光目的地、观光时间、预算、爱好爱好等),主动化地天生个性化的观光行程保举,包括景点保举、旅店预订、交通规划等,一键搞定观光筹划。
除了以上这些典范场景,LangManus 还可以应用于舆情监控、内容创作、市场调研、金融分析、智能家居等众多领域,其应用潜力险些是无限的。 开发者可以根据自己的想象力和创造力,利用 LangManus 构建各种各样的主动化应用,提升工作效率,解放生产力。
开源的气力:LangManus 的独特优势与将来预测

诚然,LangManus 的目标是向 Manus 看齐,甚至逾越 Manus。 但开源赋予了 LangManus 独特的优势,这是 Manus 等封闭平台所无法比拟的。
开源意味着更多的大概性。 LangManus 的代码完全公开透明,全球开发者都可以自由地查看、修改、使用和分发 LangManus 的代码。 这种开放性吸引了全球开发者的眼光,激发了社区的创新活力,促进了技术的快速迭代和发展。
开源意味着更强盛的社区支持。 LangManus 的开源模式,使其可以或许汇聚全球开发者的智慧和气力。 开发者可以共同参与 LangManus 的开发和维护,贡献代码、提交 Bug、提出建议,共同推动 LangManus 的进步。 强盛的社区支持是 LangManus 持续发展的坚实后盾。
开源意味着更广阔的应用远景。 LangManus 的开源特性,低落了使用门槛,使得更多的开发者和企业可以免费使用 LangManus,并根据自己的需求进行定制和扩展。 开源模式加速了 LangManus 的遍及和应用,使其可以或许在更广泛的领域发挥作用。
只管 LangManus 目前还处于快速发展阶段,在某些方面大概另有提升空间,但它所代表的 开源气力,必将推动 AI 主动化技术的快速发展,并深刻地改变我们的工作和生活方式。 我们有来由相信,在字节跳动以及全球开源社区的共同积极下,LangManus 将在 AI 主动化领域扮演越来越紧张的角色,并最终成为 下一代 AI 主动化引擎 的领航者。
结语

LangManus,作为字节跳动开源的 AI 主动化框架,为开发者提供了一个强盛的工具,可以更加便捷地构建各种主动化应用。 它的开源特性和多智能体协作的架构,使其具备了广阔的应用远景。 随着社区的不断完善和技术的不断发展,LangManus 有望在 AI 主动化领域扮演越来越紧张的角色,并最终引领 AI 主动化技术的将来发展方向。
假如你对 AI 主动化充满好奇,渴望探索 AI 技术的无限大概,不妨亲自体验 LangManus,大概它将为你开启全新的工作方式,带你进入 AI 主动化的新世界。 现在,正是拥抱开源、拥抱 AI 主动化的最佳机会!
   AI 不光能聊天,还能编辑图片和绘画!ChatTools 带您体验 GPT-4o 图片编辑的强盛,更有 Midjourney 免费无限生图功能,让您尽情挥洒创意!平台还支持 Claude 3.7, DeepSeek-R1 等多种模子,快来探索吧!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

风雨同行

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表