逾越传统续写模式:AI 编程间隔智能研发终态另有多远? ...

打印 上一主题 下一主题

主题 1864|帖子 1864|积分 5592

在软件开发领域,大模子驱动的智能代码天生技能已成为研究热点,引起了广泛关注和探索。在7月27日,由开源中国主理的“AI编程革新研发效能”OSC源创会·杭州站·105期线下沙龙活动,来自百度工程效能部的前端研发经理杨经纬,从一款 AI 编程助手 —— 文心快码(Baidu Comate)前端工程师的角度,分享了关于智能研发工具本身的研发进程和理念。以下是来自经纬的观点:
我如今负责工程效能部的前端团队。团队主要负责前端方向,也就是部门里面全部产品的前端展示部门,本身也包括文心快码 Baidu Comate(以下简称 Comate)的端、以及前端的建设等等。
作为离用户近来的研发角色,我们确实能够更明显的感知到在 AI 期间,工作方向的一些变化。好比之前会使用低代码的方式举行提效,在天生式 AI 出现之后,实在会更多的联合 AI,举行自然语言天生代码、大概图像转代码的探索。
随着大模子应用的迅猛发展,各行各业都在积极拥抱 AI。其中的智能代码助手方向属于跑在比较前面的梯队,落地非常敏捷。如今在百度内部,借助 Comate 的支持,在百度内部已有约 30% 的代码由 AI 天生,可以看到提效效果是非常明显的,而且将来提效作用还会连续增长。
Comate 在集团内的落地效果从最初的 7%,到 20%,再到近来的 30%,可以看到稳步落地的节奏,这个照旧比较符合预期的。落地的过程比较顺遂,一个是主要能力续写没有影响到工程师的原有研发活动风俗,另外工程师们配合度照旧比较高的,这个照旧要感谢同学们的支持。
从用户的使用情况来看,用户在当前阶段使用最多的照旧代码续写场景,续写本身延续了用户原有的编码活动,不改变用户活动风俗,所以用户担当起来是最快的。我们在续写功能方面也投入了比较多的精力举行打磨,通过 SFT 精调、RAG 知识加强、工程现场感知、工具平台开放性等加强推荐正确率,通过对端、网关、服务端及大模子等多层的性能优化来提升推荐速度,使用户在使用的时间得到最快和最正确的推荐效果。当前产品用户满意度达到 90%,采纳率达 46%。
从智能研发的阶段来看,续写是我们从客岁就开始推广落地的能力,产品力与用户认知都相对比较成熟。在续写基础上,在人机协同的新模式探索方向上,我们已经进入到了下一个阶段 —— 非续写模式的探索与落地。好比说 NL2Code 自然语言天生代码、注释天生代码、大概自主引导端到端全流程的 Agent 智能体,这种从无到有,从 0 到 1 的模式,和从已写的部门举行补全的模式相比是有本质区别的,能够更洪流平上资助工程师举行提效。测试领域就是一个比较典型的例子,通过 Comate 能够根据业务代码,直接天生单测、主动化测试用例等,当前典型场景的集团试点业务覆盖率已经达到了 29%。另外我们发现,更多企业也开始关心智能研发助手是否能与企业私域能力举行联合,如今通过 Comate 的开放平台,企业可以将自有平台和流程无缝衔接到编程现场,在集团内部多个业务协作中都达到了 70% 以上的提效效果。我们认为对关键研发动作自由举行调理,也将是实现将来研发智能体的一个根本前提。在多种非续写模式的推动落地作用下,当前集团的非续写占比已经达到了 35%。
在探索的过程中,我们连续思考的一个问题是,智能研发的发展路径是什么样的?从当宿世成式 AI 的能力与发展来看,AI 将显著推进软件研发智能化进程。软件研发智能化变革的一个核心点是责任的转移。当前,Comate 的智能研发能力已经在一些研发核心环节和场景下达到了 AI 可接管的效果,我们已经由 No Assistant 的全人工状态迈进到 Partially Automated 的半主动化人机协同状态,处在人与机器的责任转移中心状态。将来 AI 的学习与泛化、反思、规划等能力将进一步加强,接管更多研发中的核心环节与场景。终极,人与机器的协同关系而也将迎来变革,由人机协同变为无人值守,AI 接管研发全流程。在此之前,我们必须需要提前做好预判和准备。如何进一步探索人机协同新模式,让工具进化成为越来越智慧的成员,并且在探索形式上取得乐成的落地,是我们连续要回答的一个问题。
除此之外,我们也为用户提供了非常丰富的高级能力,好比当你对于新接办的项目并不认识时,Comate 可以资助你举行全面的解读,对每一个模块分析与表明,再配合上代码表明能力,表明详细代码,显著紧缩了认识项目和代码的时间。
再好比对于编码新手,Comate 也非常友爱,我记得在 wave 大会上有一个用户,她不是研发工程师,但由于实际项目需要,想要搭建一个框架。我在现场给她演示了如何在 Comate 上传框架知识,并基于知识集举行提问。好比我们问某框架应该如何搭建,Comate 会给出从安装、初始化、配置、写代码、调试、构建、发布等每一个流程的步骤,详细给出每一行命令或代码,手把手教学。用户当场表示这个能力真不错,归去就试试。
我们对于用户做了不少调研,其中也包含用户画像的分析。我们的用户范围照旧比较广泛的,包括学生等初级研发群体、涉及到代码编写的泛研发群体、以及各个行业的研发工程师等专业研发群体。互联网领域的研发工程师用户相对较多,占到 60% 以上,也是和我们通常认知是一致的。
产品刚出来的时间,有不少用户都感觉到惊艳,但是随着逐渐渗透和落地,用户对我们也提出了更高的要求。首先开发者广泛对于产品的核心能力照旧比较关注的,也是行业广泛在加快探索的,如何更好更快地推荐更正确的代码,我们也会在这个方向上连续加快建设,为各人提供更懂用户,体验更流畅,更加智能的产品。



关于 AI 编程助手开放性建设的思考

在我们已经进入了 AI 原生期间后,可以看到随之产生的一些新的生产元素,好比 prompt、大模子等等,前后端的边界越来越含糊,也带来了非常多新的时机,所以团队一直承袭着 “不给自己设限” 的原则,连续探索差别的方向,包括部门产品的用户体验建设、Comate 的开放性建设,如今也在探索从前端角度,好比上下文工程方向,如何更好地提升推荐效果等等。
以 Comate 开放性建设为例,Comate 希望将自己的能力对企业举行开放,支持举行知识扩展与能力扩展,使得企业可将能力直连编程现场,并基于文心大模子、现场信息打造自己的定制化能力,建设更得当企业的研发助手。
因为我们做这件事变在行业内是非常早的,需要重新定义我们如何开放能力,开放什么能力,企业与开发者能够从开放性中得到什么,如何能给开发者提供更高效的集成环境等多方面的问题,所以也比较有挑战。团队同学一边连续优化更得当业务和开发者的开放平台,一边与大量业务频繁沟通,不停调解方向与细节,渐渐探索出了百度智能小步伐、Paddle、Jarvis、GDP 等典型标杆场景。其中多个场景提效效果凌驾 70%,能力覆盖多个体系,集团内部已经累积发布 19 个插件,61 项能力。
Comate 的开放性让更多应用联合模子落地细分场景,打造了更得当业务的产品能力,也为人机协同新范式开辟了新的方向,实现了与业务的共建共赢,受到业务广泛好评。以 Jarvis 为例,原本摆设需要在多平台间跳转操作完成,集成到 Comate 后,只需要一键摆设,而且摆设时长也从 15 分钟低落到了 5 分钟以内。
除了实际提效的效果以外,在许多项目落地后,我们能够真实的看到研发同学发自心田的好评和自发的拉动新用户使用,这个对于项目的加入同学来说,是非常受到鼓舞的,我们也能更深刻地感受到做这件事变为开发者带来的意义。
在举行 Comate 开放性建设过程中,我们也看到,企业对于智能助手的诉求是逐渐被培养起来的,最初企业用户的关注焦点主要会合在续写场景,但在实际落地后,更多企业会逐渐开始关心,智能研发助手是否能与企业本身的研发流程举行联合,做更得当企业的研发助手。这也是我们举行 Comate 开放性建设的初志。在将来人机协作模式的模式中,大模子通过开放平台无缝衔接研发流程,对关键操作环节自由举行调理,将是将来研发助手智能体的一个根本前提。我们也欢迎企业和开发者们加入我们,共同打造以编码环节为中心的研发生态,探索人机协同的新模式。



人机协同的新模式应该是什么样的?

Comate 在国内推出的比较早,并且在客岁已经举行了集团内的全面落地,在百度内部已有约 30% 的代码由 AI 天生,集团落地效果非常显著。在实际落地效果领先的基础上,Comate 已经迈入下一个阶段 —— 进一步探索人机协同新模式,做更懂你的智能代码助手。
如今 Comate 可以连接企业私域举行量身定制:首先,Comate 能够举行知识加强,Comate 可以基于企业的代码库等私域知识,利用 RAG 检索加强天生技能,天生带有业务特性的代码;其次,Comate 可以举行业务能力连接,通过 Comate 开放平台,不但能够定制产品能力,好比自定义 prompt 等,还可以将业务自有平台能力或第三方能力集成到 Comate 当中,联合 Comate 提供的底层文心大模子能力举行能力的智能化建设,把工程师的工作会合在编码现场,减少跳出,提升工程师的幸福感与效率;另外,企业可以通过 Comate 与文心大模子举行连接,并对模子举行肯定水平加强,低成本的将智能化能力覆盖到研发的各个环节中。
通过以上知识加强、能力加强、模子加强三层能力,联合深度解读代码库、直接拆解需求天生新代码、无缝对接企业现有能力与需求、低成本自助定制等多重高级能力,打造企业专属智能代码助手。
另外,Comate 前一阵刚刚发布了中文名文心快码,从这个名字中可以看出 Comate 的特点:研发速度快、企业落地快、赋能创新快。
一、研发速度快:在 Comate 的知识构建方面,由上百位技能专家举行标注,内置 1000+ 常见编程语言、技能框架、业务组件的官方文档, 1W+ 高星开源代码库, 10W+ 各类平台 API ,梳理出各类开发者一样平常开发中所需的知识类别和知识来源,以此我们构建了覆盖整个研发场景的知识体系。除了传统的 Embedding,我们针对各类编程语言分析语法布局、提取函数调用链、总结代码元信息,为各个功能场景提供最得当的上下文天生;为了充分的利用这些知识,我们构建了面向差别技能栈、差别研发场景的 Agent,通过深度理解用户意图,从多个 Agent 中筛选出最得当解决当前用户问题的 Agent,如 Java 专家 Agent。每类专家 Agent 都有其独特的知识体系和调理方式,为开发者提供更加具象、更加专业的解决方案。
二、企业落地快:通过将企业的知识、工具和研发流程,与 Comate 提供的基座能力相联合,使得 Comate 能力与企业更好的匹配融合。首先,Comate 的代码安万能力全面领先,提供安全加强 + 安全扫描的双重保障,安全可信。其次通过知识加强、能力加强、模子加强适配企业业务。同时,提供智能 debug、智能测试等能力支持企业研发流程。
三、赋能创新快:针对差别的开发场景,在技能栈、领域知识,合规与质量要求上提供更好的支持。 以 AI 为例,对于 AI 基础开发者,好比 Paddle 框架开发团队,通过内置框架算子开发指南、开源框架类似算法实现参考。加快算子开发和转化效率,加快算法优化落地过程。对 AI 模子开发者,如使用 Paddle 等框架开发模子的人,Comate 内置框架 API Reference(PaddleNLP、Pytorch 等)、开源代码库(HuggingFace Transformers 等)类似功能实现参考,为 AI 模子开发者打造最智能的开发环境,代码天生正确率 80%+。对于 AI 应用开发者(如使用千帆和开发框架等构建 AI 原生应用的人),Comate 内置各类大模子服务 OpenAPI(千帆平台文心 API 等)、AI 应用开发框架(Langchain 等)使用文档和 API Reference,为应用开发者提供最智能的开发环境,提升开发调试效率。
另外 Comate IDE 的丰富度也是非常领先的,如今支持 JetBrains、Visual Studio Code、Visual Studio、Xcode、Eclipse 等多种主流 IDE,可以服务于各类研发人群,好比我们联合百度飞桨推出了 AI Studio 端的 Comate 插件,并联合了常用 AI 框架 PaddleNLP、Pytorch 举行更正确的推荐,资助 AI 模子开发者编码提效。如今 Comate 公有云注册企业凌驾 1w+,覆盖金融、汽车、机械制造、软件服务、音视频、消费、工业互联网等多个领域,受到了广大开发者的欢迎。



关于技能选型时的标准和考量

第一个是产品效果,通过 prompt 和工程手段来包装大模子调用,验证出最优的效果,这里有 2 个关键,其一是效果评估,因为这个是连续性的,而且模子也在连续迭代,需要不停的做效果回归和验证。尤其是已有的 bad case 需要重点关注。其二是除了对模子举行精调训练外,要充分运用提示工程、RAG 等能力举行效果提升,选择最合适的技能手段。在选型时,也要基于业务实际情况举行选型,不自我满意,本着对业务负责的原则,每一次都在分析业务效果后决定技能。
第二个是体验,技能的选型要首先保障用户侧端到端的性能,保证用户感受到的产品体验是更快更流畅的。另外技能效果也要尽可能地做到满意用户预期,更懂用户在想什么,just in time 的给用户提供最恰如其分的能力服务。
第三个是成本,成本高低是产品能大范围落地的关键,如果单看效果很好,但是成本过高,往往这种最后会束之高阁,所以成本很关键,技能方案要找到最优性价比的方案。
另有一些常规选型方式,如竞品方案对比,技能实验、成员认识度、扩展性等多方面考虑等等。这里还要说明一点,全部的技能选型,都是要动态审阅技能方案,大概一个方案如今做不到,但是随着模子和其他周边技能突破,就成为现实,所以做技能选型和方案选择,需要随时关注技能动态,要往前看,提前做好判定,预留发展空间。

文心快码升级福利发放中

进入官网,免费领取文心快码价值270元的专业版!


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

半亩花草

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表