AI产品的架构(分四层)

打印 上一主题 下一主题

主题 1681|帖子 1681|积分 5045

架构分层

在我看来,每个AI产品都可以分为4层结构
第一层:数据、算力、算法层。
第二层:模子层。
第三层:应用层。
第四层:用户层。

第一层:数据、算力、算法层

这一层是 AI 产品的基座,相称于人在成长过程中所担当的教导体系,包罗丰富的学习资源、讲授硬件和优秀的老师,这三者分别对应数据、算力、和算法。

1、数据

这个概念很好理解。数据按照内容分两类,一类是用于建设 AI 基础本事的海量数据,就像学校的图书馆资源,对全部人来说都是一样的; 一类是个性化数据,就像你在图书馆之外,总有自己独特的学习资料,好比学长的学习条记,你感爱好的课外读物。
第一类数据由大模子厂商决定,需要专门的数据供应方和大模子厂商来做,和普通的 AI 产品司理关系不大。但第二类数据就是 AI 产品司理要来“精挑细选”了。
2、算力

这是支撑 AI 产品的硬件情况,它就像是一个学校里的讲授设备、教室、实验室等等。对于 AI 来说,算力就是盘算时使用的芯片。当然,你不需要相识芯片的制作工艺、使用效率。但作为 AI 产品司理,你需要相识三点。
1)怎样评估一个 AI 产品对算力的需求?
2)使用这些算力要花多少钱?
3)使用哪些方法可以低落本钱?
这些本事能帮助你从 ROI 角度评估产品的商业可行性。好比我们现在经常使用的免费 AI 搜索,假如不做任何本钱调优,一次搜索都要花掉几块钱。那假如一天发起十万次搜索,仅仅算力本钱就要斲丧几十万块。想要长期发展,就必须在商业收益和本钱上做好规划
3、算法

假如说数据和算力都有一个具象的表现,那么算法就是 AI 背后最抽象的盘算机原理。好比学校里的老师,我们并不是看这个老师长得高矮胖瘦,而是要看 Ta 的讲授方法,这个方法相比讲授设备、图书资源是很抽象的,也是比较难的部分。
对于 AI 产品司理来说,相识算法有两大好处。一是能帮助我们理解技能边界,鉴定什么问题 AI 能办理,什么不能办理。二是能帮我们与算法工程师、开辟工程师更好地互助,换个黑话的说法就是“避免被他们忽悠了”。

第二层:模子层

基座大模子

垂直领域模子

场景模子

有了上一层的学校图书馆、讲授场地和优秀老师,接下来就是花时间培育出优秀的“学生”了。
模子层细分可以分为三层,分别对应着差别程度的学生,我们由下至上来看。


  • Level 0:基座大模子,相称于本科生,具备通用本事。
  • Level 1:垂直领域模子,相称于在本科结业后继续攻读的研究生,具备肯定专业领域的知识。
  • Level 2:场景模子,相称于本科或研究生结业后,经过工作经验积聚,或者公司的专项培训,具备某些业务专家的本事。
在一个 AI 产品中,你可以仅选择其中某个层级的模子,也可以根据需要选择多个模子。就像一个公司既有本科生,又会有研究生,也会有业务专家。
作为 AI 产品司理,我们就需要像公司的 HR 一样,起码具备两项本事。
1)怎样挑选符合的员工,也就是为产品场景找到符合的基座大模子或者领域模子。
2)怎样进行公司内部的专项培训,也就是训练出一个场景模子,这里需要理解模子微调原理。

好了,我们总结下第一层和第二层需要把握的知识点,以及把握这些知识点后你可以具备的本事。这部分的细节我们会在后续课程中详细睁开。

当你找到符合的“人员”,接下来就是要变更这些资源动手做东西啦,也就到了产品的应用层。
这里留一个小问题,什么是模子呢?

第三层:应用层

这里的应用层更像是产品拆开包装后,你所看到的各个元器件之间是怎么构造、协调的,也是产品司理和应用开辟者工作最繁重的地方。
假如说前面的两层主要是理论学习,那么应用层拼的就是实战学习。我会在后续的课程中以亲身实践案例来讲述。在这里,你需要把握两大焦点技能,提示词工程和 Agent 筹划

提示词工程

这里的提示词工程并非你常听到的和 ChatGPT 对话的提示词撰写技巧,而是面向产品司理的提示词工程技能。我用一个比喻来说明二者的差别。


  • 假如你是 ChatGPT 的用户,写提示词就像玩盲盒。你对结果有所期待,但不要求确定。
  • 假如你是 AI 产品司理,写提示词就像打靶。你是起首有一个确定的目的,再开始写提示词,直到提示词能打中靶心为止。
好比在客服场景中,我们需要筹划提示词,让 AI 判断对话中,用户的情绪是正面、中性还是负面。


  • 当用户输入“本日别给我送快递,我不方便收货,假如可以来日诰日送”时,输出态度为中性。
  • 当用户输入“包包内部结构欠好,找东西不方便”时,输出态度为“负面”。
在这两个例子中,都有“不方便”这个词,但输出的态度却不一样。那么我们在写提示词的时间,就必须做多次试验,保证相似的场景能有严格的输出,像打靶一样每次都能打到靶心
为了到达这个目的,你的提示词大概是如许的:

你看,这个提示词里貌似有很多“废话”,但对于一个模子来说是须要的。这个例子里的提示词工程用专业名词来说叫 Hard prompting(硬提示)工程,就是把提示词当做输入项直接给到模子,输出期待的答案。

既然有 Hard prompting, 那就会有 Soft prompting(软提示),它另有别的一个名字,叫 Prompt tuning,提示词微调工程。简朴来说,就是用微调模子的方法让模子学习到某种模式,模子学会之后,就不消再像 Hard prompting 那样输入很长的提示词了。

好比在上面的例子中我们会搭配很多组如许的数据对来微调模子。

在模子微调结束后, 我们就只需要以下几句话就可以得到我们期待的结果,这个长度就比 Hard prompting 的“废话”少多了。

打个比方吧,Hard prompting 就好像你对一个刚入职的新同事给他安排使命,需要很详细地告诉 ta 要做什么,为什么要做,怎样做,详细步调,而且要给给他举例说明。而 Soft prompting 就像是培养一个纯熟工,当新同事适应一段时间后,你不再需要那么详细,大概只需要一句话,他就能体会你的意思。这也意味着你对他成功地完成了 Soft prompting 工程。

回到产品本身,就是在产品实验阶段通过 Hard prompting 进行验证,上线得到真实数据验证成功后,通过 Soft prompting 微调那些在模子里形成的步伐性记忆。我们在后续的实战案例 11-13 节中会详细讲述。
我们把上述提示词工程总结为一个提示词的生命周期,就像下面这张图展示的内容。


Agent 筹划

假如说提示词工程是用来影响模子的思索,那么 Agent 则在思索的基础之上增长了行动本事。
仅使用提示词工程的 AI 产品只谈判天,而联合 Agent 筹划的 AI 产品就既能谈天,还能服务变,不会沦为头脑上的巨人,行动上的矮子。

Agent 翻译为中文叫智能体,直译过来叫“署理”,早在 1986 年,图灵奖得主 Marvin Minsky 在《The Society of Mind》一书中就提到了 Agent 的概念。那为什么现在又重新被推上汗青舞台了呢?
由于 Agent 实际上有五个递进的品级,而当下正处于从第二级向第三级超过的阶段。
我们依次说下这五个品级。


  • 第一级:基于规则,能使用工具的智能体。
  • 第二级:基于模仿学习、强化学习,能使用工具且能做决议、推理的智能体。
  • 第三级:基于大语言模子,在第二级本事之上,增长了记忆、反思本事。
  • 第四级:基于大语言模子,在第三级本事之上,增长了自主学习本事。
  • 第五级:基于大语言模子,在第四级本事之上,增长了情绪、智能体的社会协同本事。
在这一轮,为了让 Agent 能跨向第三级,解锁更多使用场景,AI 产品司理们需要为 Agent 构建出四个本事。


  • 工具使用本事
  • 记忆本事
  • 反思本事
  • 规划决议本事

我举例来说明这几项本事的定义。好比我写这节课这天恰好是父亲节,我想做一张父亲节卡片。

  • 【工具使用本事】我告诉 ChatGPT:“画一张父亲节主题的卡片”。Ta 会调用 AI 画图工具 DALL.E-3 绘出一张卡片,这是工具使用本事。
  • 【记忆本事】可我发现这张卡片上的主题词是英文字母,这可不可,我爸看不懂英语,于是我告诉 Ta“把卡片上的英文换成中文”,ChatGPT 会理解这句话,并再次调用 DALL.E-3 绘出一张卡片。这时你发现 ChatGPT 其实记住了我这里说的“卡片”指的就是第一次对话生成的卡片,这就是记忆本事。
  • 【反思本事】然后,我再问 ChatGPT “假如你是一位 60 岁的男性,你会喜好如许的卡片吗?”,好了,Ta 就会读取这张照片,并以 60 岁男性的角色评判这张图片,这就具备了反思本事。
  • 【规划本事】最后,我完成了父亲节卡片。下次假如碰到母亲节,我问 ChatGPT“怎样做一张母亲节的卡片”,那么 ChatGPT 就会自己发起:第一步用 DALL.E 画一张照片,第二步以母亲的身份来评价这张照片,直到满意为止。这就具备了规划本事。
通过应用层的这两个焦点技能,我们就可以把产品的焦点功能构建起来。接下来我们的产品就要包装一下,正式向用户见面了。我们来到了 AI 产品的第四层。

第四层:用户层

这一层是很多 AI 产品司理比较困惑的地方,我之前在做互联网产品的时间,产品司理的一大本事就是画原型图,而现在的 AI 产品,似乎大部分是一个用户对话界面,AI 产品司理画原型图再也不消画那种长达十几页的用户跳转旅程。

然而这种对话界面绝对不是、也不应该成为唯一的形态。由于人类的信息有 80% 是从视觉中获得的,而这 80% 的视觉绝不是只用来看文字的。我在这里举个以画布作为用户层的例子供大家参考。

想象一下,你和一位同事在白板前讨论问题,而这位同事就是一个智能体。

  • 起首你说出了一个想法,“咱们要调研一下关于具身呆板人的东东”。然后 Ta 在画布迅速画出一个脑图。
  • 可是你发现,这些脑图用一个维恩图来表示会更好,由于其中有些项目是有重叠、关联作用的,维恩图更适合表达这种关系,于是你告诉“同事”,“我觉得用维恩图表达更好”。
  • 于是 Ta 迅速改成了维恩图的方式。你们两个如此反复,
  • 终极通过这种互动方式做出来一个调研思绪。
  • 最后 Agent 根据这个思绪通过搜索工具总结出一份完整的报告。
你瞧,这种方式就让人机交互变得更加天然,这也是这一轮 AI 给产品形态带来的革命性改变。也许你已经习惯了我们在 App 上点来点去,但仔细想想,在一个偌大的屏幕上,有时间大概你只关注某个角落里的一个按钮,这何尝不是一种视觉浪费呢?

当然,用户层的表现终极还是要根据用户的需求、使用场景、使用习惯来决定。我经常在想,在 AI 技能厘革的时代,会不会出现像鼠标之于 PC 机,触摸屏之于智能手机那样跨时代的交互方式?只管 GPT-4o 发布会对多模态 Demo 的展示很让人震撼,但从用户角度,似乎仍然在人机交互上有些隔阂。我们在 AI 技能浪潮下,肯定会诞生全新的人机交互,但在此之前,不妨简朴地让 AI 产品的 UX 遵循以下两个原则。


  • 让用户的学习路径最短。
  • 让结果出现最直观。
小结

本日我们讲了 AI 产品有四层结构:数据、算力、算法层,模子层,应用层和用户层。你是不是对一个 AI 产品的全貌有个体系化的相识了呢?

在这节课开头,我把这个四层结构比作一座冰山,由于起首我们盼望 AI 产品像一座构筑物坚固可靠。而在即将结束这节课的时间,我更愿意把 AI 产品比作你要塑造的生命体。
最底层(数据、算力、算法层)决定了生命体的气质:

它是构建 AI 产品的基础,对底层的相识可以帮助我们确定技能边界,告诉我们什么样的产品功能可以用 AI 实现,什么样的功能需要产品侧降级,什么样的功能无法实现。
模子层是在构建生命体的专业素养:

AI 产品司理需要懂得怎样选用符合的基础模子,怎样收集用于模子微调的优质数据集。

以上这两层我们会以理论学习为主。再往上的应用层和用户层是 AI 产品司理一样平常工作的主要内容,是我们需要通过大量实践才能把握的技能。
应用层是培训生命体的实战技能:

AI 产品司理需要把握提示词工程和 Agent 筹划两大焦点技能。提示词工程是为了控制 AI 产品的输出,Agent 筹划则是为了让 AI 产品具备思索和行动的本事。而这两项内容也会作为焦点内容出现的 AI 产品的 PRD 文档中。
用户层是塑造生命体的外在形象:

盼望你的 AI 产品终极能成为一个内外兼修的生命体,持续生长。与此同时,你也会成长为一位毗连用户与 AI 技能的硬核 AI 产品司理。



























免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

南七星之家

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表