去皮卡多 发表于 2024-9-10 13:33:24

关于大模型和AIGC的36条笔记和实话

https://img-blog.csdnimg.cn/img_convert/675990f1245681dd6aae1b6040451c04.png
行业到底有多卷?
最新统计,中国已有130多个大模型问世,在网信办存案的算法模型也高出70多家。BAT等互联网巨头悉数下场发布AI大模型,仅2023年就有超60家创业公司拿到融资,产物更是布满了底子层、模型层和应用层。新一代生成式AI,大概要转头看看上一代AI趟过的坑,不要行业自嗨,避免上一个冬天的轮回。在这个范畴的从业者,更要清楚地看到行业的内卷和客户的痛点,别被大佬的鸡汤迷了眼。
1、现在有客户找到我们,说有20个场景,一个场景X万块?然后挨家询价,华为做不做?阿里做不做?百度做不做?要这么卷下去,末了都没有钱赚。
2、大家融到的钱,80%-90%给到了算力,这是现状。要知道,现在还只是训练,训练的成本是可控的,推理的成本是不可控的。
3、我们GPU有30000块,算力6000p,年底夺取算力超12000p。数据方面,每个月有2万亿token洗濯和标注完,年底会有10万亿的token。
4、现在看,行业还是缺少一些颠覆式的杀手级的应用,从而难以实现商业化的变现。
5、怎么能够在成本和效果之间,找到一个均衡点,这是比力难的地方。都用大模型,成本太高了。
6、再过一段时间,大家要比拼的是底子办法的优化本事。好比,网络优化本事,别人断时你不停,就能比别人多训练频频。
7、在算力紧张的环境下,我们在做一些前瞻性的技能实验。大家大概都想不到,在我们大模型公司,做底子架构的同砚,比做模型的同砚要多。他们普遍的代价都还挺贵,也很难招。
8、大模型现在很尴尬,自身卖不上代价,末了都是卖云卖卡卖算力的赚钱了。
9、刚开始以为模型还挺值钱的,现在又陷入到内卷了。前段时间碰到一个客户,BAT等都报价了。刚开始报价,还挺贵,1000多万。大家知道末了的成单价是多少?太卷了。
10、百亿参数的大模型,在某些特别客户的认知内里,就是免费的。
https://i-blog.csdnimg.cn/direct/ad0f3386583e4b568b26aeb4066be2e3.png
来自一线的声音
人工智能范畴的企业,耳根子应该时刻记得毛主席说的话,“从实践中来到实践中去”。脱下长袍马褂,走到田间地头,在客户身边才华得到最真实地反馈。现在AI范畴的伪专家太多了,不如多听听来自一线的声音。
11、我们大概聊了150个客户。对于大模型本身的需求主要分为两类。一类是大模型本身笔墨上的需求,客户对大语言模型的要求是100%正确。另一种,是AI agent,函数调用、代码显示器、调用第三方工具。
12、我们在互助过程中,出现了一个冲突抵牾。客户会以为,在内部决定部署之前,是不能把数据拿出来给你的。但如果没有这个数据,我们又怎么能训练出适合客户需求的模型呢?
13、我们在做项目的时间发现,用户是不乐意为大模型去买单的,他还是为你的应用去买单。有的客户会直接问,有了大模型,从前的一些智能中台、知识图谱就不需要了吗?末了发现,场景才是最核心的。
14、我们要找到一些性感的场景。有几个标准。第一,小切口。第二,跟大模型的优势相匹配。第三,让买单的决策用户有强感知。好比从前获取一些数据、结论大概服务,需要差别的流程,现在通过大模型,决策者在移动装备就能快速获取和完成。
15、大模型想做成功需要三件事:1)能不能拿到足够多的钱去买算力。2)能不能拿到足够多的数据。3)人才密度是不是够厚,不在数量多,而是有没有足够多的高质量的科学家。
16、现在我们碰到三类客户。一类是焦急的客户,好比金融的客户因为竞对都在搞,于是也想搞,但他并不清楚本身的需求是什么?一类是希望降本的客户,客户的管理层认为,这主要是降本节省的标题,但模型到底节省了多少,欠好评判具体的价值。末了一类是希望部署模型开源赚钱的客户,他是靠这个模型来创收的,这类客户付费是最爽快的。
ToC 还是 ToB?
据相识,GPT-4训练一次的成本约为6300万美元,需要1.8万亿巨量参数。中国现在发布的一些大模型,ToC方向还是互联网的免费模式。但从业者都清楚,大模型的开辟和运行都需要斲丧大量的成本,从而ToB的商业模式更轻易良性运转。在商业化探索上,ToB还是ToC,不停是行业关注的标题。在闭门会中,我们反复听到了两个关键词:1)基因 2)越界。“你无法成为你所不是的”。
17、我们认为机会还是在tob垂直模型,核心点在数据和场景本身,这是最核心的。
18、我们本身也在思索,人工智能怎样跟互联网、数字化等结合起来,怎么更好地将原来的场景做得更智能。
19、ToC还是ToB,坦白讲这跟大家的基因有关。我们做不到,不代表别人做不到。好比一些ToC的应用,都是一些00后10后的小朋侪在玩,超出了我们年事的认知。
20、Toc和Tob还是很不一样的。ToC对容错率相对较高。TOB则相反。举个例子,智能问答。正确率怎样保证?像政府,都是有红线的。怎样避免模型的幻觉,现在大家都在做相应的探索。
21、我们反而认为ToC赚钱比力轻易。ToB有个标题,一个项目的进程时间比力长。客户批预算,再到立项,再到实验,钱的周期是很长的。
22、我以为现在是机会太多,不要把资源分到你所不是的地方,做战略选择,这个很重要。
ToB 和 ToG 也很苦
23、B端最大的bug在于,末了做成了高级的人力外包。
24、所有的项目都是有周期的,所有的付款也是根据周期的节点来走的。不大概我无穷制地帮你训练和优化一个模型。
25、AIGC创作这种,包容性比力强,可以有些错误。但到一些企业生产制造,对正确性的要求就很高了。往往我们从模型中挑一两个比力好case是比力轻易的,但要它维持在较高的水平内里,没有比力差的case,这个还是蛮难的。
26、我们在一个经济发达的省份去做智能数字化政府项目的时间,我们推了高出5个场景,末了客户就承认了3个场景。接着,就对安全、对数据、对底层刨根问底。接着还会问,你们跟其他大模型的差异和优势是什么?末了,多方要坐下来,出一个评测体系。评测体系过了还要评性能。
用项目孵化产物和方案
27、用项目孵化产物,做完几个项目后,抽离出相应的技能方案。这套方案,大概率不是一个模型,而是大模型+小模型,末了是多个模型形成的综合解决方案。
28、最近一两年,大概是做创新、做产物的过程,现金的回收周期会相对长一些。
Agent
想象一下人工智能模仿人类的日常任务来处置惩罚大量人类的复杂社会行为。斯坦福大学的一篇名为《Generative Agents: Interactive Simulacra of Human Behavior,titled》的论文深入研究了影象、反应和计划的AI Agent。AI Agent 被认为是OpenAI 发力的下一个方向。OpenAI 联合创始人在近期的活动上也说:“相比模型训练方法,OpenAI内部现在更关注Agent范畴的变化,每当有新的AI Agents 论文出来的时间,内部都会很高兴并且认真地讨论 ”。
29、我们总会把大模型想象成万能的,它能解决各种各样的标题?事实是这样的么?大模型只是大模型。
30、我们内部管AI,叫隐形的AI。在用户眼前,我们不会夸大是什么模型,参数有多少。我们对AI的定义,就是人的辅助。
31、绕开模型,绕开算力,大概接下来的机会就是Agent。
32、现在影响客户使用的最大的标题:投入产出比。一旦跟客户聊到末了,谈到项目预算的时间,如果只是纯笔墨相关,投入大几百万小几百万,客户就不太满意。另外,如果大模型使用AI agent 嵌入到实际的生产环境中,解决实际的标题,客户会非常乐意买单。
33、在大模型底子上,AI Agent具备影象、规划和执行等本事,本事加强。我们这期投了60多个初创项目,其中20多个都是Agent。
34、中国和国外,ToC的产物,付费形态和产物形态,差别也特别大。近期,我们投了一些Agent的公司。
35、但是,现阶段AI Agent只是处于新的实验阶段,距离通用智能还有一定差距。将来还需要解决单个AI Agent综合本事之外,多个AI Agent之间协作及感情(Emotion)等方面本事表现的突破。
36、大模型玩家,要保证本身能留在牌桌上,才有机会看到下半场新的东西出来。
大模型资源分享

“开始把握 AI 的人,相较于较晚把握 AI 的人而言,将具备竞争优势。”这句话放在计算机、互联网以及移动互联网的开局时期,同样实用。
我在一线互联网企业工作长达十余年,期间引导过众多偕行子弟,助力许多人实现了学习与成长。为此,我将重要的 AI 大模型资料,包括 AI 大模型入门学习思维导图、佳构 AI 大模型学习册本手册、视频教程以及实战学习等录播视频免费分享出来。
https://i-blog.csdnimg.cn/direct/cf490616758d4524a072c0d932b8cb05.png
一、全套 AGI 大模型学习门路

AI 大模型时代的出色学习之旅:从根基铸就到前沿探索,牢牢把握人工智能核心技能!
https://i-blog.csdnimg.cn/direct/a4631249facc400b89cc2fe2a5c31b02.png#pic_center
二、640 套 AI 大模型报告合集

此套涵盖 640 份报告的出色合集,全面涉及 AI 大模型的理论研究、技能实现以及行业应用等诸多方面。无论你是科研工作者、工程师,还是对 AI 大模型满怀热忱的爱好者,这套报告合集都将为你呈上宝贵的信息与深刻的启示。
https://i-blog.csdnimg.cn/direct/27ce8e1bca6c47368055925c695b84a6.png#pic_center
三、AI 大模型经典 PDF 册本

伴随人工智能技能的迅猛发展,AI 大模型已然成为当今科技范畴的一大热门。这些大型预训练模型,诸如 GPT-3、BERT、XLNet 等,依附其强大的语言理解与生成本事,正在重塑我们对人工智能的认知。而以下这些 PDF 册本无疑是极为出色的学习资源。
https://i-blog.csdnimg.cn/direct/ee63071b681048239d351fff7d77f264.png#pic_center
https://i-blog.csdnimg.cn/direct/79e1b359b2594936a81647eb7d1b3567.jpeg#pic_center
阶段 1:AI 大模型时代的底子认知



[*] 目的:深入洞悉 AI 大模型的根本概念、发展进程以及核心原理。
[*] 内容


[*]L1.1 人工智能概述与大模型起源探寻。
[*]L1.2 大模型与通用人工智能的紧密关联。
[*]L1.3 GPT 模型的辉煌发展进程。
[*]L1.4 模型工程剖析。
[*]L1.4.1 知识大模型阐释。
[*]L1.4.2 生产大模型剖析。
[*]L1.4.3 模型工程方法论论述。
[*]L1.4.4 模型工程实践展示。
[*]L1.5 GPT 应用案例分享。

阶段 2:AI 大模型 API 应用开辟工程



[*] 目的:熟练把握 AI 大模型 API 的运用与开辟,以及相关编程技能。
[*] 内容


[*]L2.1 API 接口详解。
[*]L2.1.1 OpenAI API 接口解读。
[*]L2.1.2 Python 接口接入指南。
[*]L2.1.3 BOT 工具类框架先容。
[*]L2.1.4 代码示例出现。
[*]L2.2 Prompt 框架阐释。
[*]L2.2.1 作甚 Prompt。
[*]L2.2.2 Prompt 框架应用现状分析。
[*]L2.2.3 基于 GPTAS 的 Prompt 框架剖析。
[*]L2.2.4 Prompt 框架与 Thought 的关联探讨。
[*]L2.2.5 Prompt 框架与提示词的深入解读。
[*]L2.3 流水线工程论述。
[*]L2.3.1 流水线工程的概念剖析。
[*]L2.3.2 流水线工程的优势展现。
[*]L2.3.3 流水线工程的应用场景探索。
[*]L2.4 总结与预测。

阶段 3:AI 大模型应用架构实践



[*] 目的:深刻理解 AI 大模型的应用架构,并能够实现私有化部署。
[*] 内容


[*]L3.1 Agent 模型框架解读。
[*]L3.1.1 Agent 模型框架的设计理念论述。
[*]L3.1.2 Agent 模型框架的核心组件剖析。
[*]L3.1.3 Agent 模型框架的实现细节展示。
[*]L3.2 MetaGPT 详解。
[*]L3.2.1 MetaGPT 的根本概念阐释。
[*]L3.2.2 MetaGPT 的工作原理剖析。
[*]L3.2.3 MetaGPT 的应用场景探讨。
[*]L3.3 ChatGLM 剖析。
[*]L3.3.1 ChatGLM 的特色出现。
[*]L3.3.2 ChatGLM 的开辟环境先容。
[*]L3.3.3 ChatGLM 的使用示例展示。
[*]L3.4 LLAMA 阐释。
[*]L3.4.1 LLAMA 的特点剖析。
[*]L3.4.2 LLAMA 的开辟环境说明。
[*]L3.4.3 LLAMA 的使用示例出现。
[*]L3.5 其他大模型先容。

阶段 4:AI 大模型私有化部署



[*] 目的:熟练把握多种 AI 大模型的私有化部署,包括多模态和特定范畴模型。
[*] 内容


[*]L4.1 模型私有化部署概述。
[*]L4.2 模型私有化部署的关键技能剖析。
[*]L4.3 模型私有化部署的实验步调详解。
[*]L4.4 模型私有化部署的应用场景探讨。

学习计划:



[*]阶段 1:历时 1 至 2 个月,构建起 AI 大模型的底子知识体系。
[*]阶段 2:花费 2 至 3 个月,专注于提升 API 应用开辟本事。
[*]阶段 3:用 3 至 4 个月,深入实践 AI 大模型的应用架构与私有化部署。
[*]阶段 4:历经 4 至 5 个月,专注于高级模型的应用与部署。
《人工智能\大模型入门学习大礼包》,可以关注工棕耗:AI技能星球
页: [1]
查看完整版本: 关于大模型和AIGC的36条笔记和实话