ToB企服应用市场:ToB评测及商务社交产业平台

标题: AI大模子学习笔记之四:天生式人工智能(AIGC)是如何工作的? [打印本页]

作者: 络腮胡菲菲    时间: 2024-7-21 04:57
标题: AI大模子学习笔记之四:天生式人工智能(AIGC)是如何工作的?
OpenAI 发布 ChatGPT 已经1年多了,天生式人工智能(AIGC)也已经广为人知,我们常常津津乐道于 ChatGPT 和 Claude 这样的人工智能系统能够神奇地天生文本与我们对话,而且能够影象上下文情境。

Midjunery和DALL·E 这样的AI绘图软件可以通过Prompt 输入文本提示天生多张令人惊艳的美图,看起来相称神奇。

但是,你有没有想过,天生式人工智能(AIGC)究竟是怎么运作的呢?在这篇文章里,我们就来简单相识一下天生式人工智能技能(AIGC)的根本原理,看看它到底能做些什么,还有啥时候你可能不太想依靠它。
一、从有监视学习到天生式人工智能
大多数传统类型的人工智能(如判别式人工智能)都是为了对现有数据进行分类或归类而设计的。相反,天生式人工智能模子的目标是天生前所未见的完全原创的人工成品。
在今天,有监视学习(Supervised Learning)和天生式人工智能(Generative Artificial Intelligence)是当今人工智能领域的两个最紧张领域,其重点是创建算法和模子,以便从训练数据集天生与模式相似的新的真实数据。

天生式人工智能模子颠末训练,可以从巨大的数据集中学习其中的潜在模式,并使用该知识天生与原始数据集相似但不雷同的全新样本或数据。

例如,在人类大概猫狗的图像数据集上训练的天生式人工智能算法可以天生全新的人类图像大概猫和狗的图像,这些图像看起来与原始数据集中的图像相似,但不是精确的复成品。因此,"天生 "一词被用来形貌它。
天生式人工智能(Generative AI)的涌现标志着人工智能技能的重大进步。
1.1 有监视学习的局限性与挑战
在2010年左右,随着大规模有监视学习渐渐成为主流,人们开始寄希望于大数据能够为AI模子的性能带来质的飞跃。
然而,从那时起,AI 科学家们开始观察到一个令人困扰的问题:只管我们有大量的数据可供使用,但纵然我们向小型AI模子继续提供更多的数据,它们的性能改善并不显着。例如,在构建语音识别系统时,只管AI担当了数千以致数十万小时的训练数据,但其正确性与仅使用少量数据的系统相比并无显著进步。这一现象引发了人们对监视学习有用性的怀疑。

进一步的研究表明,仅靠大规模监视学习和大数据集并不能无穷地提升 AI 模子的正确性。
这是因为:

1.2 天生式人工智能的出现
随着人们对监视学习的限定和挑战有了更深入的熟悉,研究职员开始寻求其他方法来克服这些问题。
在这个过程中,天生式人工智能(Generative Artificial Intelligence)应运而生,并渐渐成为人工智能领域的紧张组成部分。
天生式人工智能(AIGC)与传统的机器学习算法不同,它不仅仅局限于对已有数据的分类或猜测,而是可以通过学习数据的分布,创造出全新的、以前从未见过的内容,它能够像一座神奇的创意工厂一样,通过Prompt 提示词不断地生产出令人惊叹的全新数据、图像、音频和文本内容。
天生式人工智能与其他类型人工智能之间的另一个关键区别是,天生式人工智能模子通常使用无监视和半监视机器学习算法。

这意味着它们不必要对学习的数据进行预先标记,这使得天生式人工智能在结构化或组织数据稀缺或难以获取的应用中特殊有用。

天生式人工智能的出现为人工智能领域带来了新的思路息争决方案,克服了传统监视学习方法的一些限定和挑战。通过结合天生式方法和传统的监视学习技能,我们可以更好地利用数据,进步模子的性能和泛化能力。
二、天生式人工智能的思想
2.1 天生式人工智能的根本工作原理:
天生式人工智能的根本工作原理是通过学习数据的分布特性,从而能够天生与原始数据相似的新数据。其焦点思想是从训练数据中学习数据的概率分布,并使用学习到的分布模子来天生新的数据样本。
天生式人工智能通常接纳天生对抗网络(GANs)或变分自编码器(VAEs)、Transformer 等模子来实现。
就拿天生对抗网络(GANs)来说,GANs 模子包罗两个紧张组成部分:

1. 天生器(Generator): 天生器是一个神经网络模子,用来接收一个随机噪声向量或其他情势的输入,并将其映射到数据空间。天生器的目标是通过根据用户输入的分析数据模式来创建新数据。通过不断调整天生器的参数,使得天生的样本尽可能地接近真实场景中的数据分布。
2. 判别器(Discriminator): 判别器也是一个神经网络模子,其任务是对天生器天生的样本与真实数据进行区分,估计样本来自于训练数据的概率。它接收来自天生器产生的样本和真实数据的输入,并实验将它们分类为真实或伪造。判别器的目标是最大化正确地将真实数据分类为真实样本,同时将天生的样本正确分类为伪造样本。
每当有用户输入时,天生器就会天生新的数据,判别器将分析它的真实性。来自判别器的反馈使算法能够调整天生器参数并不断地重新调整和细化输出。
在数学上可以证实,在恣意函数的天生器(G)和判别器(D)空间中,存在唯一的解决方案,使得天生器(Generator)天生的内容可以重现真实训练数据的分布,也就是当判别器 D=0.5 时,天生器 G 产生的信息与输入的信息到达均衡。

通过训练天生器和判别器的对抗过程,天生式人工智能模子不断地进步天生样本的质量,使得天生的样本更加逼真,而且与真实数据的分布更加接近。这种对抗性训练的过程使得天生器和判别器之间到达一种均衡,最终这个过程不停持续到天生器产生与输入信息无法区分的数据为止。
2.2 天生式人工智能的工作过程
天生式人工智能的工作过程通常如下:

三、如何评估天生式人工智能模子
选择正确的模子对于某些特定的任务至关紧张,因为每个任务都有其独特的需求和目标,而不同的天生式人工智能模子也各有其优缺点。比如,某一些模子可能比力擅永天生高质量的图像内容,而另一些模子则更擅永天生顺畅连贯的文本内容。
因此在选择时,必要器重对天生模子进行评估以确定最得当特定任务的模子。这种评估不仅有助于选择正确的模子,还有助于确定必要改进的方面。通过这种方式,可以完善模子并增加实现预期结果的可能性,从而进步人工智能系统的团体成功率。
在评估模子时,通常必要考虑三个关键要素:


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4