论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
人工智能
›
人工智能
›
AI大模型原理(通俗易懂版)——AIGC
AI大模型原理(通俗易懂版)——AIGC
飞不高
论坛元老
|
2024-8-29 08:56:37
|
显示全部楼层
|
阅读模式
楼主
主题
1525
|
帖子
1525
|
积分
4575
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
传送门:AI大模型原理(通俗易懂版)-CSDN博客
AIGC
提及近期的热门科技词汇,AIGC当之无愧位列其中。从某一天开始,我们突然发现AI可以资助天生笔墨图片音频视频等等内容了。而且让人难以分清背后的创作者到底是人类照旧AI。
这些AI天生的内容被叫做AIGC。它是
AI Generated Content
,即AI天生内容的简写。像ChatGPT天生的文章GitHub Copilot天生的代码,天生的图片等等,都属于AIGC。
天生式AI
而当AIGC这个词在国内火爆的同时,海外更流行的是别的一个词generated AI及天生式AI。从字面上来看,天生式AI和AIGC之间的关系很好明确。天生式AI所天生的内容就是AIGC。所以ChatGPT,GitHub Copilot等都属于天生式AI。由此可见,AIGC和天生式AI的概念都是很简单直白的。但因为AIGC这个词在国内比天生式AI更加流行。许多语境下,AIGC也被用于指代天生式AI。那么天生式AI和
AI机器学习、监督学习、无监督学习、强化学习、深度学习、大语言模型
等词汇之间又是什么关系?有没有一种剪不停理还乱的感觉?这个很难一言以蔽之,但通过一张图就可以直观明确他们之间的关系了。
分类
AI也叫人工智能,是盘算机科学下的一个学科,旨在让盘算机系统去模拟人类的智能,从而解决题目和完成使命。早在1956年,AI就被建立为了一个学科范畴。在今后数十年间经历过多轮低谷与繁荣。
机器学习
是AI的一个子集,它的焦点在于不需要人类做显式编程。而是让盘算机通过算法自行学习和改进去辨认模式,做出
预测和决议
。好比,如果我们通过代码告诉电脑图片里有红色阐明是玫瑰,图片里有橙色阐明是向日葵。那程序对花种类的判断就是通过人类直接明确编写逻辑达成的,不属于机器学习,机器什么也没学。但如果我们给电脑大量玫瑰和向日葵的图片,让电脑自行辨认模式,总结规律,从而能对没见过的图片进行预测和判断,这种就是机器学习。
机器学习范畴下有多个分支。包罗监督学习、无监督学习、强化学习。
在
监督学习
里,机器学习算法会接受有标签的训练数据。标签,
就是期望的输出值
。所以每一个训练数据点都既包罗输入特征,也包罗期望的输出值。算法的目标是学习输入和输出之间的映射关系,从而在给定新的输入特征后,能够正确预测出相应的输出值。经典的监督学习使命包罗分类,也就是把数据分别为不同的种别。以及回归,也就是对数值进行预测。好比拿一堆猫猫狗狗的照片和照片对应的猫狗标签进行训练。然后让模型根据没见过的照片预测是猫照旧狗,这就属于
分类
。拿一些房子特征的数据,好比面积、卧室数、是否带阳台等,和相应的房价作为标签进行训练,然后让模型根据没见过的房子的特征预测房价,这就属于
回归
。
无监督学习
和监督学习不同的是,他学习的数据是没有标签的。所以算法的使命是自主发现数据里的模式或规律。经典的无监督学习使命包罗聚类,也就是把数据进行分组。好比拿一堆新闻文章,让模型根据主题或内容的特征,自动把相似文章进行组织。
而
强化学习
则是让模型在环境里采取行动。得到结果
反馈
,从反馈里学习,从而能在给定情况下采取最佳行动来最大化嘉奖或是最小化丧失。所以就跟训小狗一样,刚开始的时间小狗会随心所欲做出许多动作,但随着和训犬师的互动,小狗会发现某些动作能够得到嘉奖。某些动作没有嘉奖,某些动作以致会遭受处罚。通过观察动作和奖惩之间的接洽。小狗的举动会渐渐接近训犬师的期望。强化学习可以应用在许多使命上,好比说让模型下围棋,得到不偕行动导致的嘉奖或丧失反馈,从而在一局局游戏里优化计谋,学习如何采取行动到达高分。
那题目来了,
深度学习
属于这三类里的哪一类?它不属于内里的任何一类。深度学习是机器学习的一个方法,焦点在于使用人工神经网络模仿人脑处理处罚信息的方式。通过层次化的方法提取和表示数据的特征。神经网络是由许多基本的盘算和储存单元构成,这些单元被称为神经元,这些神经元通过层层连接来处理处罚数据。并且深度学习模型通常有许多层,因此称为深度。好比要让盘算机辨认小猫的照片,在深度学习中,数据首先被通报到一个输入层,就像人类的眼睛看到图片一样,然后数据通过多个隐藏层,每一层都会对数据进行一些复杂的数学运算,来资助盘算机明确图片中的特征,例如小猫的耳朵、眼睛等等。最后盘算时机输出一个答案,表明这是否是。一张小猫的图片神经网络可以用于监督学习,无监督学习,强化学习。所以深度学习不属于他们的子集,天生式AI是深度学习的一种应用。
使用神经网络来辨认现有内容的模式和结构,学习天生新的内容和形式可以是文本、图片、音频等等。而大语言模型也叫LLM(large language model)也是深度学习的应用。专门用于进行天然语言处理处罚使命,大语言模型内里的大字阐明模型的参数量非常大,大概有数十亿以致到万亿个,而且训练过程中也需要海量文本数据集,所以能更好的明确天然语言以及天生高质量的文本。
大语言模型的例子有非常多,好比国外的ChatGPT。以GPT3这个模型为例子,它会根据输入提示以及前面天生过的词,通过概率盘算,渐渐天生下一个词或token来输出文本序列。但
不是所有的天生式AI都是大语言模型,而所有的大语言模型是否都是天生式AI这也存在些许争议
。
前半句很好明确,
天生图像的扩散模型就不是大语言模型
。它并不输出文本,同时有些人以为不是所有大语言模型都是天生式AI。这是因为有些大学模型由于其架构特点,不适当进行文本天生。
谷歌的Bert模型就是一个例子。它的参数量和训练数据很大,属于大语言模型。应用方面,Bert明确上下文的能力很强,因此被谷歌用在搜索上。用来进步搜索排名和信息摘录的正确性,它也被用于情感分析文本分类等使命。但同时Bert不善于文本天生,特别是连贯的长文本天生。所以有些人以为此类模型不属于天生式AI的范畴。这些概念共同构成了天生式AI的焦点要素。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
飞不高
论坛元老
这个人很懒什么都没写!
楼主热帖
Java集合的lastlastIndexOfSubList()方 ...
WPF开发经验-实现自带触控键盘的TextBo ...
如何在 K8S 集群范围使用 imagePullSec ...
【关系型数据库】事务特性及事务隔离级 ...
Python批量采集百度资讯文章,如何自定 ...
微信小程序集合3(百度小说+电商+仿哗 ...
MapReduce开发
瓦片地图
浅谈售前的业务思维
Navicat 连接服务器不成功(Access den ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
区块链
数据安全
数据仓库与分析
快速回复
返回顶部
返回列表