用户名
Email
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
帖子
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
数据库
›
SQL-Server
›
ChatGPT是如何天生长文的
ChatGPT是如何天生长文的
吴旭华
论坛元老
|
2025-1-1 02:51:54
|
显示全部楼层
|
阅读模式
楼主
主题
1776
|
帖子
1776
|
积分
5328
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
说真话,如今我们对chatGPT的最深的印象就是他是一个各方面知识都比力全面的机器助手,我们的问题他都能天生答案,不过各人发现没有,它天生相对应的长文的时候,都是一个词一个词蹦出来的,有的时候是一个个词组蹦出来的。
所以很简单,chatGPT在做的事情就是天生下一个词!!!
那么问题就来了,chatGPT是怎么知道下一个词是什么的呢?对于同一个问题它每次天生的回答会不会一样呢?第二个问题信赖各人已经知道了,根本上不会一样,大概大要意思是差不多的,各人可以想象跳迷宫,大概你第一次跳迷宫到了A宫格,下一步选择了B宫格,但是下一次到了A宫格的时候你也可以选择C宫格了。
chatGPT实在是在做选择题,它并不知道下一个词是什么,只是选择概率比力大的词,然后天生对应的文章,所以问题的关键就是,如何知道下一个概率最大的词呢?
我们先假设这样一个场景,选取一篇小说,比如大概有500万词,先对500万个词举行一个去重,比如得到了5万个词,然后统计下这5万个词相互之间下一个的概率,怎么说呢?比如我们先选取第一个词为我,我们可以从这500万个词中找到我背面跟的所有词吧,然后对应的这些词的出现次数我们可以拿到吧,比如”的”出现的次数为1万,”是”出现的次数为0.5万,所以”我” 背面出现的”的”概率相对来说最大,这样”我”背面是不是就可以跟”的”了,依次类推,”的”背面跟的词大概就是”家”,这样下来也可以让chatGPT天生一部短篇小说了;
上面是500万个词,大概天生出来的答案不够通俗,那如果我们的训练数据进一步扩大呢,到达了亿级别,10亿,百亿或者万亿级别的词,这样的话是不是根本上把握我们人类产生的险些所有可以天生的词都囊括进去了,理论上来说,ChatGPT 是不是就可以险些以人类的想法去合理地帮我们去天生同样的文本了呢。实在这和我们常听的大道理差不多,正所谓看得多知道的也多,就是说白了是量变可以到达质变
这个只是基于单个词去天生,现实上我们有的时候人类是会一次写一个词或者一个词组的,上面的词我们也可以替换成我们常见的词组,去计算对应的概率,只不过这样的话计算的量级会比力大,各人设想下,5万个词构成二元词组有多少对,是不是25亿;如果是三元词组呢,125万亿了吧,四元词组就是625亿亿了,就是625兆了,这个计算量大概轻微有点大,但是如果进一步扩大呢,比如20元词组呢,是不是大概比宇宙中的沙粒都多,我们计算机大概就存不下了。不过chatGPT是怎么做的呢,chatGPT就是建立一个模型,这个模型到底是如何实现的呢,我们下一步揭晓答案!
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
吴旭华
论坛元老
这个人很懒什么都没写!
楼主热帖
mamba-ssm安装building wheel卡着不动 ...
【云原生】第二篇--容器管理工具 Docke ...
数据库系统课程设计(高校成绩管理数据 ...
《原CSharp》第二回 巧习得元素分类 子 ...
使用TrueNas(FreeNas)进行华为手机备 ...
JVM虚拟机性能监控与故障处理工具(3) ...
java中==和equals区别
【图论】—— 有向图的强连通分量 ...
Spark 总复习
AWVS漏洞扫描器的使用
标签云
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
云原生
登录参与点评抽奖加入IT实名职场社区
下次自动登录
忘记密码?点此找回!
登陆
新用户注册
用其它账号登录:
关闭
快速回复
返回顶部
返回列表