论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
大数据
›
数据仓库与分析
›
如何评价GPT-4o?
如何评价GPT-4o?
三尺非寒
论坛元老
|
2024-6-22 06:48:15
|
显示全部楼层
|
阅读模式
楼主
主题
1969
|
帖子
1969
|
积分
5907
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
去年3月,GPT-4震撼发布,距今已逾一年。尽管科技巨头如谷歌、Meta,以及硅谷新贵如Mistral AI、Anthropic在那之后都争相发布了竞品大模型,但似乎至今还未有第二款大模型达到与GPT-4一样平常横扫科技圈的力量——直到GPT-4o的诞生。
当地时间5月13日,OpenAI在万众期待中推出了名为GPT-4o的新一代旗舰AI模型。当日,OpenAI首席实验官阿尔特曼发推文表现,新的GPT-4o是OpenAI“有史以来最好的模型”。
据悉,GPT-4o支持笔墨、图像、语音和视频输入和输出,OpenAI承诺未来将免费让平凡用户使用,同时将开放API给GPT
开发
者,价格直接自制50%。现在,该模型仅开放了文本和图像功能。
本周,《每日经济消息》记者从图像和文本两大层面深度体验了GPT-4o的效果,着重识图能力的测试。综合来看,GPT-4o在反应速率上有极大的提拔,识图方面冠绝群雄,不仅可以或许准确辨认图片,还能以类人的思维明确图像内容。而在长文本总结方面,与当前模型的差距并不突出。
GPT-4o到底是如何“炼”成的?当地时间5月15日,OpenAI连合创始人之一John Schulman在接受科技播客主持人Dwarkesh Patel采访时透露,后训练是进步模型性能的关键因素。
GPT-4o的识图能力有多牛?四大维度深度体验
基于图片类型,记者将识图功能的测评分为4大维度,分别为平凡图像、特定专业范畴的图像、数据图像和手写图像。
一、平凡图像辨认
(1)内容较为单一的图像
记者起首选取了一张波士顿动力呆板人跨越停滞物的图像,内容较为简单,图上无笔墨,随后要求大模型仔细识图并描述内容。GPT-4o非常出色地完成了使命,细节描述无可匹敌,准确无误地辨认了呆板人的运动状态、地面停滞等丰富细节。
图片来源:GPT-4o
(2)内容较为复杂的漫画
接着,记者选取了由多个图像组成、内容较为复杂的漫画。GPT-4o可以完备地总结出每一格漫画的内容,并以准确的序次举行讲述。更令人吃惊的是,GPT-4o完全以类人的思维解构了漫画的逻辑,它可以或许明确这是一种“拟人和夸张的手法”,并准确明确了漫画的幽默感。
图片来源:GPT-4o
二、特定专业范畴的图像
(1)医学范畴
记者准备了一张mRNA疫苗工作原理图,图像并未直接说明这是一张疫苗工作原理图,但图上写有相应笔墨,例如“刺突蛋白”、“蛋白质翻译”和“脂质纳米颗粒”等术语。
GPT-4o的表现惊艳,不仅准确辨认了该图的主旨内容,并依据图示上的过程用通俗的语言表明了mRNA疫苗的工作原理。
图片来源:GPT-4o
(2)房地产范畴
接着,记者选取了一张修建面积134平方米的户型图,让大模型识图并总结户型优劣势。GPT-4o呈现了总体令人较为满足的效果,该模型不仅能辨认户型根本情况,分辨出“半赠送”的修建面,也可以或许清楚地总结户型的优劣势,但在数据准确性上有待进步。
图片来源:GPT-4o
三、数据图像的分析和转换
在此维度下,记者选取了一张折柱混合数据图。GPT-4o可以或许准确地辨认数据图上的信息,并按要求以图表的形式重新呈现,准确率高达100%。
图片来源:GPT-4o
四、手写指令和逻辑推理
最后,记者上了点难度,用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美,不仅准确辨认了手写体笔墨并依照指示,且答题逻辑完全合理,也最终给出了精确答案。
图片来源:GPT-4o
除了识图功能之外,记者也从文本层面临GPT-4o的长文本总结功能举行了测评。记者选取了一篇近万字的观察稿件,让其总结要点。GPT-4o不负众望地完成了使命。
图片来源:GPT-4o
GPT-4o是如何“炼”成的?后训练功不可没
从前述体验看,GPT-4o的反应速率和多模态能力令人印象深刻。OpenAI首席实验官阿尔特曼直言,新的GPT-4o是OpenAI“有史以来最好的模型”。
那么,GPT-4o的多模态能力是如何“炼”成的呢?这背后的秘密或允许以从OpenAI连合创始人John Schulman当地时间5月15日与科技播客主持人Dwarkesh Patel的对话中一窥究竟。
John Schulman在采访中提到,
后训练(Post-Training)
是进步模型性能的有效方法,通过额外的训练和微调可以明显进步模型的能力。
在这里需要区分两个关键的概念,在大模型训练中通常会提到“预训练”、“后训练”等术语。预训练常在大规模的数据集上举行(通常是让模仿互联网上的内容),目的是通过在较大的使命上训练模型,使得模型学习到通用的特征。
而后训练指的是专注针对特定行为优化模型,在预训练模型的根本上,使用额外的大规模未标注语料库继承训练模型参数,这个过程可以进一步丰富模型对语言的明确和生成能力,使其获得更广泛的知识。
根据John Schulman的说法,后训练是GPT-4模型不断升级的关键因素。据悉,当前 GPT-4 的 Elo分数(编者注:一种大模型基准评级尺度)比最初发布的版本高出了约莫 100 分,而这种改进大部分都是由后训练带来的。
他同时暗示,在未来用于训练的算力中,OpenAI可能将偏向后训练。他说道:“模型生成的输出质量比网上的大多数内容都要高。因此,让模型自己思索似乎更有原理,而不仅仅是训练来模仿网络上的内容。以是,我认为从第一性原理上来说,这是有说服力的。我们通过后训练取得了很多进步。我盼望我们会继承推动这种方法,并且可能会增加投入到后训练中的盘算力。”
针对GPT-4o强大的多模态能力,英伟达高级研究科学家Jim Fan发表长文表现,从技能角度来看,这需要对标记化和架构举行一些新的研究,但总体上是一个数据和体系优化问题。
在Jim Fan看来,GPT-4o很可能是GPT-5的一个早期训练点,但训练尚未完成。从贸易角度上,他认为,“GPT-4o的定位透露出OpenAI某种不安全感,在谷歌
开发
者大会之前(发布GPT-4o),(意味着)OpenAI宁愿逾越我们对GPT-4.5的生理预期,也不愿因为达不到对GPT-5的极高期望而令人失望。这是一个聪明的举措,可以争取更多时间。”现在,业界广传GPT-5将在年底发布。
Jim Fan的观点与一些业内分析不谋而合。分析认为,OpenAI选择此时发布GPT-4o,是为了在竞争对手尤其是谷歌不断发起挑衅的情况下,继承保持领先地位。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
正序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
发新帖
回复
三尺非寒
论坛元老
这个人很懒什么都没写!
楼主热帖
Centos7安装Mysql5.7(超详细版) ...
微信小程序--点餐系统(本地服务器+源 ...
可观测性之两大误区
小白也可以轻松破解被加密的ZIP口令啦 ...
GPRS与4G网络:技术差异与应用选择 ...
如何获取Class对象呢?
Java多线程超级详解(只看这篇就够了) ...
快速入门python看过的一些资料 ...
Docker 基础 - 1
Spark简单介绍,Windows下安装Scala+Ha ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
中间件
SQL-Server
区块链
人工智能
物联网
快速回复
返回顶部
返回列表