如何评价GPT-4o?

打印 上一主题 下一主题

主题 674|帖子 674|积分 2022



去年3月,GPT-4震撼发布,距今已逾一年。尽管科技巨头如谷歌、Meta,以及硅谷新贵如Mistral AI、Anthropic在那之后都争相发布了竞品大模型,但似乎至今还未有第二款大模型达到与GPT-4一样平常横扫科技圈的力量——直到GPT-4o的诞生。
当地时间5月13日,OpenAI在万众期待中推出了名为GPT-4o的新一代旗舰AI模型。当日,OpenAI首席实验官阿尔特曼发推文表现,新的GPT-4o是OpenAI“有史以来最好的模型”。
据悉,GPT-4o支持笔墨、图像、语音和视频输入和输出,OpenAI承诺未来将免费让平凡用户使用,同时将开放API给GPT开发者,价格直接自制50%。现在,该模型仅开放了文本和图像功能。
本周,《每日经济消息》记者从图像和文本两大层面深度体验了GPT-4o的效果,着重识图能力的测试。综合来看,GPT-4o在反应速率上有极大的提拔,识图方面冠绝群雄,不仅可以或许准确辨认图片,还能以类人的思维明确图像内容。而在长文本总结方面,与当前模型的差距并不突出。
GPT-4o到底是如何“炼”成的?当地时间5月15日,OpenAI连合创始人之一John Schulman在接受科技播客主持人Dwarkesh Patel采访时透露,后训练是进步模型性能的关键因素。
GPT-4o的识图能力有多牛?四大维度深度体验

基于图片类型,记者将识图功能的测评分为4大维度,分别为平凡图像、特定专业范畴的图像、数据图像和手写图像。
一、平凡图像辨认
(1)内容较为单一的图像
记者起首选取了一张波士顿动力呆板人跨越停滞物的图像,内容较为简单,图上无笔墨,随后要求大模型仔细识图并描述内容。GPT-4o非常出色地完成了使命,细节描述无可匹敌,准确无误地辨认了呆板人的运动状态、地面停滞等丰富细节。


图片来源:GPT-4o
(2)内容较为复杂的漫画
接着,记者选取了由多个图像组成、内容较为复杂的漫画。GPT-4o可以完备地总结出每一格漫画的内容,并以准确的序次举行讲述。更令人吃惊的是,GPT-4o完全以类人的思维解构了漫画的逻辑,它可以或许明确这是一种“拟人和夸张的手法”,并准确明确了漫画的幽默感。


图片来源:GPT-4o
二、特定专业范畴的图像
(1)医学范畴
记者准备了一张mRNA疫苗工作原理图,图像并未直接说明这是一张疫苗工作原理图,但图上写有相应笔墨,例如“刺突蛋白”、“蛋白质翻译”和“脂质纳米颗粒”等术语。
GPT-4o的表现惊艳,不仅准确辨认了该图的主旨内容,并依据图示上的过程用通俗的语言表明了mRNA疫苗的工作原理。


图片来源:GPT-4o
(2)房地产范畴
接着,记者选取了一张修建面积134平方米的户型图,让大模型识图并总结户型优劣势。GPT-4o呈现了总体令人较为满足的效果,该模型不仅能辨认户型根本情况,分辨出“半赠送”的修建面,也可以或许清楚地总结户型的优劣势,但在数据准确性上有待进步。



 


 



图片来源:GPT-4o
三、数据图像的分析和转换
在此维度下,记者选取了一张折柱混合数据图。GPT-4o可以或许准确地辨认数据图上的信息,并按要求以图表的形式重新呈现,准确率高达100%。


图片来源:GPT-4o
四、手写指令和逻辑推理
最后,记者上了点难度,用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美,不仅准确辨认了手写体笔墨并依照指示,且答题逻辑完全合理,也最终给出了精确答案。



图片来源:GPT-4o
除了识图功能之外,记者也从文本层面临GPT-4o的长文本总结功能举行了测评。记者选取了一篇近万字的观察稿件,让其总结要点。GPT-4o不负众望地完成了使命。




图片来源:GPT-4o
GPT-4o是如何“炼”成的?后训练功不可没
从前述体验看,GPT-4o的反应速率和多模态能力令人印象深刻。OpenAI首席实验官阿尔特曼直言,新的GPT-4o是OpenAI“有史以来最好的模型”。
那么,GPT-4o的多模态能力是如何“炼”成的呢?这背后的秘密或允许以从OpenAI连合创始人John Schulman当地时间5月15日与科技播客主持人Dwarkesh Patel的对话中一窥究竟。
John Schulman在采访中提到,后训练(Post-Training)是进步模型性能的有效方法,通过额外的训练和微调可以明显进步模型的能力。
在这里需要区分两个关键的概念,在大模型训练中通常会提到“预训练”、“后训练”等术语。预训练常在大规模的数据集上举行(通常是让模仿互联网上的内容),目的是通过在较大的使命上训练模型,使得模型学习到通用的特征。
而后训练指的是专注针对特定行为优化模型,在预训练模型的根本上,使用额外的大规模未标注语料库继承训练模型参数,这个过程可以进一步丰富模型对语言的明确和生成能力,使其获得更广泛的知识。
根据John Schulman的说法,后训练是GPT-4模型不断升级的关键因素。据悉,当前 GPT-4 的 Elo分数(编者注:一种大模型基准评级尺度)比最初发布的版本高出了约莫 100 分,而这种改进大部分都是由后训练带来的。
他同时暗示,在未来用于训练的算力中,OpenAI可能将偏向后训练。他说道:“模型生成的输出质量比网上的大多数内容都要高。因此,让模型自己思索似乎更有原理,而不仅仅是训练来模仿网络上的内容。以是,我认为从第一性原理上来说,这是有说服力的。我们通过后训练取得了很多进步。我盼望我们会继承推动这种方法,并且可能会增加投入到后训练中的盘算力。”
针对GPT-4o强大的多模态能力,英伟达高级研究科学家Jim Fan发表长文表现,从技能角度来看,这需要对标记化和架构举行一些新的研究,但总体上是一个数据和体系优化问题。
在Jim Fan看来,GPT-4o很可能是GPT-5的一个早期训练点,但训练尚未完成。从贸易角度上,他认为,“GPT-4o的定位透露出OpenAI某种不安全感,在谷歌开发者大会之前(发布GPT-4o),(意味着)OpenAI宁愿逾越我们对GPT-4.5的生理预期,也不愿因为达不到对GPT-5的极高期望而令人失望。这是一个聪明的举措,可以争取更多时间。”现在,业界广传GPT-5将在年底发布。
Jim Fan的观点与一些业内分析不谋而合。分析认为,OpenAI选择此时发布GPT-4o,是为了在竞争对手尤其是谷歌不断发起挑衅的情况下,继承保持领先地位。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

三尺非寒

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表