ToB企服应用市场:ToB评测及商务社交产业平台

标题: 谷歌推出PaliGemma 2 mix:用于多使命的视觉语言模型,开箱即用。 [打印本页]

作者: 饭宝    时间: 昨天 18:26
标题: 谷歌推出PaliGemma 2 mix:用于多使命的视觉语言模型,开箱即用。
去年 12 月,谷歌推出了 PaliGemma 2 ,这是Gemma系列中的升级版视觉语言模型。该版本包含差别大小(3B、10B 和 28B 参数)的预训练检查点,可轻松针对各种视觉语言使命和范畴举行微调,比方图像分割、短视频字幕、科学问答和文本相干使命,并实现高性能。


2月19日,谷歌宣布推出 PaliGemma 2 mix 检查点。PaliGemma 2 mix 是针对多种使命举行调解的模型,允许直接探索模型功能并将其开箱即用,用于常见用例。
PaliGemma 2 mix 有什么新功能?


假如已经在使用原始的 PaliGemma 混合检查点,则可以直接升级到 PaliGemma 2,而无需举行任何更改。该模型根据提示方式实验差别的使命。
效果展示

检测


效果



多物体检测




效果






效果:



光学字符辨认 (OCR)




效果:



分割


效果



问答




效果

beach
字幕




效果

a cow standing on a beach next to a sign that says warning dangerous rip current.
光学字符辨认 (OCR)



效果:


立即开始



免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4