每日AIGC最新进展(46):上海AI Lab发布多模态大模型InternLM-XComposer-2.5 ...

打印 上一主题 下一主题

主题 862|帖子 862|积分 2586

Diffusion Models专栏文章汇总:入门与实战
  InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input and Output


InternLM-XComposer-2.5(IXC-2.5)是由上海人工智能实行室等机构开发的一款多功能大型视觉语言模型,支持长上下文输入和输出。该模型在多种文本图像理解和创作应用中表现精彩,仅凭7B的LLM后端就达到了GPT-4V级别的能力。IXC-2.5通过24K交织图像-文本上下文的训练,能够无缝扩展到96K长上下文,特别适用于必要广泛输入和输出上下文的任务。

IXC-2.5在视觉语言理解方面进行了三项重大升级:超高清分辨率理解、细粒度视频理解和多轮多图像对话。此外,IXC-2.5还扩展了两个引人注目的应用,使用额外的LoRA参数进行文本-

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

千千梦丶琪

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表