论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
人工智能
›
人工智能
›
智谱AI 发布最新开源模型GLM-4-9B,通用能力超Llama-3-8 ...
智谱AI 发布最新开源模型GLM-4-9B,通用能力超Llama-3-8B,多模态版本比肩G ...
惊雷无声
论坛元老
|
2024-11-3 02:29:40
|
显示全部楼层
|
阅读模式
楼主
主题
1910
|
帖子
1910
|
积分
5730
自 2023 年 3 月 14 日开源 ChatGLM-6B 以来,GLM 系列模型受到广泛关注和认可。特别是 ChatGLM3-6B 开源以后,开发者对智谱AI 第四代模型的开源充满等待。
为了使小模型(10B 以下)具备更加强盛的能力,GLM 技术团队进行了大量探索工作。颠末近半年的探索,我们推出了第四代 GLM 系列开源模型:GLM-4-9B。
在预练习方面,我们引入了大语言模型进入数据筛选流程,终极得到了 10T 高质量多语言数据,数据量是 ChatGLM3-6B 模型的 3 倍以上。同时,我们接纳了 FP8 技术进行高效的预练习,相较于第三代模型,练习服从提高了 3.5 倍。在有限显存的环境下,我们探索了性能的极限,并发现 6B 模型性能有限。因此,在思量到大多数用户的显存大小后,我们将模型规模提升至 9B,并将预练习计算量增加了 5 倍。
综合以上技术升级和其他经验,GLM-4-9B 模型具备了更强盛的推理性能、更长的上下文处理能力、多语言、多模态和 All Tools 等突出能力。GLM-4-9B 系列模型包罗:底子版本 GLM-4-9B(8K)、对话版本 GLM-4-9B-Chat(128K)、超长上下文版本 GLM-4-9B-Chat-1M(1M)和多模态版本 GLM-4V-9B-Chat(8K)。
以下是 GLM-4-9B 的能力掠影:
具体性能如下:
底子能力
基于强盛的预练习基座,GLM-4-9B 的模型中英文综合性能相比 ChatGLM3-6B 提升了 40%,尤其是在中文对齐能力 AlignBench、指令遵从 IFeval、工程代码 Natural Code Bench 方面都取得了非常显著的提升。对比练习量更多的 Llama 3 8B 模型也没有逊色,英文方面有小幅领先,中文学科方面更是有着高达 50% 的提升。
长文本能力
GLM-4-9B 模型的上下文从 128K 扩展到了 1M tokens,这意味着模型能同时处理 200 万字的输入,大概相称于 2 本红楼梦大概 125 篇论文的长度。
GLM-4-9B-Chat-1M 模型在 1M 的上下文长度下进行了“大海捞针”实验,显现出了精彩的无损处理能力。
多语言能力
GLM-4-9B 支持包罗汉语、英语、俄语、西班牙语、德语、法语、意大利语、葡萄牙语、波兰语、日语、荷兰语、阿拉伯语、土耳其语、捷克语、越南语、波斯语、匈牙利语、希腊语、罗马尼亚语、瑞典语、乌克兰语、芬兰语、韩语、丹麦语、保加利亚语和挪威语在内的 26 种语言。
为了提升性能,我们将 tokenizer 的词表大小从 65k 扩充到了 150k,这一改进使得编码服从提高了 30%。在多语言能力方面,我们在六个差别的多语言明白和天生数据集上进行了测试,效果表现 GLM-4-9B-Chat 显著超越 Llama-3-8B-Instruct。具体评测效果如下:
Function Call 能力
ChatGLM3-6B 模型的函数调用不停广受各大开发者喜好。GLM-4-9B 模型的函数调用能力更是迎来了巨大的升级,相比上一代提升了 40%,在 Berkeley Function-Calling Leaderboard 上,GLM-4-9B 模型的 Function Call 能力与 GPT-4 不相上下。
All Tools 能力
“All Tools”即模型能够明白和利用一系列外部工具(比如代码执行、联网欣赏、画图、文件利用、数据库查询、API 调用等)来辅助复兴问题或完成任务。
在 1 月 16 日的 Zhipu DevDay 上,GLM-4 模型全线升级了 All Tools 能力,模型可以智能调用网页欣赏器、代码表明器、CogView 来完成用户的复杂哀求。
我们将这一功能带到了 GLM-4-9B 模型中,我们在开源堆栈中提供了一个完整的 All Tools Demo,用户可以在当地拥有一个轻量级的清言平替。
多模态能力
在强化文本能力的同时,我们初次推出了基于 GLM 基座的开源多模态模型 GLM-4V-9B。这一模型接纳了与 CogVLM2 相似的架构计划,能够处理高达 1120 x 1120 分辨率的输入,并通过降采样技术有效减少了 token 的开销。为了减小摆设与计算开销,GLM-4V-9B 没有引入额外的视觉专家模块,接纳了直接混淆文本和图片数据的方式进行练习,在保持文本性能的同时提升多模态能力。
在性能方面,GLM-4V-9B 模型显现了显著的优势。只管其参数量仅为 13B,但它成功地超越了很多参数量更大的开源模型。在浩繁任务中,GLM-4V-9B 的性能与 GPT-4V 不相上下。
以下两个 demo 展示了 GLM-4-9B 多模态能力。
在第一个示例中,我们要求模型辨认一件 T 恤上的公式印花。模型正确地辨认出这是麦克斯韦方程组,而且当我们进一步追问关于麦克斯韦方程组的细节时,模型能够依靠其文本处理能力给出复兴。这一过程证明白我们在引入多模态功能的同时,并未捐躯模型的文本处理能力。
在第二个示例中,我们输入了一个网页截图,并要求模型将其翻译成 HTML 代码。模型能够直接辨认截图中的元素,并输出相应的代码,显现了其在多模态任务中的实用性。
相关链接:
代码:
https://github.com/THUDM/GLM-4
模型:
Hugging Face:
https://huggingface.co/collections/THUDM/glm-4-665fcf188c414b03c2f7e3b7
魔搭社区:
https://modelscope.cn/organization/ZhipuAI
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
惊雷无声
论坛元老
这个人很懒什么都没写!
楼主热帖
记一次实战 Shiro反序列化内网上线 ...
基于 Sealos 的镜像构建能力,快速部署 ...
蚂蚁金服杨军:蚂蚁数据分析平台的演进 ...
Linux之iptables(NAT表)——实验篇 ...
1亿条数据批量插入 MySQL,哪种方式最 ...
超融合走向红海,下一代超融合是新蓝海 ...
联合评测 DapuStor Roealsen5 NVMe SSD ...
【学习笔记】WPF-02:XMAL基础 ...
Neo4j
学习TraceLogging事件,使用ETW记录, ...
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
linux
快速回复
返回顶部
返回列表