AI大模子【底子 01】智能AI开源模子与大模子接口整理(8个开源模子+7个大模子接口)

[复制链接]
发表于 2026-2-11 09:42:23 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
数据重要泉源于 【数据学习】的整理和汇总。
1.阐明

1.1 开源模子


      
  • 免费、当地摆设安全性高  
  • 部分开源模子版本相对落伍、硬件资源需求高、性能一样寻常  
  • 技能门槛高、必要举行肯定量的开辟工作  
  • 更新维护本钱较高
1.2 大模子接口


      
  • 付费(按需收费)、非当地摆设大概存在数据安全题目  
  • 模子较新、无需硬件资源、性能好  
  • 开辟工作量相对较少  
  • 及时更新无需维护
2.开源模子整理

2.1 ChatGLM


      
  • ChatGLM-6B(发布时间:2023-03-14;模子文件巨细:13.5GB)https://github.com/THUDM/ChatGLM-6B
ChatGLM 是由清华大学 KEG 实验室和智谱 AI 基于千亿基座模子 GLM-130B (General Language Model 通用语言模子)开辟的对话语言模子。ChatGLM 在 GLM-130B 的底子上连续举行文本和代码预训练并通过有监督微调等技能实现人类意图对齐,具备文案写作、信息抽取、脚色饰演、问答、对话等本事。
     量化品级    最低GPU显存              FP16(无量化)    13GB          INT8    10GB          INT4    6GB   
      
  • ChatGLM2-6B(发布时间:2023-06-25;模子文件巨细:12.5GB)https://github.com/THUDM/ChatGLM2-6B
基座模子使用了GLM模子的混淆目标函数,在1.4万亿中英文tokens数据集上训练,并做了模子对齐,第二代在各项使命中的提拔幅度如下:
     评测使命    使命范例    ChatGLM-6B得分    ChatGLM2-6B得分    提拔幅度              MMLU    英文语言明确    40.63    47.86    ↑ 23%          CEval    中文大语言模子评估    38.9    51.7    ↑ 33%          GSM8K    数学(英文版)    4.82    32.37    ↑ 571%          BBH    大语言模子的BIG-Bench Hard使命    18.73    33.68    ↑ 60%    更长的上下文:在第一代ChatGLM-6B上,模子的最高上下文长度是2K。而第二代的ChatGLM2-6B的基座模子使用了FlashAttention技能,升级到32K。而据此微调的对话模子ChatGLM2-6B则可以在8K长度上下文条件下自由流畅举行对话。因此,支持更多轮次的对话,而且官方体现将在后续继承优化上下文长度限定。
更高效的推理:ChatGLM2-6B使用了Multi-Query Attention技能,可以在更低地显存资源下以更快的速率举行推理,推理速率相比第一代提拔42%!同时,在INT4量化模子中,6G显存的对话长度由1K提拔到了8K!
     量化品级    编码 2048 长度的最小显存    天生 8192 长度的最小显存              FP16 / BF16    13.1 GB    12.8 GB          INT8    8.2 GB    8.1 GB          INT4    5.5 GB    5.1 GB    2.2 Baichuan

Baichuan Intelligent Technology是搜狗首创人王小川开办的一家人工智能企业。

      
  • Baichuan-7B(发布时间:2023-09-06;模子文件巨细:14GB)https://github.com/baichuan-inc/Baichuan-7B
是由百川智能开辟的一个开源可商用的大规模预训练语言模子。基于 Transformer 布局,在约莫 1.2 万亿 tokens 上训练的 70 亿参数模子,支持中英双语,上下文窗口长度为 4096。在尺度的中文和英文 benchmark(C-Eval/MMLU)上均取得同尺寸最好的结果。

      
  • Baichuan-13B-Chat(发布时间:2023-07-08;模子文件巨细:26.6GB)https://github.com/baichuan-inc/Baichuan-13B
Baichuan-13B 是由百川智能继 Baichuan-7B 之后开辟的包罗 130 亿参数的开源可商用的大规模语言模子,在权势巨子的中文和英文 benchmark 上均取得同尺寸最好的结果。本次发布包罗有预训练 (Baichuan-13B-Base) 和对齐 (Baichuan-13B-Chat) 两个版本。Baichuan-13B 有如下几个特点:
      
  • 更大尺寸、更多数据:Baichuan-13B 在 Baichuan-7B 的底子上进一步扩大参数量到 130 亿,而且在高质量的语料上训练了 1.4 万亿 tokens,高出 LLaMA-13B 40%,是当前开源 13B 尺寸下训练数据量最多的模子。支持中英双语,使用 ALiBi 位置编码,上下文窗口长度为 4096。  
  • 同时开源预训练和对齐模子:预训练模子是实用开辟者的『 基座 』,而广大平凡用户对有对话功能的对齐模子具有更强的需求。因此本次开源我们同时发布了对齐模子(Baichuan-13B-Chat),具有很强的对话本事,开箱即用,几行代码即可简单的摆设。  
  • 更高效的推理:为

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金
回复

使用道具 举报

登录后关闭弹窗

登录参与点评抽奖  加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表