qidao123.com技术社区-IT企服评测·应用市场
标题:
书生大模型全链路开源开放体系
[打印本页]
作者:
东湖之滨
时间:
2024-12-19 12:40
标题:
书生大模型全链路开源开放体系
全链条开源,与社区生态无缝毗连
数据
书生·万卷
首个精致处置惩罚的开源多模态语料库
Miner U
一站式开源高质量数据提取工具,支持多格式(PDF/网页/电子书),智能萃取,天生高质量预训练/微调语料。
复杂版面/公式精准识别
性能凌驾商业软件
Label LLM
专业致力于LLM对话标注,通过灵活多变的工具设置与多种数据模态的广泛兼容,为大模型量身打造高质量的标注数据。
支持指令采集、偏好收集、对话评估…
多人协作、任务管理、源码开放可修改
Label U
一款轻量级开源标注工具,自由组合多样工具,无缝兼容多格式数据,同时支持载入预标注,加载数据标注服从。
支持图片、视频、音频多种数据标注
小巧灵活,AI标注导入二次人工精修
预训练
InternEvo
性能凌驾国际主流训练框架DeepSpeed
模型训练
InternLM、LLAMA、LLAVA、MoE
分布式训练系统
分布式训练数据并行、流水并行、张量并行、序列并行、权重并行、自动并行
仿真器求最优解并行设置
通讯优化集合/p2p通讯
显存优化
计算加速、高性能算子库、算子融合、混淆精度训练
训练支持系统
非常恢复
可视化
跨集群任务调理
日志系统
监控系统
告警系统
根本办法
跨硬件平台:CPU/GPU/NPU
存储:分布式文件存储/OSS
网络:训练/数据网络
大模型训练
支持千卡以上模型训练,千卡加速比可达92%
极致性能优化
4D并行+Ring Attention最高支持1M长文训练
软硬件生态
兼容HuggingFace生态
支持NV与910B筹集群
全场景训练
预训练+微调+RLHF
全场景覆盖
微调
XTuner
适配多种生态
多种微调算法
多种微调&偏好对齐算法,覆盖各类应用场景
适配多种开源生态
支持加载HuggingFace、ModelScope模型或数据集
自动优化加速
开辟者无需关注复杂的显存优化与计算加速细节
支持千亿参数+百万上下文训练
适配多种硬件
训练方案覆盖NVIDIA 20系以上全部显卡
最低只需 8GB 显存即可微调 7B模型
部署
LMDeploy
团体架构
评测
OpenComass评测体系
获得 Meta 官方推荐唯一国产大模型评测体系
开源社区最完善的评测体系之一凌驾100+评测集50万+题目
三位一体
工具-基准-榜单
应用
智能体 Lagent
轻量级智能体框架
支持多种范例的智能体本领
灵活支持多种大语言模型
简单易扩展,支持丰富的工具
HuixiangDou 企业级知识库构建工具
介绍:HuixiangDou是群聊场景LLM知识助手,为即时通讯群聊场景计划。
场景特点:无关题目不吭声、明确答复的直接复兴、不违背核心代价观
特性:
开源:BSD-3-Clasue免费商用
实战派:应用RAG和KG,1500+知识库,500+用户群,业务数据实测精度
领域知识:7中文档格式,更新立即生效
安全:支持私有化部署,数据不上传
简单便宜:最低仅2G显存,支持现有客户群
扩展性强:2类IM软件,9个LLM接口
社区生态
Hugging Face
LLM
LLaMA
TensorRT-LLM
LM Studio
LLaMA-Factory
LIamaIndex
LangChain
ollama
MLX
llamafile
Swift
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
欢迎光临 qidao123.com技术社区-IT企服评测·应用市场 (https://dis.qidao123.com/)
Powered by Discuz! X3.4