论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
虚拟化.超融合.云计算
›
公有云
›
“模”力十足!天翼云息壤一体化智算服务平台训推服务能 ...
“模”力十足!天翼云息壤一体化智算服务平台训推服务能力重磅升级! ...
南七星之家
论坛元老
|
2024-9-20 20:14:56
|
显示全部楼层
|
阅读模式
楼主
主题
1551
|
帖子
1551
|
积分
4655
9月4日,“天翼云息壤——大模子训推一体化服务能力升级”线上发布会成功举办。会上,息壤平台训推服务能力重磅升级,
新增闭源、多模态基座大模子以及数据集
,
支持万卡规模训练
,训练稳定性再次提升,
新增体验空间
,为基础大模子训练、行业大模子训推提供一站式办理方案。天翼云多位专家与合作同伴代表发表出色演讲,共探人工智能大模子的发展趋势与挑衅,并对平台升级后的能力与优势,以及在医疗领域的赋能实践进行了深度解读。
平台全新升级
提供稳定高效的大模子训推一体化服务
我国大模子已进入快速发展阶段,但大模子的研发与推广仍然面临一定的压力和挑衅,呈现出“基础丰富,应用不足”的特点。一方面,大模子的训练和应用需要大量的高质量数据,当前我国数据资源有限且分散,导致模子训练结果并不理想;另一方面,模子的参数量和盘算复杂度持续增加,对算力的需求以几何级数增长。行业亟需更加高效、集约化的智算平台的支撑,以驱动国产大模子高质量发展与产业化应用。
天翼云智算产品线总监张安发表示,升级后的平台专为应对大参数大模子、行业模子应用所带来的挑衅而计划,它
提供了一个全栈式的服务,旨在简化大模子从训练到部署的整个流程
。平台新增了开闭源大模子、多模态大模子,供用户机动选择,模子数量处于国内领先水平;新增上线专业的大模子数据集,用户可直接将数据用于大模子训练、推理使命中,实现了算法、算力、数据三要素的融合;新增体验中心,用户可直接在线互动体验;打造了全链路故障感知和规复、全链路日志监控工具,突破断点续训等焦点技术,使全链路监控训练更稳定。
随着模子参数量从千亿迈向万亿,大模子对底层算力的诉求进一步升级,万卡乃至超万卡集群已经成为大模子产业发展的刚需,同时对训练稳定性要求极高。根据公开报道,Llama3.1-405B原生训练耗时持续54天,累计发生419次故障,均匀每3小时产生一次。天翼云智算产品线专家范顺国介绍,
天翼云训推服务平台是国内首个实现公有云国产化万卡训练的平台
,能够为万亿参数级别大模子训练提供一体化方案。天翼云在北京万卡池完成了Llama3-405B(4000亿参数)大模子的训练,700亿参数模子Llama2-70B
在万卡规模下顺利拉起并完成训练,MFU达到43%
,在业界达到了领先水平。天翼云优化断点续训技术,在Llama2-70B模子训练中,
实现秒级故障检测,分钟级定位并处理故障,分钟级训练规复
,这一性能已达到行业前沿水平。
此外,基于平台能力,天翼云联合同伴上线了魔乐(Modelers)
开发
者社区,通过整合优质中文AI资源、提供极致易用的工具链,以及国产化算力使能,端到端支持AI应用
开发
全流程,助力孵化国产原生模子。
三种交付形态+两大应用场景
助力企业加速AI应用落地
AI技术加速融入各行各业,大模子的应用远景也愈加广阔。天翼云息壤一体化智算服务平台从行业及客户需求出发,在技术与能力的不断迭代升级中使能企业制胜AI时代。
天翼云智算产品线专家夏曼雪对平台功能进行了具体演示。
平台支持公有云、混淆云和轻量化三种交付形态。
其中,公有云版本即开即用、计费机动,支持按卡时计费、包周期计费;混淆云版本支持千卡规模的私有化项目交付;轻量化版本支持天翼云A100云主机、H800/A100/A800/A10裸金属服务器、物理机等硬件形态交付部署,机动便捷。
场景应用方面,平台主要面向两类客户场景。
一是具备深厚行业知识、拥有自主数据的行业客户,如政务、金融机构、汽车、媒体、旅游等行业。依托零代码平台和丰富的开闭源大模子,客户无需掌握算法编程即可完成模子的调优和API调用,从而加速大模子从概念到落地的历程。二是拥有很强的算法能力,但在智算集群的管理
运维
方面履历不足的大模子厂商。平台为这类用户提供专业的
开发
和
运维
工具,实现大规模分布式训练和断点续训能力,在保障稳定性的同时,通过构建AI加速引擎助力用户提升算力使用率。
目前,天翼云已服务多个客户的训推场景,助力行业大模子训推更便捷、更高效、更稳定安全。中国中医科学院中医药信息研究所(简称“中医药信息研究所”)所长特聘助理朱彦分享了与天翼云合作开展中医药大模子的探究与实践,
通过与天翼云合作,中医药信息研究所得到了更加稳定和高效的盘算支持。
借助天翼云大模子学习机,搭建低代码服务平台,中医药信息研究所高效完成了文献和临床数据的管理工作,包括自动抽取、尺度化等使命。此外,在中医垂类大模子的微调、应用发布方面,平台将提供算法支持和模子优化工具,帮助客户充分发掘中医药数据的内在代价。双方合作与探索,不仅进一步加速了中医大模子的研究和应用,以及中医药的现代化历程,也将为全球康健奇迹的发展做出重要贡献。
伴随以大模子为焦点的人工智能技术的快速发展,各行各业正经历着一场前所未有的智能化转型海潮。作为云服务国家队,天翼云将持续聚焦人工智能场景进行技术创新,积极加码布局智算基础办法,赋能企业跑出“AI加速度”,携手合作同伴共同推动经济社会智能化水平迈向新高度。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
正序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
发新帖
回复
南七星之家
论坛元老
这个人很懒什么都没写!
楼主热帖
MySQL并行复制(MTS)原理(完整版) ...
详讲Java开发中的六个常用API(Math,S ...
【K8S】K8S入门基础知识
软件项目管理 3.5.敏捷生存期模型 ...
云原生之 Docker篇 Docker Stack介绍及 ...
鸿蒙到底是不是安卓?
java中Collections.addAll方法具有什么 ...
BOS EDI 项目 Excel 方案开源介绍 ...
postman结合newman生成测试报告 ...
【.Net力扣刷题】第1656题:设计有序流 ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
Oracle
快速回复
返回顶部
返回列表