用户名
Email
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
帖子
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
人工智能
›
人工智能
›
【AIGC】OpenAI 宣布推出Whisper large-v3-turbo 语音转 ...
【AIGC】OpenAI 宣布推出Whisper large-v3-turbo 语音转录模型 速率提高了8 ...
我可以不吃啊
论坛元老
|
2025-2-16 20:15:12
|
来自手机
|
显示全部楼层
|
阅读模式
楼主
主题
1943
|
帖子
1943
|
积分
5829
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
OpenAI 宣布推出了一个名为 large-v3-turbo(简称 turbo)的新 Whisper 模型。这是 Whisper large-v3 的优化版本,将解码器层数从大型模型的 32 层减少到与 tiny 模型相同的 4 层。此优化版本的
开发
受到了 Distil-Whisper 的启发,后者表明使用较小的解码器可以显着提拔转录速率,同时对准确性的影响较小。
速率比 large-v3 快 8 倍,但质量险些没有下降!
Whisper large-v3-turbo 主要功能和特点:
更少的解码器层数
:
与 Whisper large-v3 相比,large-v3-turbo 只使用了 4 个解码器层,而 large-v3 使用了 32 个解码器层。较少的解码器层数使得模型在保持相对高准确度的同时,显着提高了处理速率。
优化的速率表现
:
Turbo 模型的语音转录速率比 tiny 模型更快,是 Whisper 系列模型中速率与准确性兼顾的“最佳选择”。通过使用更小的解码器层数,该模型提拔了实时转录的能力。
通过减少解码层数和启用 torch.compile,推理速率可提拔高达 4.5 倍,进一步提高了模型的服从,非常适合必要低延迟的应用场景。
多语言支持
:
支持 99 种语言的语音转录,表现精彩,而且与大型数据集兼容,包括 FLEURS 和 Common Voice 数据集,尤其在高质量录音上效果更佳。
跨语言的高效表现
:
Turbo 模型的跨语言转录表现与 large-v2 相当,但在一些语言(如泰语和粤语)上表现较弱。在一些录音质量较高的数据集(如 FLEURS)上,turbo 模型的表现优于 Common Voice 数据集。
更快的自动语音识别 (ASR)
:
结合最新的技能补丁(#2359),turbo 模型在使用 F.scaled_dot_product_attention(缩放点积注意力机制)时,能进一步提拔自动语音识别的速率。
专注于转录使命
:
Turbo 模型专为多语言转录使命微调,不适合翻译使命,因为训练时不包含翻译数据。它在纯语音转录方面的表现更为优异,但翻译使命表现较差。
使用与集成方便
:
开发
者可以通过简单的 Python 包更新或 Whisper 的命令行工具默认使用 turbo 模型,使得其在实际应用中更易于集成。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
我可以不吃啊
论坛元老
这个人很懒什么都没写!
楼主热帖
如何编写一个高效的Testbench? ...
HeadPose Estimation头部姿态估计头部 ...
微信小程序
【笔者感悟】笔者的学习心得【七】 ...
Python输出指定时间间隔内的日期 ...
Python 将 docx 转为 PDF
接口测试测什么?这篇文章告诉你 ...
HBuilder X 连接苹果手机(IOS)详细教程 ...
CVE-2015-5254漏洞复现
【必知必会的MySQL知识】①初探MySQL ...
标签云
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
Mysql
SQL-Server
登录参与点评抽奖加入IT实名职场社区
下次自动登录
忘记密码?点此找回!
登陆
新用户注册
用其它账号登录:
关闭
快速回复
返回顶部
返回列表