whisper-large-v3在当地电脑的部署与运行(使用AutoDL租赁的资源) ...

守听  金牌会员 | 2025-2-13 05:21:06 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 871|帖子 871|积分 2613

前言

Whisper-large-v3 是 OpenAI 推出的高性能多语言语音识别模型,基于 Transformer 架构,支持凌驾 99 种语言 的语音到文本转换和翻译,具备精彩的正确率和鲁棒性。该模型适用于复杂音频场景,如噪声情况、差别口音和长音频转录,广泛用于字幕生成、语音助手和跨语言沟通等任务。
本文旨在当地电脑情况上实现Whisper-large-v3模型的部署和运行,较为简单
一、AutoDL

起首l浏览器搜索,点开AutoDL官网,AutoDL官网位置
申请/登录账号充好钱,选择自己必要的服务器。

推荐使用GPU:NVDIA RTX 3080/3090/4090(24GB显存,高性能多核CPU,内存≥32GB)

可以直接选择“底子镜像”,常用的miniconda等情况都是有的;如果是要用github上的项目,可以在“算法镜像”部门搜索,选择合适的镜像情况。 “我的镜像”适用于之前已经租过AutoDL上的服务器,因为目前那台机器没有空闲GPU了,所以将那台机器上的数据生成自己的镜像,然后就可以选择转移到这
选择好合适的服务器后,可以开始创建镜像:

我这里选择是pytorch2.0.0,python3.8,cuda11.8的版本,远在whisper-large-v3要求的情况之上
购买完成后,点击右上角控制台,然后点击导航栏的容器实例,就能看到自己已经购买的所有服务了。

重点留意SSH登录的指令和密码这块,稍后的与vscode长途连接要用到
二、AutoDL与Vscode建立长途连接

起首现在Vscode的扩展商店中下载,安装Remote SSH

ctrl+shift+p打开命令面板,搜索如下图的内容

点击添加新的SSH主机

然后在搜索框中输入你刚才在AutoDL上购买的服务器的登陆指令,点击回车

这里默认就行,点击回车
Vscode中,右下角会有弹出,点击连接


在新弹出的窗口中,上方搜索框中输入AutoDL的登录密码,点击回车
也可以在旧窗口中点击在此窗口中连接,然后输入密码,这样就不会有两个窗口了
至此,长途连接成功,我们点击Vscode左侧的资源管理,就能访问长途连接情况的文件了,这里还必要再输入一次密码,然后点击信托此作者,就能到达如图所示的界面,你就可以在终端中进行利用了

你可以在终端中输入:
python --version
nvcc --version
就能看到根本情况版本了

输入
import torch
print(torch.cuda.is_available()) # 返回 True 表现有可用 GPU
也阐明pytorch也安装好了(这个是AutoDL提供给我们的镜像中自动有的,不用手动安装)

三、下载&运行Whisper-large-v3模型

1,下载模型,在命令行中输入:pip install openai-whisper
2,安装 ffmpeg,ffmpeg工具的重要作用是编码/解码/转码以及媒体格式转换,处置惩罚音频用的
sudo apt update
sudo apt install ffmpeg -y
安装后可以进行检验
ffmpeg -version
3,创建一个.py脚本文件,输入以下代码:
  1. import whisper
  2. import torch
  3. # 检查是否有 GPU
  4. device = "cuda" if torch.cuda.is_available() else "cpu"
  5. # 加载 Whisper-large-v3 模型
  6. model = whisper.load_model("large-v3").to(device)
  7. # 指定音频文件路径,写你自己的,如果音频在同级目录下,直接声明即可,如果不在,要写完整的地址
  8. audio_file = "sounds2.mp3"
  9. # 强制设置语言为中文进行转录
  10. result = model.transcribe(audio_file, language="zh", fp16=True if device == "cuda" else False)
  11. # 打印识别结果
  12. print("识别结果:", result["text"])
复制代码
生存即可
在命令行输入python xxxxxx.py,即可运行结果(xxxx为脚本文件名)


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

守听

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表