Insanely Fast Whisper CLI 利用教程

锦通  论坛元老 | 2024-11-29 12:13:49 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 1680|帖子 1680|积分 5040

Insanely Fast Whisper CLI 利用教程

    insanely-fast-whisper-cli The fastest Whisper optimization for automatic speech recognition as a command-line interface ⚡️  
项目地点: https://gitcode.com/gh_mirrors/in/insanely-fast-whisper-cli   
1. 项目介绍

Insanely Fast Whisper CLI 是一个基于 OpenAI 的 Whisper 模型的下令行工具,旨在提供极速的音频转录功能。该项目利用了 Hugging Face 的 Transformers 和 Optimum 库,以及 Vaibhavs10/insanely-fast-whisper 的优化技术,能够在不到 10 分钟内转录 300 分钟的音频(5 小时)。
主要特点



  • ASR 模型选择:支持多种 Hugging Face 的 ASR 模型,包罗不同巨细的 openai/whisper 模型,甚至支持英语专用模型。
  • 性能优化:通过批处置处罚巨细、数据范例和 BetterTransformer 等选项举行自界说优化。
  • 时间戳输出:生成带有准确时间戳的 SRT 文件,便于创建字幕。
2. 项目快速启动

安装步调


  • 克隆堆栈
    1. git clone https://github.com/ochen1/insanely-fast-whisper-cli.git
    复制代码
  • 进入项目目录
    1. cd insanely-fast-whisper-cli/
    复制代码
  • 创建并激活虚拟环境(可选)
    1. python -m venv venv
    2. source venv/bin/activate
    复制代码
  • 安装依靠
    1. pip install -r requirements.txt
    复制代码
  • 运行程序
    1. python insanely-fast-whisper.py --model openai/whisper-base --device cuda:0 --dtype float32 --batch-size 8 --better-transformer --chunk-length 30 your_audio_file.wav
    复制代码
参数说明



  • --model:指定 ASR 模型(默认是 openai/whisper-base)。
  • --device:选择计算装备(默认是 cuda:0)。
  • --dtype:设置计算数据范例(float32 或 float16)。
  • --batch-size:调解处置处罚批量巨细(默认是 8)。
  • --better-transformer:利用 BetterTransformer 举行改进处置处罚(标志)。
  • --chunk-length:界说音频块长度(默认是 30 秒)。
3. 应用案例和最佳实践

应用案例



  • 视频字幕生成:通过生成带偶然间戳的 SRT 文件,快速为视频添加字幕。
  • 音频内容分析:将长音频文件转录为文本,便于后续的内容分析和处置处罚。
最佳实践



  • 选择符合的模型:根据任务需求选择符合的 Whisper 模型,如英语专用模型或大型模型。
  • 优化批处置处罚巨细:根据 GPU 内存调解批处置处罚巨细,以避免内存不足的题目。
  • 利用 BetterTransformer:启用 BetterTransformer 可以显著提高处置处罚速度。
4. 典型生态项目



  • Hugging Face Transformers:提供 Whisper 模型的根本库。
  • Optimum:优化 Transformer 模型的库,提升模型性能。
  • Vaibhavs10/insanely-fast-whisper:提供 Whisper 模型的优化技术。
通过这些生态项目标结合,Insanely Fast Whisper CLI 能够提供高效、快速的音频转录服务。
    insanely-fast-whisper-cli The fastest Whisper optimization for automatic speech recognition as a command-line interface ⚡️  
项目地点: https://gitcode.com/gh_mirrors/in/insanely-fast-whisper-cli   

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

锦通

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表