whisper.cpp 技术文档

打印 上一主题 下一主题

主题 1712|帖子 1712|积分 5136

whisper.cpp 技术文档

    whisper.cpp OpenAI 的 Whisper 模型在 C/C++ 中的移植版本。  
项目地点: https://gitcode.com/gh_mirrors/wh/whisper.cpp   
接待使用 whisper.cpp,这是一个高性能的自动语音识别(ASR)库,专门用于实现OpenAI的Whisper模型的C/C++版本。本文档将引导您完成安装、使用以及明白项目API的过程。
安装指南

获取源代码

首先,通过Git克隆whisper.cpp项目到当地:
  1. git clone https://github.com/ggerganov/whisper.cpp.git
  2. cd whisper.cpp
复制代码
下载预练习模型

Whisper模型需要预先下载。例如,获取底子英文模型,运行:
  1. bash ./models/download-ggml-model.sh base.en
复制代码
构建项目

在项目根目录下执行以下命令来构建示例程序:
  1. make
复制代码
这会编译main示例,您可以直接使用它来举行音频文件的转录。
对于特定平台或选项,查看Makefile以举行相应设置。
项目的使用阐明

whisper.cpp设计简洁,易于集成。以下是如何使用main示例的基本步骤:

  • 运行底子示例
    直接运行生成的main可执行文件,并指定音频文件路径和模型路径:
    1. ./main -m models/ggml-base.en.bin -f samples/jfk.wav
    复制代码
  • 自定义参数
    使用命令行参数调整行为,如设置线程数、语言等。使用-h或--help查看全部可用选项。
项目API使用文档

核心头文件

重要的API定义位于whisper.h中。这个头文件提供了初始化模型、加载模型、举行推理等一系列函数调用。
初始化模型

  1. whisper_context *whisper_init_from_file(const char *model_path);
复制代码
转录音频

  1. // 示例使用方法,具体参数请参考API文档
  2. int whisper_process_whole_audio_file(const whisper_context *ctx, const char *fname);
复制代码
自定义应用集成

开发者应参照examples/main.cpp和whisper.h中的API声明来集成至自己的应用中,使用提供的函数处理音频数据并获取识别效果。
项目安装方式

除上述的克隆和编译流程,whisper.cpp同样支持多种环境集成:


  • 平台兼容性:覆盖MacOS、iOS、Android、Linux、Windows、Raspberry Pi以致WebAssembly。
  • 集成到现有项目:可以直接作为子模块添加到CMake项目,使用Conan包管理器获取依赖(实用于支持Conan的环境),或者手动链接预编译库。
结语

whisper.cpp通过其高效且轻量级的设计,为各种应用场景提供强大的离线语音识别能力。无论是嵌入式体系还是桌面应用,它都是一把利器。记得查阅源码和讨论区以得到更深入的定制化指导。
    whisper.cpp OpenAI 的 Whisper 模型在 C/C++ 中的移植版本。  
项目地点: https://gitcode.com/gh_mirrors/wh/whisper.cpp   

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

农妇山泉一亩田

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表