ToB企服应用市场:ToB评测及商务社交产业平台

标题: chatgpt接口开发笔记3: 语音识别接口 [打印本页]

作者: 西河刘卡车医    时间: 2024-2-8 04:47
标题: chatgpt接口开发笔记3: 语音识别接口
chatgpt接口开发笔记3: 语音识别接口

1.文本转语音

1、了解接口参数

接口地址:
  1. POST https://api.openai.com/v1/audio/speech
复制代码
下面是接口文档描述内容:

参数:
  1. {
  2. "model": "tts-1",
  3. "input": "你好,我是饶坤,我是terramours gpt的开发者",
  4. "voice": "alloy"
  5. }
复制代码
2.postman测试


3.结果:


2.语音转文本

1、了解接口参数

接口地址:
  1. POST  https://api.openai.com/v1/audio/transcriptions
复制代码
文档:

参数
  1. curl https://api.openai.com/v1/audio/transcriptions \
  2.   -H "Authorization: Bearer $OPENAI_API_KEY" \
  3.   -H "Content-Type: multipart/form-data" \
  4.   -F file="@/path/to/file/audio.mp3" \
  5.   -F model="whisper-1"
复制代码
2.postman测试


3.结果:
  1. {
  2.     "text": "你好,我是饒坤,我是 Terramers GPT 的開發者。"
  3. }
复制代码
SDK开发

对应的语音接口我会加入到SDK中,使用C#开发者可以在nuget中搜索AllInAI.Sharp.API.
SDK为开源项目,代码地址:https://github.com/raokun/AllInAI.Sharp.API
首先在项目中安装sdk
  1. Install-Package AllInAI.Sharp.API
复制代码
1.Speech

1.OpenAI
  1. public async Task OpenAISpeechTest() {
  2.     try {
  3.         AuthOption authOption = new AuthOption() { Key = "sk-**", BaseUrl = "https://api.openai.com", AIType = Enums.AITypeEnum.OpenAi };
  4.         AudioService audioService = new AudioService(authOption);
  5.         AudioSpeechReq req = new AudioSpeechReq() { Model = "tts-1", Input = "你好,我是饶坤,我是AllInAI.Sharp.API的开发者", Voice = "alloy" };
  6.         var res = await audioService.Speech<Stream>(req);
  7.         if(res.Data != null) {
  8.             var filePath = $"D:/test/{Guid.NewGuid()}.mp3";
  9.             using (FileStream fileStream = File.Create(filePath)) {
  10.                 res.Data.CopyTo(fileStream);
  11.             }
  12.         }
  13.     }
  14.     catch (Exception e) {
  15.         Console.WriteLine(e.Message);
  16.     }
  17. }
复制代码
1.Transcriptions

1.OpenAI
  1. public async Task OpenAITranscriptionsTest() {
  2.     try {
  3.         AuthOption authOption = new AuthOption() { Key = "sk-**", BaseUrl = "https://api.openai.com", AIType = Enums.AITypeEnum.OpenAi };
  4.         // 读取音频文件的二进制内容
  5.         byte[] audioData = File.ReadAllBytes("C:/Users/Administrator/Desktop/response.mp3");
  6.         AudioService audioService = new AudioService(authOption) ;
  7.         AudioCreateTranscriptionReq req = new AudioCreateTranscriptionReq() { File=audioData,FileName= "response.mp3",Model= "whisper-1" ,Language="zh"};
  8.         AudioTranscriptionRes res = await audioService.Transcriptions(req);
  9.     }
  10.     catch (Exception e) {
  11.         Console.WriteLine(e.Message);
  12.     }
  13. }
复制代码
阅读如遇样式问题,请前往个人博客浏览: [https://www.raokun.top](chatgpt接口开发笔记3: 语音识别接口)
拥抱ChatGPT:https://first.terramours.site
SDK应用开源项目:https://github.com/TerraMours/TerraMours_Gpt_Web

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4