耶耶耶耶耶 发表于 2024-10-31 11:12:58

【语音转文本新体验】Windows部署Whisper Web结合内网穿透轻松远程转录——

前言

OpenAI开源的 Whisper 语音转文本模型效果都说还不错,本日就给各人推荐 GitHub 上一个开源项目 Whisper Web,允许你可直接在浏览器中运利用用 Whisper。
基于 ML 进行语音识别,并可通过 WebGPU 进行运行加快,无需后端服务器,直接开箱即用。另外,识别到的文本支持导出 TXT 和 JSON 两种文件格式。
而结合cpolar内网穿透工具使用,还能轻松实现远程访问当地Windows体系部署的Whisper Web进行语音转文本利用,无需公网IP,也不消设置路由器那么麻烦。
1.当地部署Whisper Web

接下来教各人如安在Windows体系当地安装Whisper Web
项目地点:https://github.com/xenova/whisper-web
1.1 安装git

首先须要从github上克隆Whisper Web(假如没有安装git的话,进入git官网进行下载windows版本 https://git-scm.com/downloads)
https://img-blog.csdnimg.cn/img_convert/0bd8b5a7c44e59c4578719c8c2268c62.png
打开终端,从github下载项目到当地,执行下面的命令:
git clone https://github.com/xenova/whisper-web.git
https://img-blog.csdnimg.cn/img_convert/c388bc5cad2083bb62596000d38bc5a3.png
创建新目录
cd whisper-web
1.2 安装Node.js

然后在项目的根目录下,执行下面的命令:
npm install
假如安装报错,可以检查是否安装Node.js,如未安装可以点击链接下载:
https://nodejs.org/en/download/prebuilt-installer
https://img-blog.csdnimg.cn/img_convert/27cb755a82b6ae701489c5db5124c06e.png
本例中使用的是下载安装包进行安装,安装后重启终端执行上边npm安装命令即可。
https://img-blog.csdnimg.cn/img_convert/3fc820f820b87e5cf40de20565d5f322.png
1.3 运行项目

在项目的根目录下,运行Whisper Web,可以看到运行成功,出现http://localhost:5173
npm run dev
https://img-blog.csdnimg.cn/img_convert/79be61f882a47e6ff0a42df194026a31.png
此时,我们在浏览器中输入上边的地点,即可打开Whisper Web页面:
https://img-blog.csdnimg.cn/img_convert/83679858f4c2292e1a7d4de1c288bd19.png
2. Whisper Web使用先容

在Whisper Web界面,我们可以使用粘贴音频地点,上传音频文件,和使用手机录入语音等方式进行语音转文本的利用。
这里以上传音频文件为例,在上传了一段音频文件后,点击音频进度条下方的设置按钮,进行模型切换和输出为其他语言的选择。
https://img-blog.csdnimg.cn/img_convert/9a486ca20bf45597d8ac75ca7fe33f0c.png
设置完毕后,点击下方的transcribe Audio按钮即可自动进行音频转文本:
https://img-blog.csdnimg.cn/img_convert/71ff64e55bc9dd2baca8a1b5125a429c.png
https://img-blog.csdnimg.cn/img_convert/5da1247c06b4b174d6b993c540007647.png
转换竣过后,我们可以将文本导出为TXT或者JSON格式到指定文件夹。
https://img-blog.csdnimg.cn/img_convert/0d6765ba34a55e208355bc801ce5e312.png
3. 安装Cpolar内网穿透

现在我们在本机部署了Whisper Web,但假如没有公网IP的话,只能在当地局域网情况使用,有一定局限性。假如想在异地通过其他装备使用的话,可以结合Cpolar内网穿透实现远程访问,免去了当地重新部署过程,只须要cpolar生成的公网地点直接就可以链接到Whisper Web中。
下面是安装cpolar步骤:
   Cpolar官网地点: https://www.cpolar.com
点击进入cpolar官网,点击免费使用注册一个账号,并下载最新版本的Cpolar
https://img-blog.csdnimg.cn/img_convert/e36b85a20812806112c1c73021f8a219.png
登录成功后,点击下载Cpolar到当地并安装(一起默认安装即可)本教程选择下载Windows版本。
https://img-blog.csdnimg.cn/img_convert/446809cb88358215a03f9089bd611f5d.png
Cpolar安装成功后,在浏览器上访问http://localhost:9200,使用cpolar账号登录,登录后即可看到Cpolar web 配置界面,结下来在web 管理界面配置即可。
https://img-blog.csdnimg.cn/img_convert/27a45b093d8daa36a95af16b90cb29e3.png
4. 配置公网地点

接下来配置一下当地 Whisper Web 的公网地点,
登录后,点击左侧仪表盘的隧道管理——创建隧道,
创建一个 Whisper Web 的公网http地点隧道:


[*]隧道名称:可自定义命名,留意不要与已有的隧道名称重复
[*]协议:选择http
[*]当地地点:5173
[*]域名范例:免费选择随机域名
[*]地域:选择China Top
点击创建
https://img-blog.csdnimg.cn/img_convert/f29391d2a84cd9ddc62b3b261938d4f4.png
隧道创建成功后,点击左侧的状态——在线隧道列表,检察所生成的公网访问地点,有两种访问方式,分别是http和https。
https://img-blog.csdnimg.cn/img_convert/3cf2f89f2e8b299f8f771406911029d4.png
使用恣意一个上面Cpolar生成的公网地点,在电脑或恣意装备在浏览器进行登录访问,即可成功看到 Whisper Web 界面,如许一个可以远程访问的公网地点就创建好了,使用了Cpolar的公网域名,无需本身购买云服务器,即可在公网访问当地部署的服务了!
5. 公网访问测试

我们用刚才cpolar生成的公网地点,打开一个新的浏览器复制粘贴,可以看到进入到了Whisper Web项目的管理界面。
https://img-blog.csdnimg.cn/img_convert/c494d1e489c714611bf07323dffffe28.png
小结
由于刚才创建的是随机的地点,24小时会发生变化。另外它的网址是由随机字符生成,不容易记忆。假如你有恒久远程访问当地部署服务的需求,或者想把域名变成固定,好记的二级子域名,并且不想每次都重新创建隧道来访问你在当地部署的服务,我们可以选择创建一个固定的http地点来办理这个题目。
6. 配置固定公网地点

我们接下来为其配置固定的HTTP端口地点,该地点不会变化,方便分享给别人恒久检察你的博客,而无需每天重复修改服务器地点。
   配置固定http端口地点须要将cpolar升级到专业版套餐或以上。
登录cpolar官网,点击左侧的预留,选择保留二级子域名,设置一个二级子域名名称,点击保留,保留成功后复制保留的二级子域名名称。
https://img-blog.csdnimg.cn/img_convert/d2b90d28c648d24d0d3e2354d7a76421.png
保留成功后复制保留成功的二级子域名的名称:Whisper123(各人可以自定义)
https://img-blog.csdnimg.cn/img_convert/e4f5aa3d5d24f516b9a7606c64751f5b.png
返回登录Cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道 Whisper,点击右侧的编辑:
https://img-blog.csdnimg.cn/img_convert/70d3ebad833b6cebf32556b35b9d72b3.png
修改隧道信息,将保留成功的二级子域名配置到隧道中


[*]域名范例:选择二级子域名
[*]Sub Domain:填写保留成功的二级子域名
点击更新(留意,点击一次更新即可,不须要重复提交)
https://img-blog.csdnimg.cn/img_convert/e4b2a155bbf3613d9cf4e5a854ea7876.png
更新完成后,打开在线隧道列表,此时可以看到公网地点已经发生变化,地点名称也变成了固定的二级子域名名称的域名:
https://img-blog.csdnimg.cn/img_convert/6850d56fc767d70945e529fb972017f0.png
末了,我们使用固定的公网地点在任何浏览器打开访问,可以看到成功访问 Whisper Web,如许一个固定且永久不变的公网地点就设置好了。
https://img-blog.csdnimg.cn/img_convert/c0dab0fdf6747a0481e1b7dd65fdc48d.png
以上就是如安在Windows体系电脑当地部署语音转文本服务Whisper Web,并结合cpolar内网穿透工具实现远程访问使用的全部流程,另外由于该服务无需账号即可在浏览器直接访问,出于安全思量,建议各人远程访问时不要容易与他人分享地点,感谢您的观看,有任何题目欢迎留言交流。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 【语音转文本新体验】Windows部署Whisper Web结合内网穿透轻松远程转录——