Whisper-WebUI是一个基于Whisper模型的Gradio 的浏览器界面,可以轻松地将其用作字幕生成器!
一、Whisper-WebUI的开源地址:
https://github.com/jhj0517/Whisper-WebUI
二、Whisper-WebUI的功能特点:
- 从多种来源生成字幕,包括:
- 从音视频文件自动识别字幕
- 从Youtube链接自动识别字幕
- 从麦克风输入实时识别字幕
- 目前支持的字幕格式:
- SRT
- WebVTT
- txt(仅文本文件,不含时间线)
- 语音到文本翻译
- 将其他语言翻译成英语。(这是Whisper的端到端语音到文本翻译功能)
- 文本到文本翻译
- 使用Facebook NLLB模型翻译字幕文件
三、如何使用Whisper-WebUI?
为了让更多用户能够轻松体验这一技术,我们将Whisper-WebUI打包成了一键启动包。现在,您无需繁琐地配置Python环境,只需简单点击即可启动程序,从而避免了潜在的环境配置问题。
操作系统:Windows 10/11 64位
1、下载压缩包,解压到电脑D盘,最好不要有中文路径;
2、解压后点击启动.bat文件即可运行(文件可能会被误杀,请添加为);
3、浏览器访问:http://127.0.0.1:7860/,即可正常使用。



You are using gradio version 3.37.0, however version 4.29.0 is available, please upgrade
有没有4.29版本
打开魔法,开全局模式,会自动更新。
生成字幕识别率高达85%,还有一些没有对话时,出现了重复的对白,需要手工调整。
没有装在C盘,为什么会在C盘的用户名AppDataLocalTempgradio生成缓存。这个目录怎么能调整一下。就算是重启后,这个目录还存在,占用了大量的C盘空间,必须手动清除。
毕竟只是AI,你可以自己先剪辑分段让AI来给你做啊,别想一步到位