小伙伴们在学习“外语”时。由于外语成绩太差而无法愉快学习。很是苦恼!
不用担心,表哥这里为大家推荐一款使用Whisper语言模型进行计算语音转文字的软件。痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化。翻译快慢和你的电脑性能有一定关系。喜欢就收藏本文吧!
实验环境
Windows11 medium.pt(离线模型 1.4G)
在本地部署
首先,我们到项目地址进行下载程序到本地。
项目地址: https://github.com/chidiwilliams/buzz/releases

在Windows中进行安装。
运行软件效果
下载离线模型(可选)
使用
首先双击Buzz.exe,然后打开学习视频文件。
点击运行后,会自动下载对应的模型。
如果由于你的网络问题导致下载失败,可以下载离线模型到本地。然后复制到C:\Users\逍遥子\.cache\whisper即可。(后台回复buzz获取地址)
效果
在实际测试中,我们用1G的文件进行测试,由于不支持GPU加速,在CPU加持下,用时约30分钟。
完成之后,导出的字幕格式为srt。翻译效率咱也不敢多问,也不敢多说。然后我们在播放器中外挂字幕就行了。这里我们以Potplayer播放器为例。
总结
利用此款工具,我们可以方便的给视频添加字幕。并且识别率还是不错的。唯一的缺点是不支持实时翻译,并且不支持GPU的支持。当然如果您有更好的解决方案,可以分享给我们。
更多精彩文字 欢迎关注我们
防失联 关注我