“学习”神器 基于Whisper模型的实时字幕工具BUZZ

小伙伴们在学习“外语”时。由于外语成绩太差而无法愉快学习。很是苦恼!

不用担心,表哥这里为大家推荐一款使用Whisper语言模型进行计算语音转文字的软件。痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化。翻译快慢和你的电脑性能有一定关系。喜欢就收藏本文吧!

实验环境

  • Windows11
  • medium.pt(离线模型1.4G)

在本地部署

首先,我们到项目地址进行下载程序到本地。

项目地址: https://github.com/chidiwilliams/buzz/releases

   

在Windows中进行安装。

运行软件效果

下载离线模型(可选)

使用

首先双击Buzz.exe,然后打开学习视频文件。

点击运行后,会自动下载对应的模型。

如果由于你的网络问题导致下载失败,可以下载离线模型到本地。然后复制到C:\Users\逍遥子\.cache\whisper即可。(后台回复buzz获取地址)

效果

在实际测试中,我们用1G的文件进行测试,由于不支持GPU加速,在CPU加持下,用时约30分钟。

完成之后,导出的字幕格式为srt。翻译效率咱也不敢多问,也不敢多说。然后我们在播放器中外挂字幕就行了。这里我们以Potplayer播放器为例。

总结

利用此款工具,我们可以方便的给视频添加字幕。并且识别率还是不错的。唯一的缺点是不支持实时翻译,并且不支持GPU的支持。当然如果您有更好的解决方案,可以分享给我们。

更多精彩文字 欢迎关注我们

防失联 关注我


请使用浏览器的分享功能分享到微信等