AI生成字幕 #164
Replies: 6 comments 5 replies
-
这个脚本使用的 whispercpp 本身就支持跨平台,修改适配 Windows 并没有什么难度。问题在于 whispercpp 本身生成的时间戳极不准确,可用性大大降低。一般更推荐使用 fast-whisper |
Beta Was this translation helpful? Give feedback.
-
potplayer最近好像更新了这个功能 |
Beta Was this translation helpful? Give feedback.
-
搓了个概念验证性质的 mpv 脚本:https://github.com/dyphire/mpv-sub-fastwhisper |
Beta Was this translation helpful? Give feedback.
-
对于 sub-fastwhisper 脚本的用法,推荐使用 whisper 最新的模型 large-v3-turbo 搭配 cuda 的组合(中文语音转录推荐 large-v2 模型 turbo 模型转录又快又好,准确率只比常规 large 模型差些,生成速度也只比最基础的 tiny 模型慢。在 3060 上测试 2 小时视频 5 分钟内字幕即可生成结束(生成其实只用了两分钟,最耗时的其实是解码及 VAD 分析音频) 新添加的音频分段式增量生成方式反而不推荐使用,它只在小模型下能够满足实时生成,大点的模型都很难做到。虽然可以通过 cuda 进行加速,但 cuda 下分段提取的音频有概率解码失败,进一步降低了可用性 |
Beta Was this translation helpful? Give feedback.
-
记录:阿里开源的 SenseVoice 语音识别模型效率非常高,即使是在 CPU 上推理速度都相当快,可惜目前只有 small 模型,生成的准确率尚不及 whisper 的 large 模型,等待后续可能推出的大模型 |
Beta Was this translation helpful? Give feedback.
-
已为脚本添加 AI 字幕翻译功能,翻译后支持生成双语 ass 字幕。这个脚本基本没啥可折腾的了,进入低维护状态 mpv-config/script-opts/sub_fastwhisper.conf Lines 26 to 38 in 9ee81cc |
Beta Was this translation helpful? Give feedback.
-
看到了这个https://github.com/GhostNaN/whisper-subs ,但好像不支持windows,您有兴趣吗?谢谢
Beta Was this translation helpful? Give feedback.
All reactions