一个可以批量为视频文件生成字幕文件,并翻译成其它语言的小工具。
原理是通过 ffmpeg 从视频文件中提取出音频文件,再通过 whisper 模型将音频生成原语言的字幕文件,然后调用翻译 API,将原语言的字幕文件翻译成目标语言的字幕文件。
项目特点
⏺源语言字幕文件和目标语言字幕文件放在视频同目录下,方便播放时任意挂载字幕文件
⏺批量处理目录下面的所有视频文件
⏺支持火山、百度、deeplx 翻译
⏺自定义字幕文件名,方便兼容不同的播放器挂载字幕识别
⏺自定义翻译后的字幕文件内容,纯翻译结果,原字幕 + 翻译结果
⏺项目集成 whisper.cpp,对 apple silicon 进行了优化,有较快的生成速度
⏺项目集成了 fluent-ffmpeg,无须安装 ffmpeg