pyvideotrans
by jianchang512
介绍
pyVideoTrans 是一款开源的全自动视频翻译与AI配音工具,可实现音视频到多语言的无缝转换。其工作流完整涵盖语音识别(ASR)、大模型字幕翻译、多角色语音合成(TTS)及音视频自动同步。特点是支持说话人分离与零样本声音克隆,兼容本地离线模型(如Faster-Whisper、Ollama)和众多主流云端API。提供带暂停校对的GUI图形界面以及方便批量处理的CLI命令行模式,是一款高效的多媒体本地化利器。
功能特征
- 全自动视频翻译与音视频同步
- 智能语音识别与说话人分离
- 多角色AI配音与零样本声音克隆
- 广泛支持本地离线大模型与云端API
- 提供交互式GUI校对与CLI命令行
支持平台
desktop