p

pyvideotrans

by jianchang512
🔓 开源项目 Python 🌍 全球 free #speech-to-text#text-to-speech#video-transition

介绍

pyVideoTrans 是一款开源的全自动视频翻译与AI配音工具,可实现音视频到多语言的无缝转换。其工作流完整涵盖语音识别(ASR)、大模型字幕翻译、多角色语音合成(TTS)及音视频自动同步。特点是支持说话人分离与零样本声音克隆,兼容本地离线模型(如Faster-Whisper、Ollama)和众多主流云端API。提供带暂停校对的GUI图形界面以及方便批量处理的CLI命令行模式,是一款高效的多媒体本地化利器。

功能特征

  • 全自动视频翻译与音视频同步
  • 智能语音识别与说话人分离
  • 多角色AI配音与零样本声音克隆
  • 广泛支持本地离线大模型与云端API
  • 提供交互式GUI校对与CLI命令行

支持平台

desktop