voicebox
by jamiepine
介绍
Voicebox 是由 jamiepine 开发的开源本地化 AI 语音工作室,被视为 ElevenLabs 和 WisprFlow 的私有化替代方案。它集成了语音克隆、多引擎文本转语音(TTS)及基于 Whisper 的全局听写功能。其核心特点是 100% 本地运行,通过内置的 MCP 服务器,它可以让 Claude Code、Cursor 等 AI Agent 直接调用并以用户克隆的声音进行对话,打通了 Agent 语音交互的输入输出闭环。
功能特征
- 跨引擎零样本语音克隆
- 内置 MCP 服务器支持 Agent 调用
- 23 种语言与 7 大 TTS 引擎集成
- 全局热键听写与文本注入
- 100% 本地推理与隐私保护
支持平台
desktop