v

voicebox

by jamiepine
🔓 开源项目 TypeScript 🌍 全球 free

介绍

Voicebox 是由 jamiepine 开发的开源本地化 AI 语音工作室,被视为 ElevenLabs 和 WisprFlow 的私有化替代方案。它集成了语音克隆、多引擎文本转语音(TTS)及基于 Whisper 的全局听写功能。其核心特点是 100% 本地运行,通过内置的 MCP 服务器,它可以让 Claude Code、Cursor 等 AI Agent 直接调用并以用户克隆的声音进行对话,打通了 Agent 语音交互的输入输出闭环。

功能特征

  • 跨引擎零样本语音克隆
  • 内置 MCP 服务器支持 Agent 调用
  • 23 种语言与 7 大 TTS 引擎集成
  • 全局热键听写与文本注入
  • 100% 本地推理与隐私保护

支持平台

desktop