探索与 diffusion-model 相关的全量生态内容池。
OmniVoice是k2-fsa推出的一款最先进的大规模多语言零样本文本转语音(TTS)模型,卓越支持逾600种语言。它采纳创新的扩散语言模型架构,不仅能生成高质量语音,更具备行业领先的推理速度。核心功能涵盖极致精准的语音克隆、通过性别、年龄、音高、口音等细粒度属性进行声音定制设计,以及对非语言符号和中文拼音的智能发音纠正。凭借其无与伦比的语言覆盖广度与高效性能,OmniVoice是多语言内容创作、个性化语音合成及各类实时应用场景的理想解决方案。