#diffusion-model

探索与 diffusion-model 相关的全量生态内容池。

相关产品 (1)

OmniVoice是k2-fsa推出的一款最先进的大规模多语言零样本文本转语音（TTS）模型，卓越支持逾600种语言。它采纳创新的扩散语言模型架构，不仅能生成高质量语音，更具备行业领先的推理速度。核心功能涵盖极致精准的语音克隆、通过性别、年龄、音高、口音等细粒度属性进行声音定制设计，以及对非语言符号和中文拼音的智能发音纠正。凭借其无与伦比的语言覆盖广度与高效性能，OmniVoice是多语言内容创作、个性化语音合成及各类实时应用场景的理想解决方案。

#text-to-speech#voice-cloning#multilingual-tts#diffusion-model