开源语音AI刚刚取得了新的里程碑。现在提供两款尖端模型:



FireRedTTS2 具有令人印象深刻的性能指标——140ms 延迟,支持跨7种语言的4人对话交互。基于双变换器架构,能够处理复杂的音频处理,同时保持实时响应。

VibeVoice 将对话时长提升到另一个层次,支持90分钟的连续交互,具备真正的实时处理能力。其架构实现了自然、长时间的对话而不出现退化。

这两款模型代表了开源语音AI开发的重要进步,结合了低延迟性能与实用的多语言、多说话人能力。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 2
  • 转发
  • 分享
评论
0/400
JustAnotherWalletvip
· 8小时前
90分钟不卡顿?有点绝啊...得试试
回复0
UnruggableChadvip
· 8小时前
90分钟不卡?这要是能真的跑起来,那得省多少服务器钱啊
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)