開源語音AI剛剛達成了一個新的里程碑。兩款尖端模型現已推出:



FireRedTTS2 提供令人印象深刻的性能指標——140毫秒延遲,支持跨7種語言的4人對話互動。它基於雙變換器架構,能處理複雜的音頻處理,同時保持即時反應。

VibeVoice 將對話長度提升到另一個層次,支持90分鐘的連續互動,具有真正的即時處理能力。其架構使自然且長時間的對話成為可能,且不會退化。

這兩款模型代表了開源語音AI發展的重要進步,結合了低延遲性能與實用的多語言、多說話人能力。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 2
  • 轉發
  • 分享
留言
0/400
JustAnotherWalletvip
· 8小時前
90分鐘不卡頓?有點絕啊...得試試
查看原文回復0
UnruggableChadvip
· 8小時前
90分鐘不卡?這要是能真的跑起來,那得省多少伺服器錢啊
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)