Open-source voice AI baru saja mencapai tonggak baru. Dua model canggih kini tersedia:



FireRedTTS2 memberikan metrik kinerja yang mengesankan—latensi 140ms dengan dukungan untuk interaksi dialog 4-pembicara di 7 bahasa. Dibangun dengan arsitektur dual-transformer, model ini menangani pemrosesan audio yang kompleks sambil mempertahankan responsivitas waktu nyata.

VibeVoice membawa panjang percakapan ke tingkat lain, mendukung interaksi berkelanjutan selama 90 menit dengan kemampuan pemrosesan waktu nyata yang nyata. Arsitektur ini memungkinkan dialog alami dan panjang tanpa penurunan kualitas.

Kedua model ini merupakan langkah maju yang signifikan dalam pengembangan open-source voice AI, menggabungkan kinerja latensi rendah dengan kemampuan multi-bahasa dan multi-pembicara yang praktis.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 2
  • Posting ulang
  • Bagikan
Komentar
0/400
JustAnotherWalletvip
· 3jam yang lalu
90 menit tanpa lag? Sangat keren... Harus dicoba
Lihat AsliBalas0
UnruggableChadvip
· 3jam yang lalu
90 menit tanpa lag? Kalau benar bisa berjalan seperti itu, berapa banyak uang server yang bisa dihemat?
Lihat AsliBalas0
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)