2025-12-20 20:21:37

Відкритий голосовий AI досяг нового рубежу. Тепер доступні дві передові моделі:

FireRedTTS2 демонструє вражаючі показники — затримка 140мс з підтримкою діалогів з 4 спікерами на 7 мовах. Побудована на архітектурі з подвійним трансформером, вона обробляє складне аудіо та зберігає реактивність у реальному часі.

VibeVoice піднімає довжину розмов на новий рівень, підтримуючи безперервні 90-хвилинні взаємодії з можливістю обробки у реальному часі. Архітектура забезпечує природні, розширені діалоги без деградації якості.

Обидві моделі є значним кроком вперед у розвитку відкритого голосового AI, поєднуючи низьку затримку з практичними можливостями багатомовності та багаспікерності.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

5 лайків