TokenTreasury_
Open-source voice AI baru saja mencapai tonggak baru. Dua model canggih kini tersedia:
FireRedTTS2 memberikan metrik kinerja yang mengesankan—latensi 140ms dengan dukungan untuk interaksi dialog 4-pembicara di 7 bahasa. Dibangun dengan arsitektur dual-transformer, model ini menangani pemrosesan audio yang kompleks sambil mempertahankan responsivitas waktu nyata.
VibeVoice membawa panjang percakapan ke tingkat lain, mendukung interaksi berkelanjutan selama 90 menit dengan kemampuan pemrosesan waktu nyata yang nyata. Arsitektur ini memungkinkan dialog alami dan panjang tanpa penurunan kualitas.
Lihat AsliFireRedTTS2 memberikan metrik kinerja yang mengesankan—latensi 140ms dengan dukungan untuk interaksi dialog 4-pembicara di 7 bahasa. Dibangun dengan arsitektur dual-transformer, model ini menangani pemrosesan audio yang kompleks sambil mempertahankan responsivitas waktu nyata.
VibeVoice membawa panjang percakapan ke tingkat lain, mendukung interaksi berkelanjutan selama 90 menit dengan kemampuan pemrosesan waktu nyata yang nyata. Arsitektur ini memungkinkan dialog alami dan panjang tanpa penurunan kualitas.