XAI Grok представив Custom Voices: 2-хвилинне клонування та двоетапну перевірку особи
xAI представила Grok Custom Voices: в консолі записується приблизно 1 хвилина аудіо, за 2 хвилини створюється готова для TTS і Voice Agent API модель кастомного голосу. Паралельно опубліковано Grok 4.3 та Voice Library. Щоб запобігти клонуванню, застосовують двоетапну верифікацію: спершу людина читає перевірочну фразу, а потім порівнюють speaker embedding, щоб генерувати голос лише тієї самої особи. Voice Library об’єднує керування власноруч створеними та заздалегідь підготовленими голосами: 80+ типів, 28 мов; надалі планують розширювати.
ChainNewsAbmedia·05-03 01:35

