Модели клонирования голоса учат тембр, темп, акцент и эмоциональный «отпечаток» цели. Современным системам нужно всего 10–30 секунд чистой речи, чтобы клон мог прочесть любой новый текст этим голосом.
Используется ответственно — это суперспособность автора: локализовать свой голос на 30+ языков, обновлять вечнозелёные видео без перезаписи, сохранить голос для доступности. Небрежное использование — риск дипфейка; всегда получайте согласие владельца голоса.