vlogme.ai

Глоссарий

Синтез речи (TTS)

Технология преобразования текста в аудио. Современный нейронный TTS даёт голоса, неотличимые от живой записи, и является аудиодвижком большинства говорящих аватаров.

TTS превращает текст и выбранный голос в аудиосигнал. Старый TTS звучал «как робот»; современные модели обучены на сотнях часов речи и дают естественную просодию, дыхание и эмоции.

На vlogme.ai можно выбрать любой TTS-голос, клонировать свой или загрузить своё аудио — движок lip-sync ведёт аватар от выбранного источника звука.

Связанные термины