TTS превращает текст и выбранный голос в аудиосигнал. Старый TTS звучал «как робот»; современные модели обучены на сотнях часов речи и дают естественную просодию, дыхание и эмоции.
На vlogme.ai можно выбрать любой TTS-голос, клонировать свой или загрузить своё аудио — движок lip-sync ведёт аватар от выбранного источника звука.