Глоссарий
Понятные ответы на любые вопросы о говорящих аватарах.
Короткие определения терминов, которые встречаются при создании ИИ-видео: lip-sync, нейронные голоса, photo-to-video и другие.
Говорящий аватар
Цифровой персонаж — обычно из одного фото — у которого ИИ анимирует губы, челюсть и мимику под выбранный голос или текст.
Подробнее →Lip-sync (синхронизация губ)
Покадровое соответствие движений рта аудиодорожке, чтобы видимая артикуляция совпадала со звуком.
Подробнее →Текст в видео (text-to-video)
Сценарий: написанный текст превращается в готовое видео — обычно генерируется озвучка, анимируется лицо или сцена, и всё автоматически собирается.
Подробнее →Фото в видео (photo-to-video)
Генерация движущегося видео из одной фотографии — чаще всего за счёт анимации лица, которое говорит.
Подробнее →ИИ-ведущий (AI presenter)
Виртуальный спикер в кадре, сгенерированный ИИ — для роликов-объяснений, демо продуктов, курсов и внутренней коммуникации.
Подробнее →Клонирование голоса
Синтез нового голоса, который звучит как конкретный реальный человек — обычно по короткому аудио-семплу.
Подробнее →Нейронный голос (neural voice)
TTS-голос, сгенерированный глубокой нейросетью — с более естественной интонацией и эмоцией, чем у старого конкатенативного или формантного TTS.
Подробнее →ИИ-дубляж (AI dubbing)
Автоматическая переозвучка видео на новый язык — в идеале с подходящим lip-sync и сохранением голосовой идентичности исходного спикера.
Подробнее →Дипфейк
Синтетический контент, где лицо или голос человека подменены или анимированы ИИ. Говорящие аватары из вашего фото с согласием — легитимное и этичное применение той же технологии.
Подробнее →Синтез речи (TTS)
Технология преобразования текста в аудио. Современный нейронный TTS даёт голоса, неотличимые от живой записи, и является аудиодвижком большинства говорящих аватаров.
Подробнее →ИИ-генератор видео
Инструмент, который создаёт готовые видеофайлы из текста, сценария, фото или аудио — без съёмки. Генераторы говорящих аватаров — одна из самых практичных подкатегорий.
Подробнее →Talking-head видео
Формат, в котором один человек (или аватар) говорит в камеру — основной формат туториалов, sales-outreach, модулей курсов и социальных объяснялок.
Подробнее →