Глоссарий

Lip-sync (синхронизация губ)

Покадровое соответствие движений рта аудиодорожке, чтобы видимая артикуляция совпадала со звуком речи и мимикой говорящего аватара.

Lip-sync — это мост между звуком и лицом. Модель берёт речь, выделяет последовательность фонем (минимальных звуковых единиц — /а/, /б/, /th/), сопоставляет каждой фонеме форму рта (висему) и пересобирает лицо для каждого кадра.

Хороший lip-sync — это не только форма рта: учитываются раскрытие челюсти, видимость языка, округление губ, паузы между словами. Плохой lip-sync выглядит «резиновым» или шевелит ртом в тишине.

Попробовать lip-sync на своём фото

Lip-sync (синхронизация губ)

Связанные термины

Говорящий аватар

ИИ-ведущий (AI presenter)

ИИ-дубляж (AI dubbing)