术语表

口型同步

把面部口型动作逐帧对齐到目标音频上,让讲话者在视觉上发出正确的音节。

口型同步是音频与面部之间的桥梁。模型从语音波形中提取音素序列(/a/、/b/、/th/ 等最小音单元),为每个音素映射对应口型(visme),并逐帧重新生成面部。

好的口型同步不仅包括嘴形,还包括下颌张开、舌头可见度、唇形圆度以及自然停顿;差的同步看起来「橡胶感」或在静音时仍在动嘴。

相关术语