photo-to-videoモデルは画像内の顔を解析し、3D表現を抽出して、音声に合わせてフレームごとに顔を再描画します。元の照明、背景、人物の特徴は保たれ、口、顎、目、わずかな頭の動きが合成されます。
ポートレート、AI生成顔、歴史写真、イラストでも動きます。注意:非常に低解像度の写真や、髪・手・眼鏡で部分的に隠れた顔は結果が悪くなります。
用語集
1枚の静止写真から動画を生成すること — 多くの場合、被写体の顔を話すようにアニメーションさせます。
photo-to-videoモデルは画像内の顔を解析し、3D表現を抽出して、音声に合わせてフレームごとに顔を再描画します。元の照明、背景、人物の特徴は保たれ、口、顎、目、わずかな頭の動きが合成されます。
ポートレート、AI生成顔、歴史写真、イラストでも動きます。注意:非常に低解像度の写真や、髪・手・眼鏡で部分的に隠れた顔は結果が悪くなります。