AI動画用語集

生成AI動画の用語を、分かりやすく解説。

テキストから動画、画像から動画、トーキングアバター、リップシンク、音声、吹き替えなどの明快な定義。

よく見る用語

トーキングアバターリップシンクテキストから動画 (text-to-video)写真から動画 (photo-to-video)AIプレゼンターボイスクローン

用語一覧

トーキングアバター
通常は一枚の写真から作られ、選んだ音声やスクリプトに合わせて唇・顎・表情をAIがアニメーションさせるデジタルキャラクター。
詳しく見る →
リップシンク
顔の口の動きを目標音声に1フレーム単位で合わせ、話者が正しい音を視覚的に発音しているように見せること。
詳しく見る →
テキストから動画 (text-to-video)
書かれた台本を完成した動画に変換するワークフロー。通常は音声生成、顔またはシーンのアニメーション、最終的な組み立てを自動で行います。
詳しく見る →
写真から動画 (photo-to-video)
1枚の静止写真から動画を生成すること — 多くの場合、被写体の顔を話すようにアニメーションさせます。
詳しく見る →
AIプレゼンター
AIが生成する仮想のオンカメラ・スポークスパーソン。説明動画、製品デモ、コース、社内コミュニケーションに使われます。
詳しく見る →
ボイスクローン
通常は短い音声サンプルから、特定の実在人物に似た新しい声を合成すること。
詳しく見る →
ニューラル音声
ディープニューラルネットワークで生成されるTTS音声。古い連結合成やフォルマント合成より自然なイントネーションと感情を出せます。
詳しく見る →
AIダビング (吹き替え)
動画を新しい言語に自動で再吹き替えすること。理想的には口形を合わせ、元の話者の声の特徴も維持します。
詳しく見る →
ディープフェイク
AIによって人物の顔や声を入れ替えたりアニメーションさせたりした合成メディア。同意ベースのトーキングアバターは同じ技術の合法的な活用です。
詳しく見る →
テキスト読み上げ(TTS)
テキストを音声に変換する技術。現代のニューラルTTSは人間の録音と区別がつかない声を生成し、ほとんどのトーキングアバターの音声エンジンとなっています。
詳しく見る →
AI動画ジェネレーター
プロンプト、台本、画像、音声、既存映像から動画を作るソフトウェア。1つのショットだけでなく、複数シーンの完成動画を設計・構成する場合もあります。
詳しく見る →
トーキングヘッド動画
1人の人物(またはアバター)がカメラに向かって話す動画フォーマット — チュートリアル、セールス、コース、SNS解説の主流形式。
詳しく見る →

用語一覧

トーキングアバター

リップシンク

テキストから動画 (text-to-video)

写真から動画 (photo-to-video)

AIプレゼンター

ボイスクローン

ニューラル音声

AIダビング (吹き替え)

ディープフェイク

テキスト読み上げ(TTS)

AI動画ジェネレーター

トーキングヘッド動画