ボイスクローニングモデルは、対象の声の音色、テンポ、アクセント、感情の「指紋」を学びます。最新システムは10〜30秒のクリーンな音声だけで、その声で任意の新しいテキストを読めるクローンを作成できます。
責任ある使い方ならクリエイターの超能力:自分の声を30以上の言語にローカライズ、再録音なしで動画を更新、アクセシビリティ目的での声の保存。無責任ならディープフェイクのリスク — 声の所有者の同意を必ず取得してください。
用語集
通常は短い音声サンプルから、特定の実在人物に似た新しい声を合成すること。
ボイスクローニングモデルは、対象の声の音色、テンポ、アクセント、感情の「指紋」を学びます。最新システムは10〜30秒のクリーンな音声だけで、その声で任意の新しいテキストを読めるクローンを作成できます。
責任ある使い方ならクリエイターの超能力:自分の声を30以上の言語にローカライズ、再録音なしで動画を更新、アクセシビリティ目的での声の保存。無責任ならディープフェイクのリスク — 声の所有者の同意を必ず取得してください。