Sora

/ˈsɔːrə/

Also known as: OpenAI Sora, Sora 2, text-to-video

technical beginner

Soraとは何か?

Soraは、テキスト記述からリアルな動画を作成できるOpenAIのテキスト-動画生成モデルです。2024年2月に初めてプレビューされ、2024年12月に一般公開されたSoraは、一部が動画の「GPT-1モーメント」と呼ぶものを表しています—AI動画生成が実際に機能し始めた時点です。

機能

動画生成:

  • 最大20秒の動画
  • 最大1080p解像度
  • ワイドスクリーン、縦型、または正方形のアスペクト比
  • 一貫した3D空間での動的カメラモーション

技術的特徴:

  • オブジェクトの永続性(オブジェクトはフレーム間で持続)
  • 物理シミュレーション(不完全ですが)
  • 動画拡張(時間的に前方または後方)
  • Minecraftのようなインタラクティブ環境をシミュレート可能

進化

オリジナルSora(2024年2月)

  • 印象的なデモを示すプレビューリリース
  • より低い品質で最大1分の動画
  • 音声なし
  • 限定的な一般アクセス

Sora Turbo(2024年12月)

  • 大幅に高速な生成
  • ChatGPT ProおよびPlusユーザーへの一般公開
  • Plusユーザー:480pで月50動画、または720pで少ない動画

Sora 2(2025年9月)

次を導入する主要なアップグレード:

音声: ネイティブ同期音声生成—最大の追加機能。

より良い物理: 「バスケットボール選手がシュートを外した場合、バックボードから跳ね返ります。」間違いは現在、物理違反ではなく、モデル化されている暗黙のエージェントの間違いとして現れます。

制御性: ワールド状態の一貫性を維持しながら、複雑なマルチショット指示に従います。

スタイル範囲: リアル、シネマティック、アニメスタイルに優れています。

カメオ: ユーザーは短い検証録音を介して、生成された動画に自分の類似性を含めることができます。正確な外観と音声のレンダリング。

「世界シミュレーター」

OpenAIは動画生成モデルを「世界シミュレーター」として説明します—物理とオブジェクトの振る舞いの暗黙的モデルを学習するシステムです。これは、Demis Hassabisらが主張するAGIに必要な世界モデルへのより広範な研究に接続します。

しかし、現在の動画生成器は物理を真に理解していません—トレーニングデータのパターンから近似します。生成された動画は、物理的に正確でなくてもリアルに見えるかもしれません。

安全対策

OpenAIは保護措置を実装しました:

  • ウォーターマーク: 生成されたコンテンツに表示されるマーカー
  • C2PAメタデータ: 機械可読な出所情報
  • アップロード制限: 特に未成年者の人々のフォトリアリスティックアップロードを制限
  • コンテンツポリシー: 非同意の類似性生成を防止

アクセスと価格

  • ChatGPT Pro(月200ドル):最高品質と最長動画
  • ChatGPT Plus(月20ドル):より低い解像度で月50動画
  • iOSおよびAndroidアプリ: Sora 2と同時にリリース

競争環境

Soraは次と競合します:

  • Runway Gen-3: プロフェッショナル動画生成
  • Pika: 消費者向け動画AI
  • Google Veo: Googleの動画生成取り組み
  • Kling: Kuaishouの動画モデル

関連記事

Mentioned In

Video thumbnail

Alex Kantrowitz

Sora represents OpenAI's push beyond text into multimodal generation.