Sora
/ˈsɔːrə/
Also known as: OpenAI Sora, Sora 2, text-to-video
Was ist Sora?
Sora ist OpenAIs Text-zu-Video-Generierungsmodell, das in der Lage ist, realistisches Video aus Textbeschreibungen zu erstellen. Erstmals im Februar 2024 vorgestellt und im Dezember 2024 öffentlich veröffentlicht, repräsentiert Sora das, was manche den “GPT-1-Moment” für Video nennen - den Punkt, an dem KI-Videogenerierung tatsächlich zu funktionieren begann.
Fähigkeiten
Videogenerierung:
- Bis zu 20 Sekunden Video
- Bis zu 1080p Auflösung
- Breitbild-, Vertikal- oder quadratische Seitenverhältnisse
- Dynamische Kamerabewegung mit konsistentem 3D-Raum
Technische Features:
- Objektpermanenz (Objekte bleiben über Frames hinweg bestehen)
- Physiksimulation (wenn auch unvollkommen)
- Videoerweiterung (vorwärts oder rückwärts in der Zeit)
- Kann interaktive Umgebungen wie Minecraft simulieren
Evolution
Original Sora (Februar 2024)
- Preview-Release mit beeindruckenden Demos
- Bis zu einer Minute Video in geringerer Qualität
- Kein Audio
- Begrenzter öffentlicher Zugang
Sora Turbo (Dezember 2024)
- Deutlich schnellere Generierung
- Öffentliche Veröffentlichung für ChatGPT Pro- und Plus-Nutzer
- Plus-Nutzer: 50 Videos/Monat bei 480p oder weniger bei 720p
Sora 2 (September 2025)
Großes Upgrade mit:
Audio: Native synchronisierte Soundgenerierung - die größte Ergänzung.
Bessere Physik: “Wenn ein Basketballspieler einen Schuss verfehlt, prallt er vom Backboard ab.” Fehler erscheinen nun als Fehler des implizierten Agenten, der modelliert wird, nicht als Physikverletzungen.
Kontrollierbarkeit: Folgt komplexen Multi-Shot-Anweisungen, während die Konsistenz des Weltzustands beibehalten wird.
Stilbereich: Exzelliert in realistischen, kinematografischen und Anime-Stilen.
Cameos: Benutzer können ihr eigenes Aussehen in generierten Videos über eine kurze Verifizierungsaufnahme einbeziehen. Präzise Darstellung von Aussehen und Stimme.
”World Simulators”
OpenAI beschreibt Videogenerierungsmodelle als “World Simulators” - Systeme, die implizite Modelle von Physik und Objektverhalten lernen. Dies verbindet sich mit der breiteren Forschung zu World Models, von denen Demis Hassabis und andere argumentieren, dass sie für AGI notwendig sind.
Allerdings verstehen aktuelle Videogeneratoren nicht wirklich Physik - sie approximieren sie aus Mustern in Trainingsdaten. Generierte Videos können realistisch aussehen, ohne physikalisch korrekt zu sein.
Sicherheitsmaßnahmen
OpenAI hat Schutzmaßnahmen implementiert:
- Wasserzeichen: Sichtbare Markierungen auf generiertem Inhalt
- C2PA-Metadaten: Maschinell lesbare Herkunftsinformationen
- Upload-Einschränkungen: Begrenzte photorealistische Uploads von Personen, insbesondere Minderjährigen
- Inhaltsrichtlinien: Verhinderung nicht-konsensualer Likeness-Generierung
Zugang und Preise
- ChatGPT Pro ($200/Monat): Höchste Qualität und längste Videos
- ChatGPT Plus ($20/Monat): 50 Videos/Monat in niedrigeren Auflösungen
- iOS- und Android-Apps: Zusammen mit Sora 2 veröffentlicht
Wettbewerbslandschaft
Sora konkurriert mit:
- Runway Gen-3: Professionelle Videogenerierung
- Pika: Verbraucherorientierte Video-KI
- Google Veo: Googles Videogenerierungsbemühungen
- Kling: Kuaishous Videomodell
Weiterführende Lektüre
- World Models - Das Konzept, das Sora verkörpert
- Sam Altman - OpenAI CEO, der die Sora-Entwicklung überwacht