OpenAI Images 2.0: generátor, který myslí a navrhuje

2026-04-21 OpenAI

openaigptmultimodaldesignproductivitybusiness

Proč OpenAI Images 2.0 nastavuje novou laťku pro produkční vizuály

OpenAI 21. dubna 2026 spustilo Images 2.0 (interní název: GPT Image 2) v ChatGPT i API. Sam Altman pojmenoval ten skok jasně: “This is like going from GPT-3 to GPT-5 all at once.” (Je to jako přejít z GPT-3 rovnou na GPT-5.) Nezávislé potvrzení přišlo tentýž den z veřejného žebříčku preferencí Arena AI, kde model procházel beta testem pod kódovým označením “duct tape”: “This model has had the biggest jump on the arena at least since I can remember. It’s over 200 points and it’s far far ahead of any other image model.” (Tenhle model udělal největší skok v aréně, co si pamatuji. Je to přes 200 bodů a je daleko, daleko před jakýmkoli jiným obrazovým modelem.)

Posun od generátoru ke spolupracovníkovi: Vedoucí výzkumu Ki-wan to řekl jasně: “This new model is no more like an AI image generator that you just give a prompt and it returns an image. It’s more like an AI that you just interactively talk to and is going to respond using images.” (Tenhle nový model už není AI generátor obrázků, kterému zadáte prompt a on vrátí obrázek. Je to spíš AI, se kterou interaktivně mluvíte a ona odpovídá obrázky.) Demo ukázalo, jak ChatGPT z jediného portrétu vygeneroval osm popsaných variant letního outfitu a pak zazoomoval do vybraného looku v několika úhlech — stejná smyčka, kterou dělá stylista nebo art director, stlačená do jednoho chatu.

Režim myšlení přináší k obrázkům výzkum a použití nástrojů: Pro platící uživatele Images 2.0 nabízí variantu s myšlením, která umí prohledávat web, syntetizovat výsledky a vložit je přímo do výstupu. V živém demu Gabe požádal model, aby našel reakce na sociálních sítích na “duct tape” betu a vložil do jednoho vygenerovaného obrázku funkční QR kód odkazující na chatgpt.com. Tohle je generování obrázků jako agentický úkol, ne pixelová pipeline.

Vykreslování textu je konečně vyřešené — ve všech jazycích: Vícejazyčná typografie byla vrcholem prezentace. OpenAI vygenerovalo kompletní japonské plakáty se správnou hiraganou a kanji, hindské recepty a čínské časopisové layouty bez chyb. Výzkumník Buyan poznamenal: “Previously our model had a hard time memorizing these characters but now you can just prompt and generate entire pages of text in these languages without errors.” (Dříve si náš model tyto znaky zapamatovával jen obtížně, teď stačí zadat prompt a vygenerovat celé stránky textu v těchto jazycích bez chyb.)

Koherence napříč více obrázky otevírá nové formáty: Model teď umí v jedné generaci vytvořit více odlišných obrázků s konzistentními postavami a vyvíjejícím se příběhem — třístránkovou mangu, celá čísla časopisu, plány renovace místnost po místnosti. Recenzent Arena AI potvrdil: identita postav drží napříč panely a prompty jako Drake-meme nebo distracted-boyfriend fungují “completely perfectly” (úplně dokonale), kde konkurence selhává.

Kde to stále selhává: Upřímná kritika Arena AI: geometrické chápání světa není dokonalé (rotace scény přes různé úhly produkuje drobné nekonzistence) a jemnost memů občas nevyjde (směr pohledu u distracted-boyfriend byl špatně). Zachování identity a fotorealismus však byly hodnoceny jako nejlepší ve třídě oproti Grok Imagine, Nano Banana 2 i vlastnímu GPT Image 1.5 od OpenAI.

5 závěrů pro týmy stavějící vizuální workflow s AI

4K a multi-aspect výstup ho dělají produkčně připraveným — 2K rozlišení standardně, poměry stran až 3:1 a 1:3 a experimentální 4K API schopné vykreslit hromadu rýže, na níž je jediné zrnko čitelně popsáno “GPT image 2”.
Designové know-how je součástí modelu — výzkumníci opakovaně zmiňovali záměrné umístění textu, typografickou hierarchii a celostránkové layouty. Model nejen vykresluje; on art-direktuje.
Režim myšlení = vizuály obohacené o web — generování obrázků teď umí pustit výzkum, stáhnout živá data a vložit do výstupů akční prvky (QR kódy, aktuální údaje).
Instant mód je zdarma pro všechny — rychlejší varianta jde ke všem uživatelům ChatGPT; režim myšlení zůstává placený.
200bodový skok v Arena AI je reálný tržní signál — jde o největší skok jednoho modelu naměřený v image aréně a je patrný napříč všemi kategoriemi promptů.

Co to znamená pro kreativní a marketingové týmy poháněné AI

Images 2.0 stlačuje to, co bývalo pipeline — prompt → generátor → copywriter → designér → QA — do jediné konverzační smyčky. Pro marketingové týmy běžící na AI to maže poslední důvod řetězit tři nástroje kvůli jednomu brandovanému assetu. Pro agenty Design Studio a Content Studio od TeamDay to znamená, že éra “jeden model zvládne brief až po hotový layout” začíná teď — a mezera mezi “AI-generated” a “produkčně připraveno” se právě zavřela.