GPT 5.2 Hlboká analýza: Prečo je znalostné pracovníka skončená
Perspektíva
Táto epizóda je výzvou zabalená v analýze benchmarkov. Zatiaľ čo väčšina reportáží o vydaniach GPT sa zameriava na vybraté dema, Diamandis a jeho tím hlbšie analyzujú to, čo skutočne záleží: benchmark GDP Val.
Hlavné číslo: 71% úloh v znalostnej práci teraz AI vykonáva lepšie ako ľudia - 11x rýchlejšie a za menej ako 1% nákladov.
To nie je postupná zmena. To je fázový prechod.
To, čo robí túto diskusiu hodnotnou, je nuancia okolo prečo je prijatie stále pomalé napriek týmto možnostiam:
- Jazyková uzamknutosť: AI vynikajúco funguje v Pythone, ale zápasí s dedičným Java/C kódom
- Trecia integrácia: Spoločnosti sú uviaznuté na “môj e-mailový systém sa nepripojí” zatiaľ čo hlavný problém je už vyriešený
- Zlyhanie prognózy: Ľudia si neextrapolia krivku správne
Analýza panelu troch pák, ktoré má OpenAI (výpočtový výkon, bezpečnostné prepínače, post-training), je obzvlášť poučná. Keď vidíte, že model skočí z 17% na 53% na ARC AGI 2 v jednom vydaní, to je agresívny post-training - učia sa testovaciemu zákonu, pretože konkurencia to vyžaduje.
Zlepšenie efektívnosti 390x rok-na-rok pri vizuálnom uvažovaní nie je len benchmark flex. Je to náhľad hyper-deflácie šíriace sa z dátových centier do širšej ekonomiky.
Kľúčové poznatky
- Narušenie znalostnej práce je tu - GDP Val ukazuje 71% úloh automatizovaných pri 11x rýchlosti, <1% náklady
- Pretekanie je skutočné - Google, OpenAI, Anthropic a XAI sú v skutočnej konkurencii s diferencovanými stratégiami
- Bariéry prijatia sú riešiteľné - Dedičný kód a trecia integrácia, nie schopnosť, sú blokátory
- Varovanie pre rok 2026 - Predikcia “najväčšieho kolapsu korporátneho sveta v histórii biznisu”
- Hyper-deflácia sa šíri - Zlepšenia efektívnosti 390x nezostanú obsiahnuté benchmarkom
Väčší obrázok
71% úloh v znalostnej práci je teraz vykonávaných lepšie AI pri 11x rýchlosti a menej ako 1% nákladoch. To nie je postupná zmena - to je fázový prechod. Blokátory nie sú schopnosti ale integrácia: dedičný kód, e-mailové systémy, ktoré sa nebudú pripojiť. Zlepšenia efektívnosti 390x nezostanú obsiahnuté benchmarkom.