Najintenzívnejší mesiac v histórii AI
Február 2026 bude pamätaný ako mesiac, keď závod o frontier AI nabral plné obrátky. Desať hlavných poskytovateľov aktívne vydáva frontier modely — každý z nich posúva hranice toho, čo je s jazykovými modelmi možné.
Časová os:
| Dátum | Poskytovateľ | Model | Highlight |
|---|---|---|---|
| 2. 12. | Mistral AI | Mistral Large 3 | 675B MoE, #2 open-source na LMArena |
| 27. 1. | Moonshot AI | Kimi K2.5 | 1T open-source MoE s Agent Swarm |
| 5. 2. | OpenAI | GPT-5.3 Codex | Prvý „self-improving” agentic coding model |
| 11. 2. | Zhipu AI | GLM-5 | 745B open-source model trénovaný na čínskych čipoch |
| 12. 2. | DeepSeek | Aktualizácia V3.2 | Kontextové okno rozšírené 10× na 1M+ tokenov |
| 15. 2. | Moonshot AI | Kimi Claw | Browserová agentná platforma na báze K2.5 |
| 17. 2. | Anthropic | Claude Sonnet 4.6 | Výkon blízky Opusu za 1/5 ceny |
| 17. 2. | xAI | Grok 4.2 RC | Model s „rýchlym učením”, ktorý sa zlepšuje každý týždeň |
| 17. 2. | DeepSeek | V4 (očakávané) | Model s 1T parametrami cielený na dominanciu v kódovaní |
| 19. 2. | Gemini 3.1 Pro | 2× skok v uvažovaní, skóre ARC-AGI-2 77,1 % | |
| 2026 | MiniMax | M2.5 | #1 Multi-SWE-Bench, 10B aktívnych parametrov, $0,30/M |
Nejde len o postupné zlepšovanie. Ide o zásadnú zmenu v tom, čo AI modely dokážu, koľko stoja a kto ich vyvíja.
Pozrime sa na každé vydanie.
OpenAI: GPT-5.3 Codex
Vydané: 5. februára 2026
GPT-5.3 Codex od OpenAI predstavuje paradigmatickú zmenu: od „modelu, ktorý píše kód” k „modelu, ktorý zvládne takmer všetko, čo vývojár na počítači”.
Čo je nové
GPT-5.3 Codex kombinuje špičkový výkon GPT-5.2-Codex v oblasti kódovania s uvažovacími schopnosťami a odbornou znalosťou GPT-5.2. Výsledkom je model schopný zvládať dlhotrvajúce úlohy zahŕňajúce výskum, používanie nástrojov a zložité viacúrovňové vykonávanie.
Kľúčové vylepšenia:
- O 25 % rýchlejší ako GPT-5.2-Codex
- Menej tokenov spotrebovaných na úlohu — zvládne viac s menej
- Špičkový výsledok na SWE-Bench Pro a Terminal-Bench
- Silné výsledky na OSWorld a GDPval
Varovný signál v oblasti kybernetickej bezpečnosti
Ide o prvý model OpenAI, ktorý dosiahol hodnotenie „vysoké” v rámci ich frameworku kybernetickej bezpečnostnej pripravenosti — čo znamená, že OpenAI verí, že GPT-5.3 Codex je natoľko schopný v kódovaní a uvažovaní, že by mohol „zmysluplne napomôcť skutočnej kybernetickej ujme, najmä ak by bol automatizovaný alebo použitý vo veľkom rozsahu”. Ide o míľnik, ktorý zdôrazňuje, aké schopné tieto modely sú.
Dostupnosť
K dispozícii plateným používateľom ChatGPT cez aplikáciu Codex, CLI, rozšírenie IDE a web. Bola vydaná aj ľahšia varianta GPT-5.3-Codex-Spark. Prístup cez API príde čoskoro.
Cenník
| Model | Vstup (na 1M) | Výstup (na 1M) | Cached vstup |
|---|---|---|---|
| GPT-5 | $1,25 | $10,00 | $0,625 |
| GPT-5.3 Codex | TBA (API čaká) | TBA | TBA |
| o3 | $2,00 | $8,00 | — |
| o4-mini | $1,10 | $4,40 | $0,55 |
Anthropic: Claude Sonnet 4.6
Vydané: 17. februára 2026
Claude Sonnet 4.6 je odpoveď Anthropicu na otázku, ktorú pred rokom nikto nepovažoval za možnú: môže model strednej triedy vyrovnať vlajkový model?
Čo je nové
Nejde o drobnú aktualizáciu verzie. Sonnet 4.6 je plný upgrade v oblastiach kódovania, ovládania počítača, uvažovania s dlhým kontextom, plánovania agentov, znalostnej práce a dizajnu. Dodáva sa s kontextovým oknom 1M tokenov (v beta verzii).
Prehľad benchmarkov
| Benchmark | Sonnet 4.6 | Opus 4.6 | Rozdiel |
|---|---|---|---|
| SWE-bench Verified | 79,6 % | — | — |
| OSWorld (ovládanie počítača) | 72,5 % | 72,7 % | 0,2 % |
| Office Productivity | 1633 Elo | 1559 Elo | Sonnet vedie |
| Financial Analysis | 63,3 % | 62,0 % | Sonnet vedie |
Číslo pre ovládanie počítača je pozoruhodné: 72,5 % na OSWorld-Verified, v porovnaní s 14,9 % pri prvom spustení funkcie computer use len pred 16 mesiacmi.
Preferencie používateľov
Anthropic uvádza, že 70 % používateľov preferuje Sonnet 4.6 pred Sonnetom 4.5 a 59 % ho preferuje pred starším Opusom 4.5. Za $3/$15 na milión tokenov — pätina ceny Opusu 4.6 za $15/$75 — ide o najlepšiu hodnotu vo frontier AI pre podnikové pracovné záťaže.
Claude Opus 4.6
Vlajkový Opus 4.6 zostáva stropom schopností Anthropicu a poháňa tie najnáročnejšie agentic a uvažovacie úlohy. Avšak rozdiel oproti Sonnetu je teraz minimálny, čo robí z modelu strednej triedy pragmatickú voľbu pre väčšinu aplikácií.
Google: Gemini 3.1 Pro
Vydané: 19. februára 2026
Google predstavuje Gemini 3.1 Pro nie ako výklenkový upgrade, ale ako spoľahlivejší predvolený model pre zložité úlohy.
Čo je nové
Hlavné číslo: skóre ARC-AGI-2 77,1 % — viac ako dvojnásobný výkon v uvažovaní oproti Gemini 3 Pro. Je špeciálne navrhnutý pre úlohy vyžadujúce pokročilé viacúrovňové uvažovanie, ako je syntéza dát z rôznych zdrojov alebo vysvetľovanie zložitých vzájomne závislých tém.
Dostupnosť
Postupné zavádzanie v celom ekosystéme Google:
- Aplikácia Gemini (vyššie limity pre používateľov Pro a Ultra)
- NotebookLM (používatelia Pro a Ultra)
- Gemini API cez AI Studio, Vertex AI, Gemini CLI a Android Studio
- Ceny nezmenené oproti Gemini 3 Pro (~$1,25/$10 na milión tokenov štandardne)
Prečo na tom záleží
Google zachoval ceny a zároveň dramaticky zlepšil uvažovacie schopnosti. Pre podniky, ktoré sú už na Google Cloude, sa 3.1 Pro hodí ako priamy upgrade bez dopadu na rozpočet.
DeepSeek: V4 a 10× rozšírenie kontextu
Aktualizácia V3.2: 12. februára 2026 V4 očakávané: polovica februára 2026
DeepSeek naďalej zostáva najviac destabilizujúcou silou v oblasti cien AI a pritom prináša skutočné frontier schopnosti.
V3.2: Desaťnásobné rozšírenie kontextu
Začiatkom februára DeepSeek rozšíril kontextové okno V3.2 zo 128 000 tokenov na viac ako 1 milión — desaťnásobné zvýšenie. Za $0,27/$1,10 na milión tokenov je teraz tento model najlacnejším spôsobom spracovania masívnych dokumentov s frontier-class modelom.
V4: Ďalšia frontier
DeepSeek V4 sa očakáva s týmito vlastnosťami:
- 1 bilión parametrov (architektúra MoE)
- 1M+ tokenový kontext natívne
- Tri architektonické prelomy: Engram conditional memory, Manifold-Constrained Hyper-Connections a DeepSeek Sparse Attention
- Cieľ: 80 %+ na SWE-bench — to by ho postavilo na samotný vrchol kódovacích benchmarkov
- Očakávané ako open-weight pod permisívnou licenciou
Cenový príbeh
Cenový rozdiel medzi DeepSeeком a západnými poskytovateľmi zostáva ohromujúci:
| Príklad nákladov na úlohu | GPT-5 | Claude Opus 4.6 | DeepSeek V3.2 |
|---|---|---|---|
| 100K vstup + 10K výstup | $0,225 | $2,25 | $0,038 |
| Pomer k DeepSeeku | 6× | 59× | 1× |
Zložitá úloha za $15 s GPT-5 stojí približne $0,50 s DeepSeeком. Nejde len o cenovú výhodu — mení to, čo je ekonomicky zmysluplné automatizovať.
Zhipu AI: GLM-5
Vydané: 11. februára 2026
Najväčšie vydanie open-source modelu tohto mesiaca a pravdepodobne najvýznamnejšie z geopolitického hľadiska.
Čo je nové
GLM-5 je model MoE s 745 miliardami parametrov (44B aktívnych parametrov) s piatimi kľúčovými schopnosťami: kreatívne písanie, generovanie kódu, viacúrovňové uvažovanie, agentic inteligencia a spracovanie dlhého kontextu.
Výsledky benchmarkov
| Benchmark | GLM-5 | Porovnanie |
|---|---|---|
| SWE-bench Verified | 77,8 % | Zodpovedá Claude Opus 4.5 |
| AIME 2026 | 92,7 % | — |
| GPQA-Diamond | 86,0 % | — |
| Humanity’s Last Exam | 50,4 % | Prekonáva Claude Opus 4.5 |
| Miera halucinácie | 34 % | Pokles z 90 % (GLM-4.7) |
Zníženie halucinácie — z 90 % na 34 % pomocou novej techniky RL nazvanej Slime — je obzvlášť pôsobivé a GLM-5 v tomto ohľade vedie index Artificial Analysis Omniscience.
Geopolitický signál
GLM-5 bol trénovaný výhradne na čipoch Huawei Ascend pomocou frameworku MindSpore — bez akéhokoľvek hardvéru vyrobeného v USA. To dokazuje, že čínsky domáci výpočtový stack dokáže produkovať modely frontier kvality napriek exportným kontrolám.
Natívny Agent Mode
GLM-5 prichádza s natívnym „Agent Mode”, ktorý dokáže premeniť výzvy na profesionálne kancelárske dokumenty (.docx, .pdf, .xlsx) — priama konkurencia pre computer use od Anthropic a Codex od OpenAI pri praktických obchodných úlohách.
Po spustení akcie Zhipu vzrástli o 34 % na hongkonskej burze.
Moonshot AI: Kimi K2.5 a Kimi Claw
K2.5 vydané: 27. januára 2026 Kimi Claw: 15. februára 2026
Moonshot AI buduje najkomplexnejší open-source agentic ekosystém v čínskom AI priestore.
Kimi K2.5
Model MoE s 1 biliónom parametrov (32B aktívnych parametrov), ktorý rozumie textu, obrázkom a videu. Kľúčová inovácia: schopnosť Agent Swarm, poháňaná novou technikou RL nazvanou Parallel Agent Reinforcement Learning (PARL), ktorá trénuje model na dekompozíciu a paralelizáciu zložitých úloh.
Model je plne open-source a dostupný na Hugging Face.
Kimi Claw
Spustený 15. februára, Kimi Claw je cloudová browserová AI agentná platforma postavená na frameworku OpenClaw. Predstavte si ho ako odpoveď Moonshootu na computer use od Anthropic — ale bežiaci celý v cloude.
xAI: Grok 4.2 Release Candidate
Verejná beta: 17. februára 2026
Grok 4.2 od Elona Muska prináša zásadne odlišný prístup k zlepšovaniu modelov: rýchle učenie.
Čo je nové
Na rozdiel od každého iného modelu na tomto zozname je Grok 4.2 navrhnutý tak, aby sa zlepšoval každý týždeň na základe verejného používania. Musk ho opísal ako model „schopný rýchlo sa učiť” s týždennými cyklami zlepšovania a poznámkami k vydaniu.
Nové schopnosti:
- 4-agentná paralelná spolupráca — špecializovaní AI agenti, ktorí syntetizujú výstupy do jedinej odpovede
- Analýza lekárskych dokumentov cez nahranie fotografie
- Vylepšené inžinierske uvažovanie
Cenník
xAI si udržiava svoju agresívnu cenovú stratégiu:
| Model | Vstup (na 1M) | Výstup (na 1M) |
|---|---|---|
| Grok 4.1 | $0,20 | $0,50 |
| Grok 4.2 RC | TBA (beta) | TBA |
Aktuálny stav
Grok 4.2 je v súčasnosti vo verejnej bete — k dispozícii na výber v rozhraní Grok. Verejné vydanie sa očakáva v marci 2026. Oficiálne benchmarky budú zverejnené po skončení beta verzie.
Mistral AI: Large 3 a kódovací stack
Mistral Large 3: 2. decembra 2025 Devstral 2: december 2025
Mistral naďalej prekonáva svoju kategóriu ako popredné európske AI laboratórium a vydáva modely, ktoré konkurujú na vrchole open-source rebríčkov.
Mistral Large 3
Model MoE s 675 miliardami parametrov s 41B aktívnymi parametrami. Debutoval na #2 mieste v open-source non-reasoning modeloch na rebríčku LMArena — hneď za oveľa väčšími modelmi z čínskych laboratórií.
Kľúčové modely v aktuálnej ponuke Mistralu:
| Model | Zameranie | Cena (na 1M) |
|---|---|---|
| Mistral Large 3 | Všeobecná frontier | ~$2,00 / $6,00 |
| Mistral Medium 3.1 | Multimodálny (40k ctx) | $2,00 / $5,00 |
| Magistral Medium 1.2 | Uvažovanie | $2,00 / $5,00 |
| Codestral | Dokončovanie kódu | Premier tier |
| Devstral 2 | Agentic kódovanie | Open-weight |
Devstral Small 2
Hviezda decembrového vydania: kódovací model s 24B parametrami, ktorý prekonáva Qwen 3 Coder Flash napriek tomu, že je výrazne menší. Pre tímy, ktoré potrebujú vlastný kódovací AI bez masívnych GPU požiadaviek, je Devstral Small 2 presvedčivou voľbou.
Ministral 3
Rodina malých modelov Mistralu (3B, 7B, 14B parametrov) dosahuje najlepší pomer cena/výkon medzi open-source modelmi — zodpovedá alebo prekonáva porovnateľné modely a pritom produkuje o rád menej tokenov.
MiniMax: M2.5
M2.5 vydané: 2026
Temný kôň závodu o frontier. M2.5 od MiniMaxu prináša benchmark-topping výkon v kódovaní s len 10 miliardami aktívnych parametrov — zlomok toho, čo konkurenti používajú.
Čo je nové
MiniMax M2.5 je účelovo postavený pre kódovanie a agentic vykonávanie so zameraním na dosiahnutie viac s menej:
- #1 na Multi-SWE-Bench so skóre 51,3
- Prekonáva Claude Opus 4.6 na SWE-Bench Pro
- Vedúce skóre na benchmarkoch FinSearch, BrowseComp a RISE
- Priepustnosť 100 tokenov za sekundu — opisovaná ako „3× rýchlejší ako Opus”
- Uvažovanie Chain of Thought až 128K tokenov
Príbeh efektivity
Výnimočná štatistika: MiniMax M2.5 zvládne 327,8 úloh na $100 rozpočtu — viac ako 10× viac ako Opus. Za $0,30 na milión vstupných tokenov ($0,06 s cache) sa pohybuje v cenovom teritóriu DeepSeeku a pritom zodpovedá alebo prekonáva prémiové modely v kódovacích úlohách.
| Model | Vstup (na 1M) | S cache | Rýchlosť |
|---|---|---|---|
| M2.5 | $0,30 | $0,06 | 100 TPS |
| M2.5-highspeed | $0,30 | $0,06 | Rýchlejšia varianta |
Open weights
MiniMax uvoľnil váhy M2.5 na HuggingFace s podporou vLLM, SGLang a Transformers pre vlastné hosťovanie. To z neho robí jednu z najefektívnejších možností pre tímy prevádzkujúce vlastnú inferenčnú infraštruktúru.
Cenová krajina
Tu je prehľad nákladov všetkých frontier modelov (na milión tokenov):
| Poskytovateľ | Model | Vstup | Výstup | Kontext |
|---|---|---|---|---|
| xAI | Grok 4.1 | $0,20 | $0,50 | — |
| DeepSeek | V3.2 | $0,27 | $1,10 | 1M+ |
| MiniMax | M2.5 | $0,30 | — | 128K |
| OpenAI | o4-mini | $1,10 | $4,40 | — |
| Gemini 3.1 Pro | ~$1,25 | ~$10,00 | 1M | |
| OpenAI | GPT-5 | $1,25 | $10,00 | 400K |
| Mistral AI | Medium 3.1 | $2,00 | $5,00 | 40K |
| Mistral AI | Large 3 | ~$2,00 | ~$6,00 | 128K |
| OpenAI | o3 | $2,00 | $8,00 | — |
| Anthropic | Sonnet 4.6 | $3,00 | $15,00 | 1M (beta) |
| Anthropic | Opus 4.6 | $15,00 | $75,00 | 200K |
| Zhipu AI | GLM-5 | Open weights | Zadarmo na vlastné hosťovanie | — |
| Moonshot AI | Kimi K2.5 | Open weights | Zadarmo na vlastné hosťovanie | — |
| DeepSeek | V4 (očakávané) | Open weights | Zadarmo na vlastné hosťovanie | 1M+ |
17-násobný cenový rozdiel medzi najlacnejším API (DeepSeek za $0,27/M) a prémiovými modelmi (Opus 4.6 za $15/M vstup) predstavuje skutočné architektonické rozhodnutie pre firmy. Otázka už nie je „môžeme si AI dovoliť?”, ale „ktorá úroveň AI zodpovedá nášmu prípadu použitia?”
Kľúčové trendy
1. Nástup open-source
Päť nedávnych vydaní — GLM-5, Kimi K2.5, DeepSeek V4, Mistral Large 3 a MiniMax M2.5 — sú open-weight modely. Nielen že dobiehajú uzavreté modely; GLM-5 zodpovedá Claude Opus 4.5 na SWE-bench a prekonáva ho na Humanity’s Last Exam. Mistral Large 3 je na #2 v open-source LMArena. Kvalitatívny rozdiel medzi open a closed modelmi prakticky zmizol.
2. Čínsky nezávislý AI stack
GLM-5 (Huawei Ascend) aj DeepSeek V4 dokazujú, že čínske laboratóriá dokážu produkovať frontier modely bez amerického hardvéru. Exportné kontroly čínsky AI pokrok spomalili, ale nezastavili — a možno urýchlili investície do domácich alternatív.
3. Agentika vo všetkom
Každé vydanie tohto mesiaca zahŕňa agentic schopnosti: GPT-5.3 Codex zvládá dlhotrvajúce viacúrovňové úlohy, Claude 4.6 má computer use na 72,5 %, Grok 4.2 prevádzkuje 4-agentná paralelná spolupráca, GLM-5 má natívny Agent Mode a Kimi má Agent Swarm. Rok 2026 je rokom, keď modely prestali byť chatbotmi a začali byť pracovníkmi.
4. Revolúcia strednej triedy
Preukázanie, že model za $3/M dokáže vyrovnať vlajkový model za $15/M, je prelomový okamih. V kombinácii s cenou $0,27/M od DeepSeeku dosahujúcou ~90 % kvality GPT-5 je hodnotová ponuka prémiového API pod vážnym tlakom.
5. Konvergencia kontextových okien
Viacero modelov teraz ponúka kontextové okná 1M+ tokenov: Gemini 3.1 Pro, Claude 4.6 (beta), DeepSeek V4 a Kimi K2.5. Spracovanie celých kódových základní, právnych dokumentov alebo výskumných korpusov v jedinom prechode už nie je diferenciátorom — je to nevyhnutný základ.
Čo to znamená pre podnikových používateľov
Ak v roku 2026 zabudovávate AI do svojho firemného pracovného postupu, tu sú praktické závery:
Pre kódovanie a vývoj: GPT-5.3 Codex a Claude Sonnet 4.6 vedú peloton. Codex pre dlhotrvajúce agentic úlohy, Sonnet pre všestranné kódovanie a ovládanie počítača.
Pre náklady citlivé pracovné záťaže: DeepSeek V3.2 za $0,27/M tokenov je neprekonateľný pre veľkoobjemové úlohy. Open-weight modely (GLM-5, Kimi K2.5) sú zadarmo pre vlastné hosťovanie, ak máte GPU infraštruktúru.
Pre podnikové uvažovanie: 2× zlepšenie uvažovania Gemini 3.1 Pro z neho robí predvolenú voľbu pre Google Cloud zákazníkov. Claude Opus 4.6 zostáva stropom pre komplexné analýzy.
Pre rýchle iterácie: Model týždenného zlepšovania Groku 4.2 je unikátny — ak potrebujete model, ktorý sa postupom času stáva lepším pre vaše konkrétne prípady použitia, stojí za sledovanie.
Pre nezávislosť: Open-weight modely (GLM-5, Kimi K2.5, DeepSeek V4) vám dávajú plnú kontrolu nad nasadením, prispôsobením a ochranou dát.
Posledná aktualizácia
20. februára 2026 — Tento článok je aktualizovaný pri vydávaní nových frontier modelov. Sledujte nás pre najnovšie správy.
Predchádzajúce aktualizácie: Prvá publikácia (20. 2. 2026)