Frontier AI modely február 2026: GPT-5.3,

Najintenzívnejší mesiac v histórii AI

Február 2026 bude pamätaný ako mesiac, keď závod o frontier AI nabral plné obrátky. Desať hlavných poskytovateľov aktívne vydáva frontier modely — každý z nich posúva hranice toho, čo je s jazykovými modelmi možné.

Časová os:

Dátum	Poskytovateľ	Model	Highlight
2. 12.	Mistral AI	Mistral Large 3	675B MoE, #2 open-source na LMArena
27. 1.	Moonshot AI	Kimi K2.5	1T open-source MoE s Agent Swarm
5. 2.	OpenAI	GPT-5.3 Codex	Prvý „self-improving" agentic coding model
11. 2.	Zhipu AI	GLM-5	745B open-source model trénovaný na čínskych čipoch
12. 2.	DeepSeek	Aktualizácia V3.2	Kontextové okno rozšírené 10× na 1M+ tokenov
15. 2.	Moonshot AI	Kimi Claw	Browserová agentná platforma na báze K2.5
17. 2.	Anthropic	Claude Sonnet 4.6	Výkon blízky Opusu za 1/5 ceny
17. 2.	xAI	Grok 4.2 RC	Model s „rýchlym učením", ktorý sa zlepšuje každý týždeň
17. 2.	DeepSeek	V4 (očakávané)	Model s 1T parametrami cielený na dominanciu v kódovaní
19. 2.	Google	Gemini 3.1 Pro	2× skok v uvažovaní, skóre ARC-AGI-2 77,1 %
2026	MiniMax	M2.5	#1 Multi-SWE-Bench, 10B aktívnych parametrov, $0,30/M

Nejde len o postupné zlepšovanie. Ide o zásadnú zmenu v tom, čo AI modely dokážu, koľko stoja a kto ich vyvíja.

Pozrime sa na každé vydanie.

OpenAI: GPT-5.3 Codex

Vydané: 5. februára 2026

GPT-5.3 Codex od OpenAI predstavuje paradigmatickú zmenu: od „modelu, ktorý píše kód" k „modelu, ktorý zvládne takmer všetko, čo vývojár na počítači".

Čo je nové

GPT-5.3 Codex kombinuje špičkový výkon GPT-5.2-Codex v oblasti kódovania s uvažovacími schopnosťami a odbornou znalosťou GPT-5.2. Výsledkom je model schopný zvládať dlhotrvajúce úlohy zahŕňajúce výskum, používanie nástrojov a zložité viacúrovňové vykonávanie.

Kľúčové vylepšenia:

O 25 % rýchlejší ako GPT-5.2-Codex
Menej tokenov spotrebovaných na úlohu — zvládne viac s menej
Špičkový výsledok na SWE-Bench Pro a Terminal-Bench
Silné výsledky na OSWorld a GDPval

Varovný signál v oblasti kybernetickej bezpečnosti

Ide o prvý model OpenAI, ktorý dosiahol hodnotenie „vysoké" v rámci ich frameworku kybernetickej bezpečnostnej pripravenosti — čo znamená, že OpenAI verí, že GPT-5.3 Codex je natoľko schopný v kódovaní a uvažovaní, že by mohol „zmysluplne napomôcť skutočnej kybernetickej ujme, najmä ak by bol automatizovaný alebo použitý vo veľkom rozsahu". Ide o míľnik, ktorý zdôrazňuje, aké schopné tieto modely sú.

Dostupnosť

K dispozícii plateným používateľom ChatGPT cez aplikáciu Codex, CLI, rozšírenie IDE a web. Bola vydaná aj ľahšia varianta GPT-5.3-Codex-Spark. Prístup cez API príde čoskoro.

Cenník

Model	Vstup (na 1M)	Výstup (na 1M)	Cached vstup
GPT-5	$1,25	$10,00	$0,625
GPT-5.3 Codex	TBA (API čaká)	TBA	TBA
o3	$2,00	$8,00	—
o4-mini	$1,10	$4,40	$0,55

Anthropic: Claude Sonnet 4.6

Vydané: 17. februára 2026

Claude Sonnet 4.6 je odpoveď Anthropicu na otázku, ktorú pred rokom nikto nepovažoval za možnú: môže model strednej triedy vyrovnať vlajkový model?

Čo je nové

Nejde o drobnú aktualizáciu verzie. Sonnet 4.6 je plný upgrade v oblastiach kódovania, ovládania počítača, uvažovania s dlhým kontextom, plánovania agentov, znalostnej práce a dizajnu. Dodáva sa s kontextovým oknom 1M tokenov (v beta verzii).

Prehľad benchmarkov

Benchmark	Sonnet 4.6	Opus 4.6	Rozdiel
SWE-bench Verified	79,6 %	—	—
OSWorld (ovládanie počítača)	72,5 %	72,7 %	0,2 %
Office Productivity	1633 Elo	1559 Elo	Sonnet vedie
Financial Analysis	63,3 %	62,0 %	Sonnet vedie

Číslo pre ovládanie počítača je pozoruhodné: 72,5 % na OSWorld-Verified, v porovnaní s 14,9 % pri prvom spustení funkcie computer use len pred 16 mesiacmi.

Preferencie používateľov

Anthropic uvádza, že 70 % používateľov preferuje Sonnet 4.6 pred Sonnetom 4.5 a 59 % ho preferuje pred starším Opusom 4.5. Za $3/$15 na milión tokenov — pätina ceny Opusu 4.6 za $15/$75 — ide o najlepšiu hodnotu vo frontier AI pre podnikové pracovné záťaže.

Claude Opus 4.6

Vlajkový Opus 4.6 zostáva stropom schopností Anthropicu a poháňa tie najnáročnejšie agentic a uvažovacie úlohy. Avšak rozdiel oproti Sonnetu je teraz minimálny, čo robí z modelu strednej triedy pragmatickú voľbu pre väčšinu aplikácií.

Google: Gemini 3.1 Pro

Vydané: 19. februára 2026

Google predstavuje Gemini 3.1 Pro nie ako výklenkový upgrade, ale ako spoľahlivejší predvolený model pre zložité úlohy.

Čo je nové

Hlavné číslo: skóre ARC-AGI-2 77,1 % — viac ako dvojnásobný výkon v uvažovaní oproti Gemini 3 Pro. Je špeciálne navrhnutý pre úlohy vyžadujúce pokročilé viacúrovňové uvažovanie, ako je syntéza dát z rôznych zdrojov alebo vysvetľovanie zložitých vzájomne závislých tém.

Dostupnosť

Postupné zavádzanie v celom ekosystéme Google:

Aplikácia Gemini (vyššie limity pre používateľov Pro a Ultra)
NotebookLM (používatelia Pro a Ultra)
Gemini API cez AI Studio, Vertex AI, Gemini CLI a Android Studio
Ceny nezmenené oproti Gemini 3 Pro (~$1,25/$10 na milión tokenov štandardne)

Prečo na tom záleží

Google zachoval ceny a zároveň dramaticky zlepšil uvažovacie schopnosti. Pre podniky, ktoré sú už na Google Cloude, sa 3.1 Pro hodí ako priamy upgrade bez dopadu na rozpočet.

DeepSeek: V4 a 10× rozšírenie kontextu

Aktualizácia V3.2: 12. februára 2026 V4 očakávané: polovica februára 2026

DeepSeek naďalej zostáva najviac destabilizujúcou silou v oblasti cien AI a pritom prináša skutočné frontier schopnosti.

V3.2: Desaťnásobné rozšírenie kontextu

Začiatkom februára DeepSeek rozšíril kontextové okno V3.2 zo 128 000 tokenov na viac ako 1 milión — desaťnásobné zvýšenie. Za $0,27/$1,10 na milión tokenov je teraz tento model najlacnejším spôsobom spracovania masívnych dokumentov s frontier-class modelom.

V4: Ďalšia frontier

DeepSeek V4 sa očakáva s týmito vlastnosťami:

1 bilión parametrov (architektúra MoE)
1M+ tokenový kontext natívne
Tri architektonické prelomy: Engram conditional memory, Manifold-Constrained Hyper-Connections a DeepSeek Sparse Attention
Cieľ: 80 %+ na SWE-bench — to by ho postavilo na samotný vrchol kódovacích benchmarkov
Očakávané ako open-weight pod permisívnou licenciou

Cenový príbeh

Cenový rozdiel medzi DeepSeeком a západnými poskytovateľmi zostáva ohromujúci:

Príklad nákladov na úlohu	GPT-5	Claude Opus 4.6	DeepSeek V3.2
100K vstup + 10K výstup	$0,225	$2,25	$0,038
Pomer k DeepSeeku	6×	59×	1×

Zložitá úloha za $15 s GPT-5 stojí približne $0,50 s DeepSeeком. Nejde len o cenovú výhodu — mení to, čo je ekonomicky zmysluplné automatizovať.

Zhipu AI: GLM-5

Vydané: 11. februára 2026

Najväčšie vydanie open-source modelu tohto mesiaca a pravdepodobne najvýznamnejšie z geopolitického hľadiska.

Čo je nové

GLM-5 je model MoE s 745 miliardami parametrov (44B aktívnych parametrov) s piatimi kľúčovými schopnosťami: kreatívne písanie, generovanie kódu, viacúrovňové uvažovanie, agentic inteligencia a spracovanie dlhého kontextu.

Výsledky benchmarkov

Benchmark	GLM-5	Porovnanie
SWE-bench Verified	77,8 %	Zodpovedá Claude Opus 4.5
AIME 2026	92,7 %	—
GPQA-Diamond	86,0 %	—
Humanity's Last Exam	50,4 %	Prekonáva Claude Opus 4.5
Miera halucinácie	34 %	Pokles z 90 % (GLM-4.7)

Zníženie halucinácie — z 90 % na 34 % pomocou novej techniky RL nazvanej Slime — je obzvlášť pôsobivé a GLM-5 v tomto ohľade vedie index Artificial Analysis Omniscience.

Geopolitický signál

GLM-5 bol trénovaný výhradne na čipoch Huawei Ascend pomocou frameworku MindSpore — bez akéhokoľvek hardvéru vyrobeného v USA. To dokazuje, že čínsky domáci výpočtový stack dokáže produkovať modely frontier kvality napriek exportným kontrolám.

Natívny Agent Mode

GLM-5 prichádza s natívnym „Agent Mode", ktorý dokáže premeniť výzvy na profesionálne kancelárske dokumenty (.docx, .pdf, .xlsx) — priama konkurencia pre computer use od Anthropic a Codex od OpenAI pri praktických obchodných úlohách.

Po spustení akcie Zhipu vzrástli o 34 % na hongkonskej burze.

Moonshot AI: Kimi K2.5 a Kimi Claw

K2.5 vydané: 27. januára 2026 Kimi Claw: 15. februára 2026

Moonshot AI buduje najkomplexnejší open-source agentic ekosystém v čínskom AI priestore.

Kimi K2.5

Model MoE s 1 biliónom parametrov (32B aktívnych parametrov), ktorý rozumie textu, obrázkom a videu. Kľúčová inovácia: schopnosť Agent Swarm, poháňaná novou technikou RL nazvanou Parallel Agent Reinforcement Learning (PARL), ktorá trénuje model na dekompozíciu a paralelizáciu zložitých úloh.

Model je plne open-source a dostupný na Hugging Face.

Kimi Claw

Spustený 15. februára, Kimi Claw je cloudová browserová AI agentná platforma postavená na frameworku OpenClaw. Predstavte si ho ako odpoveď Moonshootu na computer use od Anthropic — ale bežiaci celý v cloude.

xAI: Grok 4.2 Release Candidate

Verejná beta: 17. februára 2026

Grok 4.2 od Elona Muska prináša zásadne odlišný prístup k zlepšovaniu modelov: rýchle učenie.

Čo je nové

Na rozdiel od každého iného modelu na tomto zozname je Grok 4.2 navrhnutý tak, aby sa zlepšoval každý týždeň na základe verejného používania. Musk ho opísal ako model „schopný rýchlo sa učiť" s týždennými cyklami zlepšovania a poznámkami k vydaniu.

Nové schopnosti:

4-agentná paralelná spolupráca — špecializovaní AI agenti, ktorí syntetizujú výstupy do jedinej odpovede
Analýza lekárskych dokumentov cez nahranie fotografie
Vylepšené inžinierske uvažovanie

Cenník

xAI si udržiava svoju agresívnu cenovú stratégiu:

Model	Vstup (na 1M)	Výstup (na 1M)
Grok 4.1	$0,20	$0,50
Grok 4.2 RC	TBA (beta)	TBA

Aktuálny stav

Grok 4.2 je v súčasnosti vo verejnej bete — k dispozícii na výber v rozhraní Grok. Verejné vydanie sa očakáva v marci 2026. Oficiálne benchmarky budú zverejnené po skončení beta verzie.

Mistral AI: Large 3 a kódovací stack

Mistral Large 3: 2. decembra 2025 Devstral 2: december 2025

Mistral naďalej prekonáva svoju kategóriu ako popredné európske AI laboratórium a vydáva modely, ktoré konkurujú na vrchole open-source rebríčkov.

Mistral Large 3

Model MoE s 675 miliardami parametrov s 41B aktívnymi parametrami. Debutoval na #2 mieste v open-source non-reasoning modeloch na rebríčku LMArena — hneď za oveľa väčšími modelmi z čínskych laboratórií.

Kľúčové modely v aktuálnej ponuke Mistralu:

Model	Zameranie	Cena (na 1M)
Mistral Large 3	Všeobecná frontier	~$2,00 / $6,00
Mistral Medium 3.1	Multimodálny (40k ctx)	$2,00 / $5,00
Magistral Medium 1.2	Uvažovanie	$2,00 / $5,00
Codestral	Dokončovanie kódu	Premier tier
Devstral 2	Agentic kódovanie	Open-weight

Devstral Small 2

Hviezda decembrového vydania: kódovací model s 24B parametrami, ktorý prekonáva Qwen 3 Coder Flash napriek tomu, že je výrazne menší. Pre tímy, ktoré potrebujú vlastný kódovací AI bez masívnych GPU požiadaviek, je Devstral Small 2 presvedčivou voľbou.

Ministral 3

Rodina malých modelov Mistralu (3B, 7B, 14B parametrov) dosahuje najlepší pomer cena/výkon medzi open-source modelmi — zodpovedá alebo prekonáva porovnateľné modely a pritom produkuje o rád menej tokenov.

MiniMax: M2.5

M2.5 vydané: 2026

Temný kôň závodu o frontier. M2.5 od MiniMaxu prináša benchmark-topping výkon v kódovaní s len 10 miliardami aktívnych parametrov — zlomok toho, čo konkurenti používajú.

Čo je nové

MiniMax M2.5 je účelovo postavený pre kódovanie a agentic vykonávanie so zameraním na dosiahnutie viac s menej:

#1 na Multi-SWE-Bench so skóre 51,3
Prekonáva Claude Opus 4.6 na SWE-Bench Pro
Vedúce skóre na benchmarkoch FinSearch, BrowseComp a RISE
Priepustnosť 100 tokenov za sekundu — opisovaná ako „3× rýchlejší ako Opus"
Uvažovanie Chain of Thought až 128K tokenov

Príbeh efektivity

Výnimočná štatistika: MiniMax M2.5 zvládne 327,8 úloh na $100 rozpočtu — viac ako 10× viac ako Opus. Za $0,30 na milión vstupných tokenov ($0,06 s cache) sa pohybuje v cenovom teritóriu DeepSeeku a pritom zodpovedá alebo prekonáva prémiové modely v kódovacích úlohách.

Model	Vstup (na 1M)	S cache	Rýchlosť
M2.5	$0,30	$0,06	100 TPS
M2.5-highspeed	$0,30	$0,06	Rýchlejšia varianta

Open weights

MiniMax uvoľnil váhy M2.5 na HuggingFace s podporou vLLM, SGLang a Transformers pre vlastné hosťovanie. To z neho robí jednu z najefektívnejších možností pre tímy prevádzkujúce vlastnú inferenčnú infraštruktúru.

Cenová krajina

Tu je prehľad nákladov všetkých frontier modelov (na milión tokenov):

Poskytovateľ	Model	Vstup	Výstup	Kontext
xAI	Grok 4.1	$0,20	$0,50	—
DeepSeek	V3.2	$0,27	$1,10	1M+
MiniMax	M2.5	$0,30	—	128K
OpenAI	o4-mini	$1,10	$4,40	—
Google	Gemini 3.1 Pro	~$1,25	~$10,00	1M
OpenAI	GPT-5	$1,25	$10,00	400K
Mistral AI	Medium 3.1	$2,00	$5,00	40K
Mistral AI	Large 3	~$2,00	~$6,00	128K
OpenAI	o3	$2,00	$8,00	—
Anthropic	Sonnet 4.6	$3,00	$15,00	1M (beta)
Anthropic	Opus 4.6	$15,00	$75,00	200K
Zhipu AI	GLM-5	Open weights	Zadarmo na vlastné hosťovanie	—
Moonshot AI	Kimi K2.5	Open weights	Zadarmo na vlastné hosťovanie	—
DeepSeek	V4 (očakávané)	Open weights	Zadarmo na vlastné hosťovanie	1M+

17-násobný cenový rozdiel medzi najlacnejším API (DeepSeek za $0,27/M) a prémiovými modelmi (Opus 4.6 za $15/M vstup) predstavuje skutočné architektonické rozhodnutie pre firmy. Otázka už nie je „môžeme si AI dovoliť?", ale „ktorá úroveň AI zodpovedá nášmu prípadu použitia?"

Kľúčové trendy

1. Nástup open-source

Päť nedávnych vydaní — GLM-5, Kimi K2.5, DeepSeek V4, Mistral Large 3 a MiniMax M2.5 — sú open-weight modely. Nielen že dobiehajú uzavreté modely; GLM-5 zodpovedá Claude Opus 4.5 na SWE-bench a prekonáva ho na Humanity's Last Exam. Mistral Large 3 je na #2 v open-source LMArena. Kvalitatívny rozdiel medzi open a closed modelmi prakticky zmizol.

2. Čínsky nezávislý AI stack

GLM-5 (Huawei Ascend) aj DeepSeek V4 dokazujú, že čínske laboratóriá dokážu produkovať frontier modely bez amerického hardvéru. Exportné kontroly čínsky AI pokrok spomalili, ale nezastavili — a možno urýchlili investície do domácich alternatív.

3. Agentika vo všetkom

Každé vydanie tohto mesiaca zahŕňa agentic schopnosti: GPT-5.3 Codex zvládá dlhotrvajúce viacúrovňové úlohy, Claude 4.6 má computer use na 72,5 %, Grok 4.2 prevádzkuje 4-agentná paralelná spolupráca, GLM-5 má natívny Agent Mode a Kimi má Agent Swarm. Rok 2026 je rokom, keď modely prestali byť chatbotmi a začali byť pracovníkmi.

4. Revolúcia strednej triedy

Preukázanie, že model za $3/M dokáže vyrovnať vlajkový model za $15/M, je prelomový okamih. V kombinácii s cenou $0,27/M od DeepSeeku dosahujúcou ~90 % kvality GPT-5 je hodnotová ponuka prémiového API pod vážnym tlakom.

5. Konvergencia kontextových okien

Viacero modelov teraz ponúka kontextové okná 1M+ tokenov: Gemini 3.1 Pro, Claude 4.6 (beta), DeepSeek V4 a Kimi K2.5. Spracovanie celých kódových základní, právnych dokumentov alebo výskumných korpusov v jedinom prechode už nie je diferenciátorom — je to nevyhnutný základ.

Čo to znamená pre podnikových používateľov

Ak v roku 2026 zabudovávate AI do svojho firemného pracovného postupu, tu sú praktické závery:

Pre kódovanie a vývoj: GPT-5.3 Codex a Claude Sonnet 4.6 vedú peloton. Codex pre dlhotrvajúce agentic úlohy, Sonnet pre všestranné kódovanie a ovládanie počítača.

Pre náklady citlivé pracovné záťaže: DeepSeek V3.2 za $0,27/M tokenov je neprekonateľný pre veľkoobjemové úlohy. Open-weight modely (GLM-5, Kimi K2.5) sú zadarmo pre vlastné hosťovanie, ak máte GPU infraštruktúru.

Pre podnikové uvažovanie: 2× zlepšenie uvažovania Gemini 3.1 Pro z neho robí predvolenú voľbu pre Google Cloud zákazníkov. Claude Opus 4.6 zostáva stropom pre komplexné analýzy.

Pre rýchle iterácie: Model týždenného zlepšovania Groku 4.2 je unikátny — ak potrebujete model, ktorý sa postupom času stáva lepším pre vaše konkrétne prípady použitia, stojí za sledovanie.

Pre nezávislosť: Open-weight modely (GLM-5, Kimi K2.5, DeepSeek V4) vám dávajú plnú kontrolu nad nasadením, prispôsobením a ochranou dát.

Posledná aktualizácia

20. februára 2026 — Tento článok je aktualizovaný pri vydávaní nových frontier modelov. Sledujte nás pre najnovšie správy.

Predchádzajúce aktualizácie: Prvá publikácia (20. 2. 2026)

Frontier AI modely: Všetky dôležité vydania tohto mesiaca (február 2026)

Najintenzívnejší mesiac v histórii AI

OpenAI: GPT-5.3 Codex

Čo je nové

Varovný signál v oblasti kybernetickej bezpečnosti

Dostupnosť

Cenník

Anthropic: Claude Sonnet 4.6

Čo je nové

Prehľad benchmarkov

Preferencie používateľov

Claude Opus 4.6

Google: Gemini 3.1 Pro

Čo je nové

Dostupnosť

Prečo na tom záleží

DeepSeek: V4 a 10× rozšírenie kontextu

V3.2: Desaťnásobné rozšírenie kontextu

V4: Ďalšia frontier

Cenový príbeh

Zhipu AI: GLM-5

Čo je nové

Výsledky benchmarkov

Geopolitický signál

Natívny Agent Mode

Moonshot AI: Kimi K2.5 a Kimi Claw

Kimi K2.5

Kimi Claw

xAI: Grok 4.2 Release Candidate

Čo je nové

Cenník

Aktuálny stav

Mistral AI: Large 3 a kódovací stack

Mistral Large 3

Devstral Small 2

Ministral 3

MiniMax: M2.5

Čo je nové

Príbeh efektivity

Open weights

Cenová krajina

Kľúčové trendy

1. Nástup open-source

2. Čínsky nezávislý AI stack

3. Agentika vo všetkom

4. Revolúcia strednej triedy

5. Konvergencia kontextových okien

Čo to znamená pre podnikových používateľov

Posledná aktualizácia

Turn the best models into shipped work