Frontier AI modely: Všetky dôležité vydania tohto mesiaca (február 2026)
Jozo · 14 min read · 2026/02/20
AI ModelyGPT-5ClaudeGeminiDeepSeekGrokGLM-5KimiMistralMiniMax2026Frontier AI

Frontier AI modely: Všetky dôležité vydania tohto mesiaca (február 2026)

Najintenzívnejší mesiac v histórii AI

Február 2026 bude pamätaný ako mesiac, keď závod o frontier AI nabral plné obrátky. Desať hlavných poskytovateľov aktívne vydáva frontier modely — každý z nich posúva hranice toho, čo je s jazykovými modelmi možné.

Časová os:

DátumPoskytovateľModelHighlight
2. 12.Mistral AIMistral Large 3675B MoE, #2 open-source na LMArena
27. 1.Moonshot AIKimi K2.51T open-source MoE s Agent Swarm
5. 2.OpenAIGPT-5.3 CodexPrvý „self-improving” agentic coding model
11. 2.Zhipu AIGLM-5745B open-source model trénovaný na čínskych čipoch
12. 2.DeepSeekAktualizácia V3.2Kontextové okno rozšírené 10× na 1M+ tokenov
15. 2.Moonshot AIKimi ClawBrowserová agentná platforma na báze K2.5
17. 2.AnthropicClaude Sonnet 4.6Výkon blízky Opusu za 1/5 ceny
17. 2.xAIGrok 4.2 RCModel s „rýchlym učením”, ktorý sa zlepšuje každý týždeň
17. 2.DeepSeekV4 (očakávané)Model s 1T parametrami cielený na dominanciu v kódovaní
19. 2.GoogleGemini 3.1 Pro2× skok v uvažovaní, skóre ARC-AGI-2 77,1 %
2026MiniMaxM2.5#1 Multi-SWE-Bench, 10B aktívnych parametrov, $0,30/M

Nejde len o postupné zlepšovanie. Ide o zásadnú zmenu v tom, čo AI modely dokážu, koľko stoja a kto ich vyvíja.

Pozrime sa na každé vydanie.


OpenAI: GPT-5.3 Codex

Vydané: 5. februára 2026

GPT-5.3 Codex od OpenAI predstavuje paradigmatickú zmenu: od „modelu, ktorý píše kód” k „modelu, ktorý zvládne takmer všetko, čo vývojár na počítači”.

Čo je nové

GPT-5.3 Codex kombinuje špičkový výkon GPT-5.2-Codex v oblasti kódovania s uvažovacími schopnosťami a odbornou znalosťou GPT-5.2. Výsledkom je model schopný zvládať dlhotrvajúce úlohy zahŕňajúce výskum, používanie nástrojov a zložité viacúrovňové vykonávanie.

Kľúčové vylepšenia:

  • O 25 % rýchlejší ako GPT-5.2-Codex
  • Menej tokenov spotrebovaných na úlohu — zvládne viac s menej
  • Špičkový výsledok na SWE-Bench Pro a Terminal-Bench
  • Silné výsledky na OSWorld a GDPval

Varovný signál v oblasti kybernetickej bezpečnosti

Ide o prvý model OpenAI, ktorý dosiahol hodnotenie „vysoké” v rámci ich frameworku kybernetickej bezpečnostnej pripravenosti — čo znamená, že OpenAI verí, že GPT-5.3 Codex je natoľko schopný v kódovaní a uvažovaní, že by mohol „zmysluplne napomôcť skutočnej kybernetickej ujme, najmä ak by bol automatizovaný alebo použitý vo veľkom rozsahu”. Ide o míľnik, ktorý zdôrazňuje, aké schopné tieto modely sú.

Dostupnosť

K dispozícii plateným používateľom ChatGPT cez aplikáciu Codex, CLI, rozšírenie IDE a web. Bola vydaná aj ľahšia varianta GPT-5.3-Codex-Spark. Prístup cez API príde čoskoro.

Cenník

ModelVstup (na 1M)Výstup (na 1M)Cached vstup
GPT-5$1,25$10,00$0,625
GPT-5.3 CodexTBA (API čaká)TBATBA
o3$2,00$8,00
o4-mini$1,10$4,40$0,55

Anthropic: Claude Sonnet 4.6

Vydané: 17. februára 2026

Claude Sonnet 4.6 je odpoveď Anthropicu na otázku, ktorú pred rokom nikto nepovažoval za možnú: môže model strednej triedy vyrovnať vlajkový model?

Čo je nové

Nejde o drobnú aktualizáciu verzie. Sonnet 4.6 je plný upgrade v oblastiach kódovania, ovládania počítača, uvažovania s dlhým kontextom, plánovania agentov, znalostnej práce a dizajnu. Dodáva sa s kontextovým oknom 1M tokenov (v beta verzii).

Prehľad benchmarkov

BenchmarkSonnet 4.6Opus 4.6Rozdiel
SWE-bench Verified79,6 %
OSWorld (ovládanie počítača)72,5 %72,7 %0,2 %
Office Productivity1633 Elo1559 EloSonnet vedie
Financial Analysis63,3 %62,0 %Sonnet vedie

Číslo pre ovládanie počítača je pozoruhodné: 72,5 % na OSWorld-Verified, v porovnaní s 14,9 % pri prvom spustení funkcie computer use len pred 16 mesiacmi.

Preferencie používateľov

Anthropic uvádza, že 70 % používateľov preferuje Sonnet 4.6 pred Sonnetom 4.5 a 59 % ho preferuje pred starším Opusom 4.5. Za $3/$15 na milión tokenov — pätina ceny Opusu 4.6 za $15/$75 — ide o najlepšiu hodnotu vo frontier AI pre podnikové pracovné záťaže.

Claude Opus 4.6

Vlajkový Opus 4.6 zostáva stropom schopností Anthropicu a poháňa tie najnáročnejšie agentic a uvažovacie úlohy. Avšak rozdiel oproti Sonnetu je teraz minimálny, čo robí z modelu strednej triedy pragmatickú voľbu pre väčšinu aplikácií.


Google: Gemini 3.1 Pro

Vydané: 19. februára 2026

Google predstavuje Gemini 3.1 Pro nie ako výklenkový upgrade, ale ako spoľahlivejší predvolený model pre zložité úlohy.

Čo je nové

Hlavné číslo: skóre ARC-AGI-2 77,1 % — viac ako dvojnásobný výkon v uvažovaní oproti Gemini 3 Pro. Je špeciálne navrhnutý pre úlohy vyžadujúce pokročilé viacúrovňové uvažovanie, ako je syntéza dát z rôznych zdrojov alebo vysvetľovanie zložitých vzájomne závislých tém.

Dostupnosť

Postupné zavádzanie v celom ekosystéme Google:

  • Aplikácia Gemini (vyššie limity pre používateľov Pro a Ultra)
  • NotebookLM (používatelia Pro a Ultra)
  • Gemini API cez AI Studio, Vertex AI, Gemini CLI a Android Studio
  • Ceny nezmenené oproti Gemini 3 Pro (~$1,25/$10 na milión tokenov štandardne)

Prečo na tom záleží

Google zachoval ceny a zároveň dramaticky zlepšil uvažovacie schopnosti. Pre podniky, ktoré sú už na Google Cloude, sa 3.1 Pro hodí ako priamy upgrade bez dopadu na rozpočet.


DeepSeek: V4 a 10× rozšírenie kontextu

Aktualizácia V3.2: 12. februára 2026 V4 očakávané: polovica februára 2026

DeepSeek naďalej zostáva najviac destabilizujúcou silou v oblasti cien AI a pritom prináša skutočné frontier schopnosti.

V3.2: Desaťnásobné rozšírenie kontextu

Začiatkom februára DeepSeek rozšíril kontextové okno V3.2 zo 128 000 tokenov na viac ako 1 milión — desaťnásobné zvýšenie. Za $0,27/$1,10 na milión tokenov je teraz tento model najlacnejším spôsobom spracovania masívnych dokumentov s frontier-class modelom.

V4: Ďalšia frontier

DeepSeek V4 sa očakáva s týmito vlastnosťami:

  • 1 bilión parametrov (architektúra MoE)
  • 1M+ tokenový kontext natívne
  • Tri architektonické prelomy: Engram conditional memory, Manifold-Constrained Hyper-Connections a DeepSeek Sparse Attention
  • Cieľ: 80 %+ na SWE-bench — to by ho postavilo na samotný vrchol kódovacích benchmarkov
  • Očakávané ako open-weight pod permisívnou licenciou

Cenový príbeh

Cenový rozdiel medzi DeepSeeком a západnými poskytovateľmi zostáva ohromujúci:

Príklad nákladov na úlohuGPT-5Claude Opus 4.6DeepSeek V3.2
100K vstup + 10K výstup$0,225$2,25$0,038
Pomer k DeepSeeku59×

Zložitá úloha za $15 s GPT-5 stojí približne $0,50 s DeepSeeком. Nejde len o cenovú výhodu — mení to, čo je ekonomicky zmysluplné automatizovať.


Zhipu AI: GLM-5

Vydané: 11. februára 2026

Najväčšie vydanie open-source modelu tohto mesiaca a pravdepodobne najvýznamnejšie z geopolitického hľadiska.

Čo je nové

GLM-5 je model MoE s 745 miliardami parametrov (44B aktívnych parametrov) s piatimi kľúčovými schopnosťami: kreatívne písanie, generovanie kódu, viacúrovňové uvažovanie, agentic inteligencia a spracovanie dlhého kontextu.

Výsledky benchmarkov

BenchmarkGLM-5Porovnanie
SWE-bench Verified77,8 %Zodpovedá Claude Opus 4.5
AIME 202692,7 %
GPQA-Diamond86,0 %
Humanity’s Last Exam50,4 %Prekonáva Claude Opus 4.5
Miera halucinácie34 %Pokles z 90 % (GLM-4.7)

Zníženie halucinácie — z 90 % na 34 % pomocou novej techniky RL nazvanej Slime — je obzvlášť pôsobivé a GLM-5 v tomto ohľade vedie index Artificial Analysis Omniscience.

Geopolitický signál

GLM-5 bol trénovaný výhradne na čipoch Huawei Ascend pomocou frameworku MindSpore — bez akéhokoľvek hardvéru vyrobeného v USA. To dokazuje, že čínsky domáci výpočtový stack dokáže produkovať modely frontier kvality napriek exportným kontrolám.

Natívny Agent Mode

GLM-5 prichádza s natívnym „Agent Mode”, ktorý dokáže premeniť výzvy na profesionálne kancelárske dokumenty (.docx, .pdf, .xlsx) — priama konkurencia pre computer use od Anthropic a Codex od OpenAI pri praktických obchodných úlohách.

Po spustení akcie Zhipu vzrástli o 34 % na hongkonskej burze.


Moonshot AI: Kimi K2.5 a Kimi Claw

K2.5 vydané: 27. januára 2026 Kimi Claw: 15. februára 2026

Moonshot AI buduje najkomplexnejší open-source agentic ekosystém v čínskom AI priestore.

Kimi K2.5

Model MoE s 1 biliónom parametrov (32B aktívnych parametrov), ktorý rozumie textu, obrázkom a videu. Kľúčová inovácia: schopnosť Agent Swarm, poháňaná novou technikou RL nazvanou Parallel Agent Reinforcement Learning (PARL), ktorá trénuje model na dekompozíciu a paralelizáciu zložitých úloh.

Model je plne open-source a dostupný na Hugging Face.

Kimi Claw

Spustený 15. februára, Kimi Claw je cloudová browserová AI agentná platforma postavená na frameworku OpenClaw. Predstavte si ho ako odpoveď Moonshootu na computer use od Anthropic — ale bežiaci celý v cloude.


xAI: Grok 4.2 Release Candidate

Verejná beta: 17. februára 2026

Grok 4.2 od Elona Muska prináša zásadne odlišný prístup k zlepšovaniu modelov: rýchle učenie.

Čo je nové

Na rozdiel od každého iného modelu na tomto zozname je Grok 4.2 navrhnutý tak, aby sa zlepšoval každý týždeň na základe verejného používania. Musk ho opísal ako model „schopný rýchlo sa učiť” s týždennými cyklami zlepšovania a poznámkami k vydaniu.

Nové schopnosti:

  • 4-agentná paralelná spolupráca — špecializovaní AI agenti, ktorí syntetizujú výstupy do jedinej odpovede
  • Analýza lekárskych dokumentov cez nahranie fotografie
  • Vylepšené inžinierske uvažovanie

Cenník

xAI si udržiava svoju agresívnu cenovú stratégiu:

ModelVstup (na 1M)Výstup (na 1M)
Grok 4.1$0,20$0,50
Grok 4.2 RCTBA (beta)TBA

Aktuálny stav

Grok 4.2 je v súčasnosti vo verejnej bete — k dispozícii na výber v rozhraní Grok. Verejné vydanie sa očakáva v marci 2026. Oficiálne benchmarky budú zverejnené po skončení beta verzie.


Mistral AI: Large 3 a kódovací stack

Mistral Large 3: 2. decembra 2025 Devstral 2: december 2025

Mistral naďalej prekonáva svoju kategóriu ako popredné európske AI laboratórium a vydáva modely, ktoré konkurujú na vrchole open-source rebríčkov.

Mistral Large 3

Model MoE s 675 miliardami parametrov s 41B aktívnymi parametrami. Debutoval na #2 mieste v open-source non-reasoning modeloch na rebríčku LMArena — hneď za oveľa väčšími modelmi z čínskych laboratórií.

Kľúčové modely v aktuálnej ponuke Mistralu:

ModelZameranieCena (na 1M)
Mistral Large 3Všeobecná frontier~$2,00 / $6,00
Mistral Medium 3.1Multimodálny (40k ctx)$2,00 / $5,00
Magistral Medium 1.2Uvažovanie$2,00 / $5,00
CodestralDokončovanie kóduPremier tier
Devstral 2Agentic kódovanieOpen-weight

Devstral Small 2

Hviezda decembrového vydania: kódovací model s 24B parametrami, ktorý prekonáva Qwen 3 Coder Flash napriek tomu, že je výrazne menší. Pre tímy, ktoré potrebujú vlastný kódovací AI bez masívnych GPU požiadaviek, je Devstral Small 2 presvedčivou voľbou.

Ministral 3

Rodina malých modelov Mistralu (3B, 7B, 14B parametrov) dosahuje najlepší pomer cena/výkon medzi open-source modelmi — zodpovedá alebo prekonáva porovnateľné modely a pritom produkuje o rád menej tokenov.


MiniMax: M2.5

M2.5 vydané: 2026

Temný kôň závodu o frontier. M2.5 od MiniMaxu prináša benchmark-topping výkon v kódovaní s len 10 miliardami aktívnych parametrov — zlomok toho, čo konkurenti používajú.

Čo je nové

MiniMax M2.5 je účelovo postavený pre kódovanie a agentic vykonávanie so zameraním na dosiahnutie viac s menej:

  • #1 na Multi-SWE-Bench so skóre 51,3
  • Prekonáva Claude Opus 4.6 na SWE-Bench Pro
  • Vedúce skóre na benchmarkoch FinSearch, BrowseComp a RISE
  • Priepustnosť 100 tokenov za sekundu — opisovaná ako „3× rýchlejší ako Opus”
  • Uvažovanie Chain of Thought až 128K tokenov

Príbeh efektivity

Výnimočná štatistika: MiniMax M2.5 zvládne 327,8 úloh na $100 rozpočtu — viac ako 10× viac ako Opus. Za $0,30 na milión vstupných tokenov ($0,06 s cache) sa pohybuje v cenovom teritóriu DeepSeeku a pritom zodpovedá alebo prekonáva prémiové modely v kódovacích úlohách.

ModelVstup (na 1M)S cacheRýchlosť
M2.5$0,30$0,06100 TPS
M2.5-highspeed$0,30$0,06Rýchlejšia varianta

Open weights

MiniMax uvoľnil váhy M2.5 na HuggingFace s podporou vLLM, SGLang a Transformers pre vlastné hosťovanie. To z neho robí jednu z najefektívnejších možností pre tímy prevádzkujúce vlastnú inferenčnú infraštruktúru.


Cenová krajina

Tu je prehľad nákladov všetkých frontier modelov (na milión tokenov):

PoskytovateľModelVstupVýstupKontext
xAIGrok 4.1$0,20$0,50
DeepSeekV3.2$0,27$1,101M+
MiniMaxM2.5$0,30128K
OpenAIo4-mini$1,10$4,40
GoogleGemini 3.1 Pro~$1,25~$10,001M
OpenAIGPT-5$1,25$10,00400K
Mistral AIMedium 3.1$2,00$5,0040K
Mistral AILarge 3~$2,00~$6,00128K
OpenAIo3$2,00$8,00
AnthropicSonnet 4.6$3,00$15,001M (beta)
AnthropicOpus 4.6$15,00$75,00200K
Zhipu AIGLM-5Open weightsZadarmo na vlastné hosťovanie
Moonshot AIKimi K2.5Open weightsZadarmo na vlastné hosťovanie
DeepSeekV4 (očakávané)Open weightsZadarmo na vlastné hosťovanie1M+

17-násobný cenový rozdiel medzi najlacnejším API (DeepSeek za $0,27/M) a prémiovými modelmi (Opus 4.6 za $15/M vstup) predstavuje skutočné architektonické rozhodnutie pre firmy. Otázka už nie je „môžeme si AI dovoliť?”, ale „ktorá úroveň AI zodpovedá nášmu prípadu použitia?”


Kľúčové trendy

1. Nástup open-source

Päť nedávnych vydaní — GLM-5, Kimi K2.5, DeepSeek V4, Mistral Large 3 a MiniMax M2.5 — sú open-weight modely. Nielen že dobiehajú uzavreté modely; GLM-5 zodpovedá Claude Opus 4.5 na SWE-bench a prekonáva ho na Humanity’s Last Exam. Mistral Large 3 je na #2 v open-source LMArena. Kvalitatívny rozdiel medzi open a closed modelmi prakticky zmizol.

2. Čínsky nezávislý AI stack

GLM-5 (Huawei Ascend) aj DeepSeek V4 dokazujú, že čínske laboratóriá dokážu produkovať frontier modely bez amerického hardvéru. Exportné kontroly čínsky AI pokrok spomalili, ale nezastavili — a možno urýchlili investície do domácich alternatív.

3. Agentika vo všetkom

Každé vydanie tohto mesiaca zahŕňa agentic schopnosti: GPT-5.3 Codex zvládá dlhotrvajúce viacúrovňové úlohy, Claude 4.6 má computer use na 72,5 %, Grok 4.2 prevádzkuje 4-agentná paralelná spolupráca, GLM-5 má natívny Agent Mode a Kimi má Agent Swarm. Rok 2026 je rokom, keď modely prestali byť chatbotmi a začali byť pracovníkmi.

4. Revolúcia strednej triedy

Preukázanie, že model za $3/M dokáže vyrovnať vlajkový model za $15/M, je prelomový okamih. V kombinácii s cenou $0,27/M od DeepSeeku dosahujúcou ~90 % kvality GPT-5 je hodnotová ponuka prémiového API pod vážnym tlakom.

5. Konvergencia kontextových okien

Viacero modelov teraz ponúka kontextové okná 1M+ tokenov: Gemini 3.1 Pro, Claude 4.6 (beta), DeepSeek V4 a Kimi K2.5. Spracovanie celých kódových základní, právnych dokumentov alebo výskumných korpusov v jedinom prechode už nie je diferenciátorom — je to nevyhnutný základ.


Čo to znamená pre podnikových používateľov

Ak v roku 2026 zabudovávate AI do svojho firemného pracovného postupu, tu sú praktické závery:

Pre kódovanie a vývoj: GPT-5.3 Codex a Claude Sonnet 4.6 vedú peloton. Codex pre dlhotrvajúce agentic úlohy, Sonnet pre všestranné kódovanie a ovládanie počítača.

Pre náklady citlivé pracovné záťaže: DeepSeek V3.2 za $0,27/M tokenov je neprekonateľný pre veľkoobjemové úlohy. Open-weight modely (GLM-5, Kimi K2.5) sú zadarmo pre vlastné hosťovanie, ak máte GPU infraštruktúru.

Pre podnikové uvažovanie: 2× zlepšenie uvažovania Gemini 3.1 Pro z neho robí predvolenú voľbu pre Google Cloud zákazníkov. Claude Opus 4.6 zostáva stropom pre komplexné analýzy.

Pre rýchle iterácie: Model týždenného zlepšovania Groku 4.2 je unikátny — ak potrebujete model, ktorý sa postupom času stáva lepším pre vaše konkrétne prípady použitia, stojí za sledovanie.

Pre nezávislosť: Open-weight modely (GLM-5, Kimi K2.5, DeepSeek V4) vám dávajú plnú kontrolu nad nasadením, prispôsobením a ochranou dát.


Posledná aktualizácia

20. februára 2026 — Tento článok je aktualizovaný pri vydávaní nových frontier modelov. Sledujte nás pre najnovšie správy.

Predchádzajúce aktualizácie: Prvá publikácia (20. 2. 2026)