Frontier AI modely: Všechny velké novinky tohoto měsíce (únor 2026)
Jozo · 14 min read · 2026/02/20
AI ModelyGPT-5ClaudeGeminiDeepSeekGrokGLM-5KimiMistralMiniMax2026Frontier AI

Frontier AI modely: Všechny velké novinky tohoto měsíce (únor 2026)

Nejintenzivnější měsíc v historii AI

Únor 2026 bude zapamatován jako měsíc, kdy závod o frontier AI nabral plné obrátky. Deset hlavních poskytovatelů aktivně vydává frontier modely — každý z nich posouvá hranice toho, co je s jazykovými modely možné.

Časová osa:

DatumPoskytovatelModelHighlight
2. 12.Mistral AIMistral Large 3675B MoE, #2 open-source na LMArena
27. 1.Moonshot AIKimi K2.51T open-source MoE s Agent Swarm
5. 2.OpenAIGPT-5.3 CodexPrvní „self-improving” agentic coding model
11. 2.Zhipu AIGLM-5745B open-source model trénovaný na čínských čipech
12. 2.DeepSeekAktualizace V3.2Kontextové okno rozšířeno 10× na 1M+ tokenů
15. 2.Moonshot AIKimi ClawBrowserová agentní platforma na bázi K2.5
17. 2.AnthropicClaude Sonnet 4.6Výkon blízký Opusu za 1/5 ceny
17. 2.xAIGrok 4.2 RCModel s „rychlým učením”, který se zlepšuje každý týden
17. 2.DeepSeekV4 (očekáváno)Model s 1T parametry cílící na dominanci v kódování
19. 2.GoogleGemini 3.1 Pro2× skok v uvažování, skóre ARC-AGI-2 77,1 %
2026MiniMaxM2.5#1 Multi-SWE-Bench, 10B aktivních parametrů, $0,30/M

Nejde jen o postupné zlepšování. Jde o zásadní změnu v tom, co AI modely umí, kolik stojí a kdo je vyvíjí.

Pojďme se podívat na každé vydání.


OpenAI: GPT-5.3 Codex

Vydáno: 5. února 2026

GPT-5.3 Codex od OpenAI představuje paradigmatický posun od „modelu, který píše kód” k „modelu, který zvládne téměř vše, co vývojář na počítači”.

Co je nového

GPT-5.3 Codex kombinuje špičkový výkon GPT-5.2-Codex v oblasti kódování s uvažovacími schopnostmi a odbornou znalostí GPT-5.2. Výsledkem je model schopný zvládat dlouhotrvající úlohy zahrnující výzkum, používání nástrojů a složité víceúrovňové provádění.

Klíčová vylepšení:

  • O 25 % rychlejší než GPT-5.2-Codex
  • Méně tokenů spotřebovaných na úlohu — zvládne více s méně
  • Špičkový výsledek na SWE-Bench Pro a Terminal-Bench
  • Silné výsledky na OSWorld a GDPval

Bezpečnostní varovný signál v oblasti kybernetické bezpečnosti

Jde o první model OpenAI, který dosáhl hodnocení „vysoké” v rámci jejich frameworku pro kybernetické bezpečnostní připravenosti — to znamená, že OpenAI věří, že GPT-5.3 Codex je natolik schopný v kódování a uvažování, že by mohl „smysluplně napomoci skutečné kybernetické újmě, zejména pokud by byl automatizován nebo použit ve velkém měřítku”. Jde o milník, který zdůrazňuje, jak schopné tyto modely jsou.

Dostupnost

K dispozici placeným uživatelům ChatGPT prostřednictvím aplikace Codex, CLI, rozšíření IDE a webu. Byla vydána také lehčí varianta GPT-5.3-Codex-Spark. Přístup přes API přijde brzy.

Ceník

ModelVstup (na 1M)Výstup (na 1M)Cached vstup
GPT-5$1,25$10,00$0,625
GPT-5.3 CodexTBA (API čeká)TBATBA
o3$2,00$8,00
o4-mini$1,10$4,40$0,55

Anthropic: Claude Sonnet 4.6

Vydáno: 17. února 2026

Claude Sonnet 4.6 je odpověď Anthropicu na otázku, kterou před rokem nikdo nepovažoval za možnou: může model střední třídy vyrovnat vlajkový model?

Co je nového

Nejde o drobnou aktualizaci verze. Sonnet 4.6 je plný upgrade v oblastech kódování, ovládání počítače, uvažování s dlouhým kontextem, plánování agentů, znalostní práce a designu. Dodává se s kontextovým oknem 1M tokenů (v beta verzi).

Přehled benchmarků

BenchmarkSonnet 4.6Opus 4.6Rozdíl
SWE-bench Verified79,6 %
OSWorld (ovládání počítače)72,5 %72,7 %0,2 %
Office Productivity1633 Elo1559 EloSonnet vede
Financial Analysis63,3 %62,0 %Sonnet vede

Číslo pro ovládání počítače je pozoruhodné: 72,5 % na OSWorld-Verified, ve srovnání s 14,9 % při prvním spuštění funkce computer use pouhých 16 měsíců dříve.

Preference uživatelů

Anthropic uvádí, že 70 % uživatelů preferuje Sonnet 4.6 před Sonnetem 4.5 a 59 % ho preferuje před starším Opusem 4.5. Za $3/$15 na milion tokenů — pětina ceny Opusu 4.6 za $15/$75 — jde o nejlepší hodnotu ve frontier AI pro podnikové pracovní zátěže.

Claude Opus 4.6

Vlajkový Opus 4.6 zůstává stropem schopností Anthropicu a pohání ty nejnáročnější agentic a uvažovací úlohy. Nicméně rozdíl oproti Sonnetu je nyní minimální, což dělá z modelu střední třídy pragmatickou volbu pro většinu aplikací.


Google: Gemini 3.1 Pro

Vydáno: 19. února 2026

Google představuje Gemini 3.1 Pro ne jako výklenkový upgrade, ale jako spolehlivější výchozí model pro složité úlohy.

Co je nového

Hlavní číslo: skóre ARC-AGI-2 77,1 % — více než dvojnásobný výkon v uvažování oproti Gemini 3 Pro. Je speciálně navržen pro úlohy vyžadující pokročilé víceúrovňové uvažování, jako je syntéza dat z různých zdrojů nebo vysvětlování složitých vzájemně závislých témat.

Dostupnost

Postupné zavádění v celém ekosystému Google:

  • Aplikace Gemini (vyšší limity pro uživatele Pro a Ultra)
  • NotebookLM (uživatelé Pro a Ultra)
  • Gemini API prostřednictvím AI Studio, Vertex AI, Gemini CLI a Android Studio
  • Ceny nezměněny oproti Gemini 3 Pro (~$1,25/$10 na milion tokenů standardně)

Proč na tom záleží

Google zachoval ceny a zároveň dramaticky zlepšil uvažovací schopnosti. Pro podniky, které jsou již na Google Cloudu, se 3.1 Pro hodí jako přímý upgrade bez dopadu na rozpočet.


DeepSeek: V4 a 10× rozšíření kontextu

Aktualizace V3.2: 12. února 2026 V4 očekáváno: polovina února 2026

DeepSeek nadále zůstává nejvíce destabilizující silou v oblasti cen AI a přitom přináší skutečné frontier schopnosti.

V3.2: Desetinásobné rozšíření kontextu

Začátkem února DeepSeek rozšířil kontextové okno V3.2 ze 128 000 tokenů na více než 1 milion — desetinásobné zvýšení. Za $0,27/$1,10 na milion tokenů je nyní tento model nejlevnějším způsobem zpracování masivních dokumentů s frontier-class modelem.

V4: Další frontier

DeepSeek V4 se očekává s těmito vlastnostmi:

  • 1 bilion parametrů (architektura MoE)
  • 1M+ tokenový kontext nativně
  • Tři architektonické průlomy: Engram conditional memory, Manifold-Constrained Hyper-Connections a DeepSeek Sparse Attention
  • Cíl: 80 %+ na SWE-bench — to by ho postavilo na samotný vrchol kódovacích benchmarků
  • Očekáváno jako open-weight pod permisivní licencí

Cenový příběh

Cenový rozdíl mezi DeepSeekem a západními poskytovateli zůstává ohromující:

Příklad nákladů na úlohuGPT-5Claude Opus 4.6DeepSeek V3.2
100K vstup + 10K výstup$0,225$2,25$0,038
Poměr k DeepSeeku59×

Složitá úloha za $15 s GPT-5 stojí přibližně $0,50 s DeepSeekem. Nejde jen o cenovou výhodu — mění to, co je ekonomicky smysluplné automatizovat.


Zhipu AI: GLM-5

Vydáno: 11. února 2026

Největší vydání open-source modelu tohoto měsíce a pravděpodobně nejvýznamnější z geopolitického hlediska.

Co je nového

GLM-5 je model MoE s 745 miliardami parametrů (44B aktivních parametrů) s pěti klíčovými schopnostmi: kreativní psaní, generování kódu, víceúrovňové uvažování, agentic inteligence a zpracování dlouhého kontextu.

Výsledky benchmarků

BenchmarkGLM-5Srovnání
SWE-bench Verified77,8 %Odpovídá Claude Opus 4.5
AIME 202692,7 %
GPQA-Diamond86,0 %
Humanity’s Last Exam50,4 %Překonává Claude Opus 4.5
Míra halucinací34 %Pokles z 90 % (GLM-4.7)

Snížení halucinací — z 90 % na 34 % pomocí nové techniky RL nazvané Slime — je obzvláště působivé a GLM-5 v tomto ohledu vévodí indexu Artificial Analysis Omniscience.

Geopolitický signál

GLM-5 byl trénován výhradně na čipech Huawei Ascend pomocí frameworku MindSpore — bez jakéhokoliv hardwaru vyrobeného v USA. To dokazuje, že čínský domácí výpočetní stack dokáže produkovat modely frontier kvality i přes exportní kontroly.

Nativní Agent Mode

GLM-5 přichází s nativním „Agent Mode”, který dokáže přeměnit výzvy na profesionální kancelářské dokumenty (.docx, .pdf, .xlsx) — přímá konkurence pro computer use od Anthropic a Codex od OpenAI při praktických obchodních úlohách.

Po spuštění akcie Zhipu vzrostly o 34 % na hongkongské burze.


Moonshot AI: Kimi K2.5 a Kimi Claw

K2.5 vydáno: 27. ledna 2026 Kimi Claw: 15. února 2026

Moonshot AI buduje nejkomplexnější open-source agentic ekosystém v čínském AI prostoru.

Kimi K2.5

Model MoE s 1 bilionem parametrů (32B aktivních parametrů), který rozumí textu, obrázkům a videu. Klíčová inovace: schopnost Agent Swarm, poháněná novou technikou RL nazvanou Parallel Agent Reinforcement Learning (PARL), která trénuje model k dekompozici a paralelizaci složitých úloh.

Model je plně open-source a dostupný na Hugging Face.

Kimi Claw

Spuštěný 15. února, Kimi Claw je cloudová browserová AI agentní platforma postavená na frameworku OpenClaw. Představte si ho jako odpověď Moonshootu na computer use od Anthropic — ale běžící celý v cloudu.


xAI: Grok 4.2 Release Candidate

Veřejná beta: 17. února 2026

Grok 4.2 od Elona Muska přináší zásadně odlišný přístup ke zlepšování modelu: rychlé učení.

Co je nového

Na rozdíl od každého jiného modelu na tomto seznamu je Grok 4.2 navržen tak, aby se zlepšoval každý týden na základě veřejného používání. Musk ho popsal jako model „schopný rychle se učit” s týdenními cykly zlepšování a poznámkami k vydání.

Nové schopnosti:

  • 4-agentní paralelní spolupráce — specializovaní AI agenti, kteří syntetizují výstupy do jediné odpovědi
  • Analýza lékařských dokumentů prostřednictvím nahrání fotografie
  • Zlepšené inženýrské uvažování

Ceník

xAI si udržuje svou agresivní cenovou strategii:

ModelVstup (na 1M)Výstup (na 1M)
Grok 4.1$0,20$0,50
Grok 4.2 RCTBA (beta)TBA

Aktuální stav

Grok 4.2 je v současné době ve veřejné betě — k dispozici pro výběr v rozhraní Grok. Veřejné vydání se očekává v březnu 2026. Oficiální benchmarky budou zveřejněny po skončení beta verze.


Mistral AI: Large 3 a kódovací stack

Mistral Large 3: 2. prosince 2025 Devstral 2: prosinec 2025

Mistral nadále překonává svou kategorii jako přední evropská AI laboratoř a vydává modely, které konkurují na vrcholu open-source žebříčků.

Mistral Large 3

Model MoE s 675 miliardami parametrů s 41B aktivními parametry. Debutoval na #2 místě v open-source non-reasoning modelech na žebříčku LMArena — hned za mnohem většími modely z čínských laboratoří.

Klíčové modely v aktuální nabídce Mistralu:

ModelZaměřeníCena (na 1M)
Mistral Large 3Obecný frontier~$2,00 / $6,00
Mistral Medium 3.1Multimodální (40k ctx)$2,00 / $5,00
Magistral Medium 1.2Uvažování$2,00 / $5,00
CodestralDokončování kóduPremier tier
Devstral 2Agentic kódováníOpen-weight

Devstral Small 2

Hvězda prosincového vydání: kódovací model s 24B parametry, který překonává Qwen 3 Coder Flash přestože je výrazně menší. Pro týmy, které potřebují vlastní kódovací AI bez masivních GPU požadavků, je Devstral Small 2 přesvědčivou volbou.

Ministral 3

Rodina malých modelů Mistralu (3B, 7B, 14B parametrů) dosahuje nejlepšího poměru cena/výkon mezi open-source modely — odpovídá nebo překonává srovnatelné modely a přitom produkuje o řád méně tokenů.


MiniMax: M2.5

M2.5 vydáno: 2026

Temný kůň závodu o frontier. M2.5 od MiniMaxu přináší benchmark-topping výkon v kódování s pouhými 10 miliardami aktivních parametrů — zlomek toho, co konkurenti používají.

Co je nového

MiniMax M2.5 je účelově postaven pro kódování a agentic provádění se zaměřením na dosažení více s méně:

  • #1 na Multi-SWE-Bench se skóre 51,3
  • Překonává Claude Opus 4.6 na SWE-Bench Pro
  • Vedoucí skóre na benchmarkách FinSearch, BrowseComp a RISE
  • Propustnost 100 tokenů za sekundu — popisována jako „3× rychlejší než Opus”
  • Uvažování Chain of Thought až 128K tokenů

Příběh efektivity

Výjimečná statistika: MiniMax M2.5 zvládne 327,8 úloh na $100 rozpočtu — více než 10× více než Opus. Za $0,30 na milion vstupních tokenů ($0,06 s cache) se pohybuje v cenovém teritoriu DeepSeeku a přitom odpovídá nebo překonává prémiové modely v kódovacích úlohách.

ModelVstup (na 1M)S cacheRychlost
M2.5$0,30$0,06100 TPS
M2.5-highspeed$0,30$0,06Rychlejší varianta

Open weights

MiniMax uvolnil váhy M2.5 na HuggingFace s podporou vLLM, SGLang a Transformers pro vlastní hostování. To z něj dělá jednu z nejefektivnějších možností pro týmy provozující vlastní inferenční infrastrukturu.


Cenová krajina

Zde je přehled nákladů všech frontier modelů (na milion tokenů):

PoskytovatelModelVstupVýstupKontext
xAIGrok 4.1$0,20$0,50
DeepSeekV3.2$0,27$1,101M+
MiniMaxM2.5$0,30128K
OpenAIo4-mini$1,10$4,40
GoogleGemini 3.1 Pro~$1,25~$10,001M
OpenAIGPT-5$1,25$10,00400K
Mistral AIMedium 3.1$2,00$5,0040K
Mistral AILarge 3~$2,00~$6,00128K
OpenAIo3$2,00$8,00
AnthropicSonnet 4.6$3,00$15,001M (beta)
AnthropicOpus 4.6$15,00$75,00200K
Zhipu AIGLM-5Open weightsZdarma k vlastnímu hostování
Moonshot AIKimi K2.5Open weightsZdarma k vlastnímu hostování
DeepSeekV4 (očekáváno)Open weightsZdarma k vlastnímu hostování1M+

17násobný cenový rozdíl mezi nejlevnějším API (DeepSeek za $0,27/M) a prémiovými modely (Opus 4.6 za $15/M vstup) představuje skutečné architektonické rozhodnutí pro firmy. Otázka již není „můžeme si AI dovolit?”, ale „která úroveň AI odpovídá našemu případu užití?”


Klíčové trendy

1. Nástup open-source

Pět nedávných vydání — GLM-5, Kimi K2.5, DeepSeek V4, Mistral Large 3 a MiniMax M2.5 — jsou open-weight modely. Nejen že dohánějí uzavřené modely; GLM-5 odpovídá Claude Opus 4.5 na SWE-bench a překonává ho na Humanity’s Last Exam. Mistral Large 3 je na #2 v open-source LMArena. Kvalitativní rozdíl mezi open a closed modely prakticky zmizel.

2. Čínský nezávislý AI stack

GLM-5 (Huawei Ascend) i DeepSeek V4 dokazují, že čínské laboratoře dokážou produkovat frontier modely bez amerického hardwaru. Exportní kontroly čínský AI pokrok zpomalily, ale nezastavily — a možná urychlily investice do domácích alternativ.

3. Agentika ve všem

Každé vydání tohoto měsíce zahrnuje agentic schopnosti: GPT-5.3 Codex zvládá dlouhotrvající víceúrovňové úlohy, Claude 4.6 má computer use na 72,5 %, Grok 4.2 provozuje 4-agentní paralelní spolupráci, GLM-5 má nativní Agent Mode a Kimi má Agent Swarm. Rok 2026 je rokem, kdy modely přestaly být chatboty a začaly být pracovníky.

4. Revoluce střední třídy

Prokázání, že model za $3/M dokáže vyrovnat vlajkový model za $15/M, je zlomový okamžik. V kombinaci s cenu $0,27/M od DeepSeeku dosahující ~90 % kvality GPT-5 je hodnotová nabídka prémiového API pod vážným tlakem.

5. Konvergence kontextových oken

Více modelů nyní nabízí kontextová okna 1M+ tokenů: Gemini 3.1 Pro, Claude 4.6 (beta), DeepSeek V4 a Kimi K2.5. Zpracování celých kódových základen, právních dokumentů nebo výzkumných korpusů v jediném průchodu již není diferenciátorem — je to nutný základ.


Co to znamená pro firemní uživatele

Pokud v roce 2026 zabudováváte AI do svého firemního pracovního postupu, zde jsou praktické závěry:

Pro kódování a vývoj: GPT-5.3 Codex a Claude Sonnet 4.6 vedou pelotón. Codex pro dlouhotrvající agentic úlohy, Sonnet pro všestranné kódování a ovládání počítače.

Pro náklady citlivé pracovní zátěže: DeepSeek V3.2 za $0,27/M tokenů je nepřekonatelný pro velkoobjemové úlohy. Open-weight modely (GLM-5, Kimi K2.5) jsou zdarma pro vlastní hostování, pokud máte GPU infrastrukturu.

Pro podnikové uvažování: 2× zlepšení uvažování Gemini 3.1 Pro z něj dělá výchozí volbu pro Google Cloud zákazníky. Claude Opus 4.6 zůstává stropem pro komplexní analýzy.

Pro rychlé iterace: Model týdenního zlepšování Groku 4.2 je unikátní — pokud potřebujete model, který se postupem času stává lepším pro vaše konkrétní případy použití, stojí za sledování.

Pro nezávislost: Open-weight modely (GLM-5, Kimi K2.5, DeepSeek V4) vám dávají plnou kontrolu nad nasazením, přizpůsobením a ochranou dat.


Poslední aktualizace

20. února 2026 — Tento článek je aktualizován při vydávání nových frontier modelů. Sledujte nás pro nejnovější zpravodajství.

Předchozí aktualizace: První publikace (20. 2. 2026)