Frontier AI modely únor 2026: GPT-5.3, Cla

Nejintenzivnější měsíc v historii AI

Únor 2026 bude zapamatován jako měsíc, kdy závod o frontier AI nabral plné obrátky. Deset hlavních poskytovatelů aktivně vydává frontier modely — každý z nich posouvá hranice toho, co je s jazykovými modely možné.

Časová osa:

Datum	Poskytovatel	Model	Highlight
2. 12.	Mistral AI	Mistral Large 3	675B MoE, #2 open-source na LMArena
27. 1.	Moonshot AI	Kimi K2.5	1T open-source MoE s Agent Swarm
5. 2.	OpenAI	GPT-5.3 Codex	První „self-improving" agentic coding model
11. 2.	Zhipu AI	GLM-5	745B open-source model trénovaný na čínských čipech
12. 2.	DeepSeek	Aktualizace V3.2	Kontextové okno rozšířeno 10× na 1M+ tokenů
15. 2.	Moonshot AI	Kimi Claw	Browserová agentní platforma na bázi K2.5
17. 2.	Anthropic	Claude Sonnet 4.6	Výkon blízký Opusu za 1/5 ceny
17. 2.	xAI	Grok 4.2 RC	Model s „rychlým učením", který se zlepšuje každý týden
17. 2.	DeepSeek	V4 (očekáváno)	Model s 1T parametry cílící na dominanci v kódování
19. 2.	Google	Gemini 3.1 Pro	2× skok v uvažování, skóre ARC-AGI-2 77,1 %
2026	MiniMax	M2.5	#1 Multi-SWE-Bench, 10B aktivních parametrů, $0,30/M

Nejde jen o postupné zlepšování. Jde o zásadní změnu v tom, co AI modely umí, kolik stojí a kdo je vyvíjí.

Pojďme se podívat na každé vydání.

OpenAI: GPT-5.3 Codex

Vydáno: 5. února 2026

GPT-5.3 Codex od OpenAI představuje paradigmatický posun od „modelu, který píše kód" k „modelu, který zvládne téměř vše, co vývojář na počítači".

Co je nového

GPT-5.3 Codex kombinuje špičkový výkon GPT-5.2-Codex v oblasti kódování s uvažovacími schopnostmi a odbornou znalostí GPT-5.2. Výsledkem je model schopný zvládat dlouhotrvající úlohy zahrnující výzkum, používání nástrojů a složité víceúrovňové provádění.

Klíčová vylepšení:

O 25 % rychlejší než GPT-5.2-Codex
Méně tokenů spotřebovaných na úlohu — zvládne více s méně
Špičkový výsledek na SWE-Bench Pro a Terminal-Bench
Silné výsledky na OSWorld a GDPval

Bezpečnostní varovný signál v oblasti kybernetické bezpečnosti

Jde o první model OpenAI, který dosáhl hodnocení „vysoké" v rámci jejich frameworku pro kybernetické bezpečnostní připravenosti — to znamená, že OpenAI věří, že GPT-5.3 Codex je natolik schopný v kódování a uvažování, že by mohl „smysluplně napomoci skutečné kybernetické újmě, zejména pokud by byl automatizován nebo použit ve velkém měřítku". Jde o milník, který zdůrazňuje, jak schopné tyto modely jsou.

Dostupnost

K dispozici placeným uživatelům ChatGPT prostřednictvím aplikace Codex, CLI, rozšíření IDE a webu. Byla vydána také lehčí varianta GPT-5.3-Codex-Spark. Přístup přes API přijde brzy.

Ceník

Model	Vstup (na 1M)	Výstup (na 1M)	Cached vstup
GPT-5	$1,25	$10,00	$0,625
GPT-5.3 Codex	TBA (API čeká)	TBA	TBA
o3	$2,00	$8,00	—
o4-mini	$1,10	$4,40	$0,55

Anthropic: Claude Sonnet 4.6

Vydáno: 17. února 2026

Claude Sonnet 4.6 je odpověď Anthropicu na otázku, kterou před rokem nikdo nepovažoval za možnou: může model střední třídy vyrovnat vlajkový model?

Co je nového

Nejde o drobnou aktualizaci verze. Sonnet 4.6 je plný upgrade v oblastech kódování, ovládání počítače, uvažování s dlouhým kontextem, plánování agentů, znalostní práce a designu. Dodává se s kontextovým oknem 1M tokenů (v beta verzi).

Přehled benchmarků

Benchmark	Sonnet 4.6	Opus 4.6	Rozdíl
SWE-bench Verified	79,6 %	—	—
OSWorld (ovládání počítače)	72,5 %	72,7 %	0,2 %
Office Productivity	1633 Elo	1559 Elo	Sonnet vede
Financial Analysis	63,3 %	62,0 %	Sonnet vede

Číslo pro ovládání počítače je pozoruhodné: 72,5 % na OSWorld-Verified, ve srovnání s 14,9 % při prvním spuštění funkce computer use pouhých 16 měsíců dříve.

Preference uživatelů

Anthropic uvádí, že 70 % uživatelů preferuje Sonnet 4.6 před Sonnetem 4.5 a 59 % ho preferuje před starším Opusem 4.5. Za $3/$15 na milion tokenů — pětina ceny Opusu 4.6 za $15/$75 — jde o nejlepší hodnotu ve frontier AI pro podnikové pracovní zátěže.

Claude Opus 4.6

Vlajkový Opus 4.6 zůstává stropem schopností Anthropicu a pohání ty nejnáročnější agentic a uvažovací úlohy. Nicméně rozdíl oproti Sonnetu je nyní minimální, což dělá z modelu střední třídy pragmatickou volbu pro většinu aplikací.

Google: Gemini 3.1 Pro

Vydáno: 19. února 2026

Google představuje Gemini 3.1 Pro ne jako výklenkový upgrade, ale jako spolehlivější výchozí model pro složité úlohy.

Co je nového

Hlavní číslo: skóre ARC-AGI-2 77,1 % — více než dvojnásobný výkon v uvažování oproti Gemini 3 Pro. Je speciálně navržen pro úlohy vyžadující pokročilé víceúrovňové uvažování, jako je syntéza dat z různých zdrojů nebo vysvětlování složitých vzájemně závislých témat.

Dostupnost

Postupné zavádění v celém ekosystému Google:

Aplikace Gemini (vyšší limity pro uživatele Pro a Ultra)
NotebookLM (uživatelé Pro a Ultra)
Gemini API prostřednictvím AI Studio, Vertex AI, Gemini CLI a Android Studio
Ceny nezměněny oproti Gemini 3 Pro (~$1,25/$10 na milion tokenů standardně)

Proč na tom záleží

Google zachoval ceny a zároveň dramaticky zlepšil uvažovací schopnosti. Pro podniky, které jsou již na Google Cloudu, se 3.1 Pro hodí jako přímý upgrade bez dopadu na rozpočet.

DeepSeek: V4 a 10× rozšíření kontextu

Aktualizace V3.2: 12. února 2026 V4 očekáváno: polovina února 2026

DeepSeek nadále zůstává nejvíce destabilizující silou v oblasti cen AI a přitom přináší skutečné frontier schopnosti.

V3.2: Desetinásobné rozšíření kontextu

Začátkem února DeepSeek rozšířil kontextové okno V3.2 ze 128 000 tokenů na více než 1 milion — desetinásobné zvýšení. Za $0,27/$1,10 na milion tokenů je nyní tento model nejlevnějším způsobem zpracování masivních dokumentů s frontier-class modelem.

V4: Další frontier

DeepSeek V4 se očekává s těmito vlastnostmi:

1 bilion parametrů (architektura MoE)
1M+ tokenový kontext nativně
Tři architektonické průlomy: Engram conditional memory, Manifold-Constrained Hyper-Connections a DeepSeek Sparse Attention
Cíl: 80 %+ na SWE-bench — to by ho postavilo na samotný vrchol kódovacích benchmarků
Očekáváno jako open-weight pod permisivní licencí

Cenový příběh

Cenový rozdíl mezi DeepSeekem a západními poskytovateli zůstává ohromující:

Příklad nákladů na úlohu	GPT-5	Claude Opus 4.6	DeepSeek V3.2
100K vstup + 10K výstup	$0,225	$2,25	$0,038
Poměr k DeepSeeku	6×	59×	1×

Složitá úloha za $15 s GPT-5 stojí přibližně $0,50 s DeepSeekem. Nejde jen o cenovou výhodu — mění to, co je ekonomicky smysluplné automatizovat.

Zhipu AI: GLM-5

Vydáno: 11. února 2026

Největší vydání open-source modelu tohoto měsíce a pravděpodobně nejvýznamnější z geopolitického hlediska.

Co je nového

GLM-5 je model MoE s 745 miliardami parametrů (44B aktivních parametrů) s pěti klíčovými schopnostmi: kreativní psaní, generování kódu, víceúrovňové uvažování, agentic inteligence a zpracování dlouhého kontextu.

Výsledky benchmarků

Benchmark	GLM-5	Srovnání
SWE-bench Verified	77,8 %	Odpovídá Claude Opus 4.5
AIME 2026	92,7 %	—
GPQA-Diamond	86,0 %	—
Humanity's Last Exam	50,4 %	Překonává Claude Opus 4.5
Míra halucinací	34 %	Pokles z 90 % (GLM-4.7)

Snížení halucinací — z 90 % na 34 % pomocí nové techniky RL nazvané Slime — je obzvláště působivé a GLM-5 v tomto ohledu vévodí indexu Artificial Analysis Omniscience.

Geopolitický signál

GLM-5 byl trénován výhradně na čipech Huawei Ascend pomocí frameworku MindSpore — bez jakéhokoliv hardwaru vyrobeného v USA. To dokazuje, že čínský domácí výpočetní stack dokáže produkovat modely frontier kvality i přes exportní kontroly.

Nativní Agent Mode

GLM-5 přichází s nativním „Agent Mode", který dokáže přeměnit výzvy na profesionální kancelářské dokumenty (.docx, .pdf, .xlsx) — přímá konkurence pro computer use od Anthropic a Codex od OpenAI při praktických obchodních úlohách.

Po spuštění akcie Zhipu vzrostly o 34 % na hongkongské burze.

Moonshot AI: Kimi K2.5 a Kimi Claw

K2.5 vydáno: 27. ledna 2026 Kimi Claw: 15. února 2026

Moonshot AI buduje nejkomplexnější open-source agentic ekosystém v čínském AI prostoru.

Kimi K2.5

Model MoE s 1 bilionem parametrů (32B aktivních parametrů), který rozumí textu, obrázkům a videu. Klíčová inovace: schopnost Agent Swarm, poháněná novou technikou RL nazvanou Parallel Agent Reinforcement Learning (PARL), která trénuje model k dekompozici a paralelizaci složitých úloh.

Model je plně open-source a dostupný na Hugging Face.

Kimi Claw

Spuštěný 15. února, Kimi Claw je cloudová browserová AI agentní platforma postavená na frameworku OpenClaw. Představte si ho jako odpověď Moonshootu na computer use od Anthropic — ale běžící celý v cloudu.

xAI: Grok 4.2 Release Candidate

Veřejná beta: 17. února 2026

Grok 4.2 od Elona Muska přináší zásadně odlišný přístup ke zlepšování modelu: rychlé učení.

Co je nového

Na rozdíl od každého jiného modelu na tomto seznamu je Grok 4.2 navržen tak, aby se zlepšoval každý týden na základě veřejného používání. Musk ho popsal jako model „schopný rychle se učit" s týdenními cykly zlepšování a poznámkami k vydání.

Nové schopnosti:

4-agentní paralelní spolupráce — specializovaní AI agenti, kteří syntetizují výstupy do jediné odpovědi
Analýza lékařských dokumentů prostřednictvím nahrání fotografie
Zlepšené inženýrské uvažování

Ceník

xAI si udržuje svou agresivní cenovou strategii:

Model	Vstup (na 1M)	Výstup (na 1M)
Grok 4.1	$0,20	$0,50
Grok 4.2 RC	TBA (beta)	TBA

Aktuální stav

Grok 4.2 je v současné době ve veřejné betě — k dispozici pro výběr v rozhraní Grok. Veřejné vydání se očekává v březnu 2026. Oficiální benchmarky budou zveřejněny po skončení beta verze.

Mistral AI: Large 3 a kódovací stack

Mistral Large 3: 2. prosince 2025 Devstral 2: prosinec 2025

Mistral nadále překonává svou kategorii jako přední evropská AI laboratoř a vydává modely, které konkurují na vrcholu open-source žebříčků.

Mistral Large 3

Model MoE s 675 miliardami parametrů s 41B aktivními parametry. Debutoval na #2 místě v open-source non-reasoning modelech na žebříčku LMArena — hned za mnohem většími modely z čínských laboratoří.

Klíčové modely v aktuální nabídce Mistralu:

Model	Zaměření	Cena (na 1M)
Mistral Large 3	Obecný frontier	~$2,00 / $6,00
Mistral Medium 3.1	Multimodální (40k ctx)	$2,00 / $5,00
Magistral Medium 1.2	Uvažování	$2,00 / $5,00
Codestral	Dokončování kódu	Premier tier
Devstral 2	Agentic kódování	Open-weight

Devstral Small 2

Hvězda prosincového vydání: kódovací model s 24B parametry, který překonává Qwen 3 Coder Flash přestože je výrazně menší. Pro týmy, které potřebují vlastní kódovací AI bez masivních GPU požadavků, je Devstral Small 2 přesvědčivou volbou.

Ministral 3

Rodina malých modelů Mistralu (3B, 7B, 14B parametrů) dosahuje nejlepšího poměru cena/výkon mezi open-source modely — odpovídá nebo překonává srovnatelné modely a přitom produkuje o řád méně tokenů.

MiniMax: M2.5

M2.5 vydáno: 2026

Temný kůň závodu o frontier. M2.5 od MiniMaxu přináší benchmark-topping výkon v kódování s pouhými 10 miliardami aktivních parametrů — zlomek toho, co konkurenti používají.

Co je nového

MiniMax M2.5 je účelově postaven pro kódování a agentic provádění se zaměřením na dosažení více s méně:

#1 na Multi-SWE-Bench se skóre 51,3
Překonává Claude Opus 4.6 na SWE-Bench Pro
Vedoucí skóre na benchmarkách FinSearch, BrowseComp a RISE
Propustnost 100 tokenů za sekundu — popisována jako „3× rychlejší než Opus"
Uvažování Chain of Thought až 128K tokenů

Příběh efektivity

Výjimečná statistika: MiniMax M2.5 zvládne 327,8 úloh na $100 rozpočtu — více než 10× více než Opus. Za $0,30 na milion vstupních tokenů ($0,06 s cache) se pohybuje v cenovém teritoriu DeepSeeku a přitom odpovídá nebo překonává prémiové modely v kódovacích úlohách.

Model	Vstup (na 1M)	S cache	Rychlost
M2.5	$0,30	$0,06	100 TPS
M2.5-highspeed	$0,30	$0,06	Rychlejší varianta

Open weights

MiniMax uvolnil váhy M2.5 na HuggingFace s podporou vLLM, SGLang a Transformers pro vlastní hostování. To z něj dělá jednu z nejefektivnějších možností pro týmy provozující vlastní inferenční infrastrukturu.

Cenová krajina

Zde je přehled nákladů všech frontier modelů (na milion tokenů):

Poskytovatel	Model	Vstup	Výstup	Kontext
xAI	Grok 4.1	$0,20	$0,50	—
DeepSeek	V3.2	$0,27	$1,10	1M+
MiniMax	M2.5	$0,30	—	128K
OpenAI	o4-mini	$1,10	$4,40	—
Google	Gemini 3.1 Pro	~$1,25	~$10,00	1M
OpenAI	GPT-5	$1,25	$10,00	400K
Mistral AI	Medium 3.1	$2,00	$5,00	40K
Mistral AI	Large 3	~$2,00	~$6,00	128K
OpenAI	o3	$2,00	$8,00	—
Anthropic	Sonnet 4.6	$3,00	$15,00	1M (beta)
Anthropic	Opus 4.6	$15,00	$75,00	200K
Zhipu AI	GLM-5	Open weights	Zdarma k vlastnímu hostování	—
Moonshot AI	Kimi K2.5	Open weights	Zdarma k vlastnímu hostování	—
DeepSeek	V4 (očekáváno)	Open weights	Zdarma k vlastnímu hostování	1M+

17násobný cenový rozdíl mezi nejlevnějším API (DeepSeek za $0,27/M) a prémiovými modely (Opus 4.6 za $15/M vstup) představuje skutečné architektonické rozhodnutí pro firmy. Otázka již není „můžeme si AI dovolit?", ale „která úroveň AI odpovídá našemu případu užití?"

Klíčové trendy

1. Nástup open-source

Pět nedávných vydání — GLM-5, Kimi K2.5, DeepSeek V4, Mistral Large 3 a MiniMax M2.5 — jsou open-weight modely. Nejen že dohánějí uzavřené modely; GLM-5 odpovídá Claude Opus 4.5 na SWE-bench a překonává ho na Humanity's Last Exam. Mistral Large 3 je na #2 v open-source LMArena. Kvalitativní rozdíl mezi open a closed modely prakticky zmizel.

2. Čínský nezávislý AI stack

GLM-5 (Huawei Ascend) i DeepSeek V4 dokazují, že čínské laboratoře dokážou produkovat frontier modely bez amerického hardwaru. Exportní kontroly čínský AI pokrok zpomalily, ale nezastavily — a možná urychlily investice do domácích alternativ.

3. Agentika ve všem

Každé vydání tohoto měsíce zahrnuje agentic schopnosti: GPT-5.3 Codex zvládá dlouhotrvající víceúrovňové úlohy, Claude 4.6 má computer use na 72,5 %, Grok 4.2 provozuje 4-agentní paralelní spolupráci, GLM-5 má nativní Agent Mode a Kimi má Agent Swarm. Rok 2026 je rokem, kdy modely přestaly být chatboty a začaly být pracovníky.

4. Revoluce střední třídy

Prokázání, že model za $3/M dokáže vyrovnat vlajkový model za $15/M, je zlomový okamžik. V kombinaci s cenu $0,27/M od DeepSeeku dosahující ~90 % kvality GPT-5 je hodnotová nabídka prémiového API pod vážným tlakem.

5. Konvergence kontextových oken

Více modelů nyní nabízí kontextová okna 1M+ tokenů: Gemini 3.1 Pro, Claude 4.6 (beta), DeepSeek V4 a Kimi K2.5. Zpracování celých kódových základen, právních dokumentů nebo výzkumných korpusů v jediném průchodu již není diferenciátorem — je to nutný základ.

Co to znamená pro firemní uživatele

Pokud v roce 2026 zabudováváte AI do svého firemního pracovního postupu, zde jsou praktické závěry:

Pro kódování a vývoj: GPT-5.3 Codex a Claude Sonnet 4.6 vedou pelotón. Codex pro dlouhotrvající agentic úlohy, Sonnet pro všestranné kódování a ovládání počítače.

Pro náklady citlivé pracovní zátěže: DeepSeek V3.2 za $0,27/M tokenů je nepřekonatelný pro velkoobjemové úlohy. Open-weight modely (GLM-5, Kimi K2.5) jsou zdarma pro vlastní hostování, pokud máte GPU infrastrukturu.

Pro podnikové uvažování: 2× zlepšení uvažování Gemini 3.1 Pro z něj dělá výchozí volbu pro Google Cloud zákazníky. Claude Opus 4.6 zůstává stropem pro komplexní analýzy.

Pro rychlé iterace: Model týdenního zlepšování Groku 4.2 je unikátní — pokud potřebujete model, který se postupem času stává lepším pro vaše konkrétní případy použití, stojí za sledování.

Pro nezávislost: Open-weight modely (GLM-5, Kimi K2.5, DeepSeek V4) vám dávají plnou kontrolu nad nasazením, přizpůsobením a ochranou dat.

Poslední aktualizace

20. února 2026 — Tento článek je aktualizován při vydávání nových frontier modelů. Sledujte nás pro nejnovější zpravodajství.

Předchozí aktualizace: První publikace (20. 2. 2026)

Frontier AI modely: Všechny velké novinky tohoto měsíce (únor 2026)

Nejintenzivnější měsíc v historii AI

OpenAI: GPT-5.3 Codex

Co je nového

Bezpečnostní varovný signál v oblasti kybernetické bezpečnosti

Dostupnost

Ceník

Anthropic: Claude Sonnet 4.6

Co je nového

Přehled benchmarků

Preference uživatelů

Claude Opus 4.6

Google: Gemini 3.1 Pro

Co je nového

Dostupnost

Proč na tom záleží

DeepSeek: V4 a 10× rozšíření kontextu

V3.2: Desetinásobné rozšíření kontextu

V4: Další frontier

Cenový příběh

Zhipu AI: GLM-5

Co je nového

Výsledky benchmarků

Geopolitický signál

Nativní Agent Mode

Moonshot AI: Kimi K2.5 a Kimi Claw

Kimi K2.5

Kimi Claw

xAI: Grok 4.2 Release Candidate

Co je nového

Ceník

Aktuální stav

Mistral AI: Large 3 a kódovací stack

Mistral Large 3

Devstral Small 2

Ministral 3

MiniMax: M2.5

Co je nového

Příběh efektivity

Open weights

Cenová krajina

Klíčové trendy

1. Nástup open-source

2. Čínský nezávislý AI stack

3. Agentika ve všem

4. Revoluce střední třídy

5. Konvergence kontextových oken

Co to znamená pro firemní uživatele

Poslední aktualizace

Turn the best models into shipped work