Stanford AI Index 2026: Schopnosti historicky, důvěra v krizi. Proč se nůžky rozevírají.
13. dubna 2026 zveřejnil Stanford HAI osmou edici AI Index Reportu — 500stránkový dokument, kterému vývojáři, regulátoři a investoři věnují každý duben pozornost. Letos přišel s čísly, která se odmítají dávat dohromady. Na jedné straně rekordní skok schopností: nejtvrdší akademický benchmark Humanity's Last Exam vyrostl z 8,8 % v roce 2024 na přes 50 % v dubnu 2026. Americké a čínské modely spolu soupeří na vzdálenost 2,7 procentního bodu. Na straně druhé: Foundation Model Transparency Index — měřítko otevřenosti firem ohledně trénovacích dat, compute a rizik — spadl z 58 na 40 bodů. Adopce dosáhla 53 % populace, ale důvěra americké veřejnosti v regulační schopnost státu je jen 31 %. Čtyři z pěti světových modelů vyšly loni bez tréninkového kódu. Tento článek ukazuje, proč jsou to tři osy jednoho selhání — a co to znamená pro české firmy, které budou v srpnu 2026 vysvětlovat článek 50 EU AI Actu svým auditorům.
TL;DR — Klíčová zjištění
- AI Index 2026 (500+ stran, Stanford HAI, 13. 4. 2026) ukazuje rekordní skok schopností AI v historii benchmarků a zároveň rekordní pád průhlednosti firem. HLE 8,8 % → 50+ %, SWE-bench 60 % → téměř 100 %, FMTI 58 → 40, zdokumentované AI incidenty 233 → 362.
- Schopnosti, průhlednost a důvěra se v roce 2025 rozběhly různými směry. Adopce je 53 % populace (rychleji než PC i internet), ale 80 z 95 významných modelů vyšlo bez tréninkového kódu. Meta ztratila meziročně 29 bodů průhlednosti, OpenAI 14.
- Pro české firmy report znamená tři praktické úkoly: vendor audit podle FMTI místo Arena Elo, příprava na článek 50 EU AI Actu (účinnost 2. 8. 2026) a revize shadow-AI metrik, protože 27,8 % pracujících v ČR používá AI individuálně, ale jen 18 % podniků oficiálně.
Co je AI Index 2026 a proč ho čtou regulátoři
AI Index je každoroční zpráva Stanford Institute for Human-Centered AI (Stanford HAI), která shrnuje stav umělé inteligence napříč výzkumem, technickými benchmarky, ekonomikou, bezpečností, regulací a veřejným míněním. Edice 2026 vyšla 13. dubna 2026, jedná se o osmý ročník a čítá přes 500 stran s volně dostupnou PDF verzí i interaktivními vizualizacemi. Používají ji regulátoři v Bruselu, Washingtonu i Pekingu, autoři McKinsey a OECD reportů, zástupci investičních fondů i šéfové CIO.
Steering Committee reportu tvoří zkušení akademici — mezi nimi Ray Perrault ze Stanford AI Lab, Yolanda Gil ze Stanford HAI, Erik Brynjolfsson ze Stanford Digital Economy Lab nebo Jack Clark z Anthropic. Součástí autorského týmu jsou i zástupci OECD, Etch.ai, LinkedIn a McKinsey. Report je označován za „nejobsáhlejší roční přehled AI" a do značné míry představuje referenční text pro tvorbu politik.
Struktura letošní edice zahrnuje osm kapitol: výzkum a vývoj, technický výkon, zodpovědná AI, ekonomika, AI ve vědě a medicíně, politika a regulace, vzdělávání a veřejné mínění. Nově vznikla samostatná podkapitola o environmentálních dopadech trénování a inference. Report nemá vlastní data o revenue jednotlivých AI firem, o churnu ani o B2B spokojenosti zákazníků — tato data neměří, a proto je třeba je číst v kontextu jiných zdrojů.
Metodologické zdroje reportu
AI Index kombinuje data z několika desítek zdrojů: Epoch AI (model releases), Artificial Analysis (benchmark data), LinkedIn Economic Graph (pracovní trh), Quid (patentové a publikační metriky), GitHub Innovation Graph, EuroStat, US Census a Stanford CRFM Foundation Model Transparency Index. Právě propojení dat z veřejných i komerčních zdrojů je důvodem, proč report cituje McKinsey i OSN.
Pro české firmy platí jednoduché pravidlo: pokud dodavatel AI systému cituje statistiku z „AI Indexu", ověřte si kapitolu a stránku. Mezi nejcitovanějšími čísly loňské edice bylo „AI zvyšuje produktivitu o 40 %" — toto číslo ale pocházelo z jediné studie na úzkém vzorku technické podpory.
Schopnosti: skok, který nemá v historii benchmarků srovnání
Pokud by čtenář sledoval jen benchmarkové grafy reportu, došel by k závěru, že AI v roce 2025 dokončila většinu toho, co 70 let výzkumu slibovalo. SWE-bench Verified, benchmark reálných GitHub issues, který měřil schopnost modelů řešit softwarové problémy, vyrostl za rok ze 60 % na téměř 100 % lidského baseline. Humanity's Last Exam, sada 2 500 otázek sestavená experty jako „poslední" akademický benchmark široké disciplinární šíře, vyskočila z 8,8 % (OpenAI o1, konec 2024) na přes 50 % v dubnu 2026. GPQA Diamond — otázky, na které PhD odborník odpoví v průměru 65 % správně — má GPT-5.4 na 92 %.
| Benchmark | Top 2024 | Top 04/2026 | Růst | Lidský baseline |
|---|---|---|---|---|
| Humanity's Last Exam | 8,8 % (o1) | ~50 % (Opus 4.6, Gemini 3.1 Pro) | 5,7× | ~90 % experti |
| SWE-bench Verified | ~60 % | ~100 % | 1,7× | 100 % |
| GPQA Diamond | ~65 % | 92 % (GPT-5.4) | 1,4× | 65 % PhD experti |
| OSWorld (agenti) | ~12 % | 66,3 % | 5,5× | 72,35 % |
| WebArena (web agenti) | ~20 % | 74,3 % | 3,7× | 92 % |
| Cybersec solve rate | 15 % | 93 % | 6,2× | 95 % |
| ClockBench (analog. hodiny) | — | 50,6 % (GPT-5.4 High) | — | ~90 % lidé |
| BEHAVIOR-1K (robot.) | ~4 % | 12 % | 3× | — |
Zdroj: Stanford AI Index 2026, kap. 2 (Technical Performance).
Report zároveň upozorňuje na podstatnou nerovnoměrnost tohoto pokroku. Zatímco u akademických benchmarků modely překonávají expertní lidský výkon, u fyzicky zakotvených úloh zaostávají: BEHAVIOR-1K, benchmark složený z 1 000 domácích úkolů (ustlat postel, utřít sklo), má aktuální úspěšnost jen 12 %. A nejcitovanějším paradoxem celé edice je ClockBench: GPT-5.4 v nejvyšším režimu rozumí analogovým hodinám správně v 50,6 % případů, zatímco lidé kolem 90 %.
Agenti: skok ze slibů do praktického výkonu
Nejdramatičtější růst reportu zaznamenal v oblasti agentů. OSWorld, který testuje schopnost modelu používat skutečný desktopový operační systém (otevřít soubor, upravit dokument, poslat email), vyskočil z ~12 % na 66,3 %, už jen 6 bodů za lidmi. WebArena, pro webové úkoly, dosáhla 74,3 %. Autonomní kybernetické agenty, měřené na sadě CTF výzev, vyřešily 93 % úloh oproti 15 % v předchozí edici.
Stejný report ale cituje rovněž nedávnou studii v Nature (publikovaná 13. dubna 2026 jako souběh s vydáním AI Indexu), podle které nejlepší AI agenti dosahují u komplexních vědeckých workflow jen poloviny výkonu PhD expertů. Benchmarky tedy mluví jazykem izolovaných úloh. Reálné workflow — s kontextem, dlouhodobou pamětí, rozhodováním pod nejistotou — je stále lidskou doménou.
Arena Elo: jak vypadá skutečná závodní dráha
Report definuje „nejlepší model" pomocí aktualizované verze Chatbot Arena Elo — systému, který modely páruje v anonymním souboji před uživateli a měří preferenci. V dubnu 2026 vypadá žebříček takto:
| Model | Arena Elo | Země | Poznámka |
|---|---|---|---|
| Claude Opus 4.6 Thinking | 1 548 | USA | Thinking mode, 9. 4. 2026 |
| Z.ai GLM-5.1 | 1 530 | Čína | Open source, MIT licence |
| Claude Opus 4.6 | 1 503 | USA | Standard mode |
| Gemini 3.1 Pro | ~1 490 | USA | Google DeepMind |
| GPT-5.4 | ~1 475 | USA | OpenAI |
| ByteDance Dola-Seed-2.0 Preview | 1 464 | Čína | Zatím closed weights |
Stanford AI Index 2026 + Chatbot Arena (stav k 12. 4. 2026).
Top šestice se vejde do pásu 79 bodů. To je statistický šum, ve kterém se pořadí mění týdně. Report kvůli tomu zavádí novou metriku Effective Elo, která filtruje pořadí podle typu úlohy (coding, creative writing, math, reasoning). V praxi to znamená, že „nejlepší model" dnes neexistuje — existuje nejlepší model pro konkrétní třídu úloh.
Průhlednost se rozpadá. Proč se o tom mluví méně než o schopnostech
Zatímco kapitola o schopnostech obsahuje vzrušené grafy stoupající vzhůru, kapitola o zodpovědné AI obsahuje graf jediný — sestupný. Foundation Model Transparency Index, který Stanford CRFM publikuje od roku 2023, hodnotí otevřenost firem na 100 dimenzích — od zveřejnění dat po compute, licence, bezpečnostní testy a use-case restrikce. Průměrné skóre kleslo z 58 bodů v roce 2024 na 40,69 bodu v edici 2025, tedy o 18 bodů meziročně. Nejvýznamnější propady zaznamenaly Meta (−29) a OpenAI (−14).
| Firma | FMTI 2023 | FMTI 2025 | Meziročně (2024→2025) |
|---|---|---|---|
| IBM | — | 95 | nováček, nejvyšší skóre v historii indexu |
| AI21 | 25 | ~76 | +5 |
| Anthropic | 36 | ~58 | −5 |
| 40 | ~41 | −6 | |
| Amazon | 12 | ~38 | −2 |
| OpenAI | 48 | ~34 | −14 |
| DeepSeek | — | ~32 | +/− stabilní |
| Meta | 54 | ~25 | −29 |
Zdroj: Stanford CRFM — Foundation Model Transparency Index 2025, publikovaný v prosinci 2025.
Report zasazuje tato čísla do kontextu: z 95 nejvýznamnějších modelů vydaných v roce 2025 jich 80 vyšlo bez tréninkového kódu. Průměrná transparence pro data acquisition je 31 %, pro data properties 15 % a pro compute 26 %. Jinými slovy: kdo chce auditovat, na čem byl model trénován a kolik energie to stálo, dostane od většiny poskytovatelů odpověď „ne".
Klíčový paradox: Frontier Model Forum jako klastr průměrnosti
Pět firem Frontier Model Foruma (Amazon, Anthropic, Google, Meta, OpenAI) má průměrné skóre přesně uprostřed tabulky — kolem 36. To podle Stanford CRFM naznačuje sdílený motiv nevyčnívat: žádná z firem nechce být na dně (reputační riziko), ale žádná ani nechce mít výrazně vyšší skóre než konkurenti (competitive disadvantage). Klastrování uprostřed je signál trhu, kde je průhlednost chápána jako nevýhoda, ne jako hodnota.
Proč průhlednost padá — a proč to není vedlejší efekt
Report odmítá běžné vysvětlení, podle kterého transparence klesá kvůli tlaku konkurence („kdybychom zveřejnili data, konkurence by nás skopírovala"). Empiricky se ukazuje, že firmy nezveřejňují ani informace, jejichž zveřejněním by nic neztratily — například licenční podmínky trénovacích dat, počty recenzentů v RLHF procesu nebo existenci red-team výsledků. Z 80 modelů bez kódu má řada open-weights verze, takže trénovací postup by byl ze samotných vah zrekonstruovatelný. Nedostatek průhlednosti je tedy zvolený postoj, ne vedlejší důsledek.
IBM v této optice ční. Její skóre 95/100 je nejvyšší v historii FMTI. Publikuje 6 indikátorů, které nikdo jiný nepublikuje — mezi nimi detailní energetickou stopu jednoho trénovacího runu a seznam všech licenčních sporů, které otevřela nebo odmítla. AI21 a Anthropic zůstávají v top 2 nového žebříčku. Meta a OpenAI, které v roce 2023 vedly, jsou dnes poslední a předposlední.
Co to znamená pro vendor audit
Pokud vybíráte AI dodavatele v roce 2026 a máte k dispozici dvě volby s podobným výkonem, FMTI by měl být rozhodující faktor — ne benchmarkové skóre. Firma s vyšší průhledností je nižší compliance riziko pro EU AI Act, nižší reputační riziko pro případ AI incidentu a vyšší udržitelnost partnerství v horizontu 3–5 let. Konkrétní doporučení viz kapitola „Co to znamená pro české firmy".
Peníze: 581 miliard dolarů a kam šly
Globální firemní investice do AI dosáhly v roce 2025 581,7 miliardy dolarů, což je meziroční růst o 130 %. Z toho čistě private investments (bez M&A, bez veřejných nabídek) činily 344,7 miliardy dolarů, meziročně +127,5 %. Od roku 2013 vzrostly korporátní investice do AI zhruba 40krát. V tomto čísle je zahrnuto VC financování frontier labů, nákup GPU infrastruktury ze strany Hyperscalerů, akvizice AI startupů a investice enterprise firem do vlastní infrastruktury.
Na úrovni jednotlivých firem dominují čtyři jména. OpenAI v Q1 2026 uzavřela kolo ve výši 122 miliard dolarů při valuaci 852 miliard dolarů. Anthropic získala v únoru 2026 30 miliard v rámci Series G při post-money valuaci 380 miliard dolarů. xAI přidala 20 miliard, Waymo 16 miliard. Podle Crunchbase tyto čtyři firmy pohltily dvě třetiny všech globálních VC peněz tečoucích do AI v Q1 2026. Report tento koncentraci označuje za „největší divergenci mezi počtem příjemců a objemem investic v historii technologického financování".
Čínský pohled je zajímavý svou disproporcí. Private investments do čínských AI firem činily v roce 2025 12,4 miliardy dolarů — tedy 23krát méně než v USA. AI Index ovšem explicitně upozorňuje, že tato čísla nezahrnují státní infrastrukturní dotace, které jsou v čínské AI ekosystému kritické (výstavba datacenter, dotace na domácí GPU). Odhady OECD ukazují, že reálná čínská AI investice je po započtení státu vyšší o 2–3násobek veřejně vykazované částky, ale stále zaostává o řád za USA.
V rámci zbytku světa financování stagnuje. EU privátní investice do AI v roce 2025 činily 14,5 miliardy eur (podle AI Watch), tedy zhruba 2 % globálního čísla. Zajímavější je růst Gulf-státních investic do čínských labů: Saudská Arábie a SAE dohromady investovaly přibližně 100 milionů dolarů do Minimax a Zhipu, což je sice malé číslo oproti 15 miliardám tekoucím do Anthropic a OpenAI ze strany Amazonu a Microsoftu, ale signalizuje nový vzorec financování.
Counter-narrative: investice ≠ výstup
Analytik humai.blog v komentáři z 14. 4. 2026 upozornil, že 23násobný investiční rozdíl mezi USA a Čínou neodpovídá 2,7% rozdílu v Arena Elo. Buď je americký AI trh zoufale neefektivní, nebo Arena Elo není správná metrika schopnosti, nebo čínské státní financování je výrazně vyšší, než se přiznává. Odpověď je pravděpodobně kombinace všech tří faktorů — a pro českého investora to znamená, že top-line investiční čísla o stavu AI závodu vypovídají málo.
Poslední významná čísla kapitoly se týkají spotřebitelského přebytku. MIT Digital Economy Lab odhadl, že consumer surplus z generativní AI v USA dosáhl v roce 2026 172 miliard dolarů — tedy hodnoty, kterou uživatelé získali nad rámec toho, co za AI služby zaplatili. Pro firemní prostředí analogické číslo neexistuje, ale report odkazuje na dosavadní pokusy měřit ROI AI v podnicích, které typicky ukazují 1,4–2,4násobný návrat investovaného kapitálu v horizontu 24 měsíců.
USA vs. Čína: Proč je „2,7 % rozdíl“ zavádějící metrika
Nejcitovanějším číslem reportu se stává rozdíl 2,7 procentního bodu (39 bodů Arena Elo) mezi nejlepším americkým a nejlepším čínským modelem v lednu 2026. Pro srovnání: v lednu 2024 činil tento rozdíl 9,26 %. Na první pohled to vypadá jako výrok, že Čína Ameriku dohnala. Při bližším pohledu jde o metodologický artefakt.
Když se podíváte na celé horní pásmo Arena žebříčku, najdete v 79bodovém spreadu čtyři americké a dva čínské modely: Gemini-2.5-Pro (1480), GPT-5 (1465), Claude Opus 4.5 (1462), Qwen3.6-Plus (1451), DeepSeek-V3.2 (1445), Grok 4 (1441). Čínské modely tedy nejsou na špici, ale v druhé polovině TOP 6. Pod touto hranicí jsou dalších 44 amerických oproti 28 čínským „notable“ modelům vydaným v roce 2025. Asymetrie na úrovni vlajkových lodí se tedy rozplývá, jakmile začnete počítat šíři portfolia.
Co Arena Elo měří — a co ne
Měří: průměrnou preferenci lidských hodnotitelů v párovém srovnání na krátkých konverzačních úlohách. Neměří: spolehlivost na dlouhých agentních úlohách (viz HumanEval-Agent, kde čínské modely ztrácejí ~8 %), bezpečnostní alignment, náklady na inferenci ($/1M tokens), firemní integraci, jazykové pokrytí mimo angličtinu a čínštinu, audit práv k tréninkovým datům. Rozdíl 2,7 % v Aréně tedy znamená pouze to, že na „průměrném chatu v angličtině“ rozhodne spíš náhoda než národní původ modelu.
Čínská pozice je zajímavější tam, kde se neměří Elo, ale infrastruktura a objem. Čína v roce 2025 podala 295 000 AI patentů oproti 34 200 v USA — tedy 8,6krát více. V robotice instaluje sedmkrát více průmyslových jednotek než USA. V podílu AI publikací drží 23,2 % vs. americké 9,2 %. Tam, kde Američané vedou, je citační váha (30 % vs. 23 % Čína) a počet high-impact modelů v Top 100 (40 vs. 15 dle Epoch AI). Jde tedy o dva zrcadlové grafy: kvantita vs. kvalita, výstup vs. dopad.
Zásadní rozdíl zůstává v compute infrastruktuře. Podle SemiAnalysis a Omdia drží USA přibližně 75 % globální GPU kapacity schopné trénovat modely nad 10²⁵ FLOPs, z toho Nvidia tvoří 60 % všech nainstalovaných akcelerátorů. Čína je v kritické fázi pivotu: DeepSeek po srpnu 2025 odložil V4 model kvůli problémům s tréninkem na domácích čipech Huawei Ascend 910C a v únoru 2026 oznámil přechod na novější Ascend 950PR, který má poprvé dorovnat výkon Nvidia H20. DeepSeek V4 je tak nyní plánovaný na Q3 2026 — odložení o 12 měsíců proti původnímu harmonogramu.
Zatímco infrastruktura brzdí, portfoliová strategie čínských labů se v Q1 2026 radikálně změnila. Alibaba Qwen, Zhipu GLM a ByteDance Doubao přestaly zveřejňovat plné váhy u nejnovějších modelů. Qwen3.6-Plus (leden 2026), Qwen3.5-Omni, GLM-5-Turbo a Doubao 1.6 Pro jsou dostupné pouze jako placené API. Období, kdy otevřené čínské modely tlačily ceny frontier inference směrem dolů, skončilo — paradoxně ve chvíli, kdy Meta s modelem Muse Spark také přešla na uzavřené váhy.
Stress-test: co musí být pravda, aby „2,7 % rozdíl“ znamenal paritu
- Arena Elo musí reflektovat reálný enterprise use-case. Neplatí — Arena měří chat, ne reasoning, agenty, nebo toolcalling.
- Čínský lab musí mít přístup ke srovnatelnému trénovacímu compute. Neplatí — Ascend 950PR stále zaostává za Nvidia B200 o ~40 % FLOPs.
- Vzorek Arena uživatelů musí být reprezentativní. Neplatí — 68 % hlasů pochází z Asie a Evropy podle dat lmarena.ai z února 2026.
- Rozdíl musí být statisticky udržitelný po kalibraci na úlohy. Neplatí — HLE, SWE-Bench Verified a GPQA-Diamond ukazují 6–11 % stabilní odstup americké špičky.
Ani jedna z podmínek není splněna. Číslo 2,7 % je pravdivé jako měřená hodnota, ale nesmyslné jako ukazatel národní schopnosti.
Práce: Junioři jako první oběť. Nebo jako první statistika?
Kapitola osmá AI Indexu 2026 „Economy & Workforce“ přináší čísla, u kterých je potřeba dávat pozor, co přesně měří. Tři klíčová zjištění: v USA klesla zaměstnanost vývojářů ve věku 22–25 let mezi lety 2022 a 2025 o zhruba 20 %, zatímco počet pozic pro seniory ve stejném oboru vzrostl o 7 %. Počet AI-related pracovních inzerátů v USA dosáhl v roce 2025 2,01 milionu, tedy podílu 2,83 % všech IT pozic (dvojnásobek oproti 2023). A globálně se do AI talentu přesunulo 32 000 osob ze sektoru akademického výzkumu do průmyslu, z čehož 63 % šlo do čtyř firem: Google, Microsoft, OpenAI, Anthropic.
Interpretace „AI ničí juniory“ je lákavá, ale v syrových datech není podložená. Erik Brynjolfsson z Digital Economy Lab a Arnulf Grubler z IIASA v předmluvě reportu upozorňují, že pokles zaměstnanosti 22–25letých vývojářů koreluje s třemi jinými faktory: konec nízkonákladového financování (Fed Funds Rate +5 procentních bodů vs. 2021), přesun vývoje do Indie a Polska (+31 % offshored contracts dle Deloitte) a strukturální normalizace post-COVID přijímání, kdy firmy v letech 2021–22 najímaly agresivněji, než bylo udržitelné. AI je v tomto jedním faktorem, ne jediným.
Zajímavější než dramatický nadpis o konci juniorů je druhá strana stejného příběhu. AI Index uvádí, že 51 % dotazovaných CFO ve Fortune 500 plánuje v roce 2026 zvýšit počet entry-level pozic právě kvůli AI. Důvod: AI zvládne vykonat rutinní práci jednoho až tří juniorů, ale firmy potřebují juniory školit, aby z nich vyrostli senioři s AI-augmentovaným výkonem. IBM v únoru 2026 oznámilo program Foundation Track pro trojnásobný nárůst entry-level hirings do 2027. Stejnou taktiku ohlásily Deloitte, PwC a Accenture.
Rozdíl mezi firmami, které juniory propouštějí, a firmami, které je najímají masivněji než kdy jindy, se dá vysvětlit AI maturity stage. Firmy ve stadiu „pilot“ (podle AI Adoption Index 78 %) najímají méně, protože neví, co přesně potřebují. Firmy ve stadiu „scale“ (9 %) najímají více, protože AI roztahuje jejich juniorský throughput. V Česku je ve stadiu „scale“ odhadem 1–2 % firem (ČNB, duben 2026), takže zkušenost většiny českého trhu bude spíš „méně juniorů, dražší senioři“.
Co to znamená pro český trh IT práce
AI Index explicitně uvádí, že 25 % globální nabídky AI dovedností sídlí v Indii, 10 % v USA, 4 % v Německu a zbytek Evropy je pod radarem. Pro českého vývojáře to znamená tři věci: (1) mzdový tlak směrem nahoru u těch, kdo AI nástroje reálně ovládají (Copilot, Cursor, Claude Code, Windsurf), (2) otevírá se úzký trh se specializací na AI integraci (RAG, evals, agent orchestration, safety), (3) juniorské pozice jsou nadále dostupné, ale vyžadují „AI-native“ dovednost od prvního dne. Srovnání s aktuální situací na českém trhu je dostupné v článku 80 000 IT propouštění Q1 2026 — proč všichni obviňují AI.
Report rovněž přináší zajímavý global talent migration index. Největšími „magnety“ pro AI talent se staly v roce 2025 Spojené arabské emiráty (+1,5 imigrantů na 10 000 obyvatel), Izrael (+1,1) a Singapur (+0,9). Největší úbytek zaznamenalo Rusko (-2,3), Nizozemsko (-1,1) a Indie (-0,6). Česká republika zatím nefiguruje v top-30 ani jako zdroj, ani jako cíl — což je samo o sobě údaj hodný pozornosti.
Energie, voda, CO₂: ekologický účet za Grok 4 a další frontier modely
Kapitola pátá AI Indexu 2026 „Environment“ přináší jednotlivá čísla, která dosud nebyla veřejně transparentní. Pro nejnovější frontier modely jsou zveřejněné odhady uhlíkové stopy tréninku, protože ty už se nedají skrýt ani pomocí obchodního tajemství. Spotřeba energie a emise jsou viditelné na úrovni datových center a zveřejněné Stanford HAI na základě modelování příkonu GPU a skutečného trénovacího času.
| Model | Datum vydání | Odhadované emise (tCO₂e) | Ekvivalent (průměrné USA domácnosti/rok) |
|---|---|---|---|
| Grok 4 | 07/2025 | 72 816 | 8 850 |
| Gemini 2.5 Pro | 03/2025 | ~50 200 | 6 100 |
| GPT-5 | 08/2025 | ~41 600 | 5 050 |
| Claude Opus 4.5 | 02/2025 | ~32 400 | 3 940 |
| DeepSeek-V3.2 | 10/2025 | ~12 800 | 1 560 |
| Llama 4 (70B) | 04/2025 | ~3 400 | 415 |
Grok 4 je v tomto rekordmanem. Jeho 72 816 tun CO₂e je ekvivalent ročních emisí 8 850 průměrných amerických domácností. Trénink proběhl v datacenteru xAI v Memphisu, Tennessee, kde je 30 % energie generováno z fosilních zdrojů. Pro srovnání: Llama 4 70B trénovaná Metou na hydroenergii v USA má 21× nižší uhlíkovou stopu. Rozdíl v emisích neznamená rozdíl v kvalitě modelu, ale diametrální rozdíl v energetickém mixu výpočetního zázemí.
Z pohledu elektrické spotřeby AI Index odhaduje, že datacentra dedikovaná frontier AI trénování spotřebovala v roce 2025 globálně 82 TWh, tedy 0,3 % globální elektřiny. Projekce International Energy Agency v červnu 2025 počítala s 945 TWh do roku 2030 — což je zhruba dvojnásobek roční spotřeby celé České republiky (62 TWh/rok). V kontextu globálního objemu není tento nárůst pro klima katastrofální; v kontextu regionálních energetických rozvodných sítí (Virginia, Dublin, Singapur) je však extrémním tlakem.
Vodní stopa AI se přestává počítat
AI Index upozorňuje, že firmy postupně přestávají zveřejňovat vodní stopu trénování. Google ve svém environmentálním reportu 2024 uvedl 17 milionů m³ spotřeby vody pro chlazení datacenter, což je 17 % nárůst oproti 2023. Microsoft uvedl 6,4 milionů m³. V roce 2025 přestali obě firmy tyto údaje rozlišovat na AI a ne-AI workload, a v roce 2026 xAI, OpenAI a Anthropic žádné údaje o vodě nezveřejňují. Pro lokality typu „Google Hyperscaler Jihlava“ (oznámený investiční záměr, květen 2025) jde o přímou regulatorní implikaci.
Český kontext je ve hře dvěma způsoby. První je přímý — podle návrhu ministerstva průmyslu ze září 2025 připravuje ČR stimulační balíček pro AI datacentra v objemu 8,7 miliardy Kč (daňové prázdniny, výjimky z poplatku OZE, připojení do přenosové soustavy ČEPS). Druhý je nepřímý — EU AI Act Annex IV (čl. 53) vyžaduje od vysoce schopných modelů (>10²⁵ FLOPs) zveřejnění energetické spotřeby tréninku. České firmy využívající Grok 4, Claude Opus 4.5, GPT-5 budou v rámci Scope 3 emisního reportingu ke zveřejnění těchto čísel povinny od 1. 1. 2027 (CSRD). Článek ROI umělé inteligence: 5 ukazatelů, které skutečně ukazují zahrnuje kalkulaci, jak zahrnout Scope 3 AI emise do business case.
Důvěra: Propast mezi experty a veřejností
Kapitola sedmá „Public Opinion“ přináší čísla, která vysvětlují, proč investiční entuziasmus Wall Street neodpovídá náladě voličů. Podle globálního survey Edelman AI Trust Barometer (n=32 000, 32 zemí) klesla důvěra veřejnosti v AI firmy mezi lety 2023 a 2025 ze 61 % na 47 %. Ve stejném období vzrostla důvěra odborné obce v technickou proveditelnost AI ze 71 % na 83 %. Tato důvěrní propast je největší mezi jakýmikoli dvěma skupinami v historii Edelmanu.
Struktura nedůvěry je zajímavá. Největší obavu vyvolává zneužití dat pro reklamu (63 %), následováno šířením dezinformací (59 %), ztrátou pracovních míst (54 %) a existenciálním rizikem (22 %). V USA je poslední položka výrazně vyšší (34 %) než v Číně (9 %) — což reflektuje lokální diskurz spíš než technickou realitu. Český STEM/MARK z dubna 2026 ukazuje, že 41 % dotazovaných považuje AI za „spíše nedůvěryhodnou“, což je podobný poměr jako v Německu (45 %) a nižší než v UK (51 %).
Čísla o incidentech jsou zvlášť varovná. AI Index zaznamenal v roce 2025 362 veřejně hlášených incidentů (+56 % YoY), což zahrnuje případy typu: generované sexuální deepfake, chybná AI rozhodnutí o přiznání dávek, autonomní vozidla způsobující nehody, jailbreak úspěšně obcházející bezpečnostní filtry pro návod na výbušniny. Rekordním měsícem byl listopad 2025 s 47 incidenty, kdy před volbami v 14 zemích došlo k koordinované deepfake kampani cílící na volitele. Počet incidentů je podle AI Indexu pravděpodobně podhodnocený o faktor 3–5, protože firmy nemají povinnost hlášení a mnoho případů končí tichou dohodou.
Paradox důvěry: víc schopností, méně důvěry
AI Index v kapitole 7 předkládá jednu z nejsilnějších interpretací celé zprávy: v roce 2025 byla AI poprvé v historii zároveň nejsilnější a nejméně důvěryhodná. Korelace je záporná (r = -0,42 dle panelových dat). Čím víc AI firmy deklarují „AGI just around the corner“, tím víc veřejnost zavírá peněženky, hlasuje pro regulátory a domáhá se opt-outů. Tento paradox vysvětluje, proč EU AI Act prošel navzdory technologické opozici — a proč bude v roce 2026–27 následovat californská SB-1047 v nové podobě, brazilský AI Act a regulace v ČR přes MŠMT Act o AI ve školství, který má projít v Q3 2026.
Řešení, která AI Index doporučuje pro obnovení důvěry, jsou konkrétní: transparency (FMTI audit nezávislou třetí stranou), incident reporting (povinný registr podobný FAA letecké databázi), pre-deployment testování (UK AISI, US AISI, CERN-AI-Safety jako vznikající standard) a redress mechanisms (právo na lidský review AI rozhodnutí). V praxi jde o přenesení evropského GDPR playbooku na AI — což je mimochodem přesně to, co EU AI Act dělá. Pro české firmy je detailně zpracováno v článku Shadow AI: Co dělají vaši zaměstnanci s ChatGPT, aniž byste to věděli.
Co to znamená pro české firmy — 5 konkrétních důsledků
Stanford AI Index 2026 je globální dokument, ale jeho implikace pro české prostředí jsou konkrétní a kvantifikovatelné. Hloubkové čtení reportu odhaluje pět oblastí, kde se čísla střetávají s realitou českých firem a kde je potřeba učinit konkrétní rozhodnutí v horizontu Q2 — Q3 2026.
1. Dodavatelský audit: FMTI 40 není dost pro CSRD
Česká firma povinná reportovat podle CSRD (první vlna: 800+ firem s obratem nad 40 mil. EUR v roce 2025, druhá vlna: 3 000+ firem od 2026) musí ve Scope 3 emissions uvést dopad nakupovaných cloudových a AI služeb. Průměrný FMTI frontier labu 40 bodů ze 100 znamená, že ve většině auditových otázek dodavatel odpovědět nedokáže nebo odmítne. Praktické řešení: v kontraktu s AI dodavatelem si nechat zapracovat data room right (auditorský přístup k metadatům trénování při řešení incidentu) a model card commitment (průběžná aktualizace alespoň 10 položek z FMTI).
2. Model selection: vícenásobná strategie místo monopolu
AI Index ukazuje, že rozdíl mezi nejlepším a desátým modelem je v Aréně 79 bodů (5,3 %), zatímco cenový rozdíl může být 20×. Typická česká střední firma (50–250 zaměstnanců) neměla v roce 2025 racionální důvod používat pouze GPT-4/5 Turbo, když Claude Sonnet 4.5 a Gemini 2.5 Flash jsou v mnoha úlohách srovnatelné a řádově levnější. Detailní porovnání metrik je v článku Srovnání LLM 2026: ChatGPT vs. Claude vs. Gemini.
Checklist: Minimální FMTI požadavky v kontraktu s AI dodavatelem
- Trénovací data: deklarace jazykového pokrytí, věkový stop data
- Evaluace: 3 nejnižší benchmark skóre (ne jen 3 nejvyšší)
- Emise: odhad tCO₂e tréninku, povinnost Scope 3 reportingu
- Data residency: EU-lokalizace inference pro GDPR
- Incident response: 72h hlášení při narušení bezpečnosti
- Model version pinning: právo zmrazit konkrétní verzi na 12 měsíců
- Exit plan: export fine-tuned vah nebo prompt library
3. HR: junioři ano, ale jiní
AI Index dokumentuje, že 51 % Fortune 500 CFO plánuje více entry-level pozic kvůli AI, ne méně. České firmy, které sekundují těmto signálům, by měly redefinovat profil juniorského vývojáře. Junior 2026 není někdo, kdo umí napsat for-loop, ale někdo, kdo od prvního dne pracuje s Copilotem, Cursorem, Claudem a umí validovat, dekomponovat a testovat AI výstup. Redesign onboardingu by měl reflektovat tuto změnu. Kontextovou analýzu pro CZ trh poskytuje přehled 80 000 propouštění Q1 2026.
4. Risk management: 362 incidentů znamená pojistná rizika
OECD AI Incidents Database eviduje 362 veřejných incidentů v roce 2025. Zajímavější než celkové číslo je struktura: 41 % případů se týkalo poskytování nepravdivé informace klientovi, 23 % diskriminace v rozhodování, 17 % úniků citlivých dat přes RAG systémy. Každý z těchto případů v ČR znamená potenciální odpovědnost podle zákoníku práce (§ 330), spotřebitelského zákona a AI Actu (od srpna 2026). Pojistné produkty pro AI risk jsou nově nabízené Allianz, Munich Re, ČSOB pojišťovnou a typická roční prémie pro SME s využíváním AI v klientské komunikaci je 50–180 tis. Kč.
5. Regulatorní timeline: tři body, které už visí na stěně
Česká firma, která AI používá v HR, financích nebo zdravotnictví, má v roce 2026–27 minimálně tři konkrétní termíny. 2. 8. 2026: povinnost registrovat high-risk AI systémy podle EU AI Act Annex III. 1. 1. 2027: CSRD rozšíření na druhou vlnu firem. Q3 2026: plánované schválení českého zákona o AI ve školství, který doplňuje EU regulaci o domácí specifika. Stanford AI Index 2026 obsahuje v kapitole 6 přehled regulace 32 zemí, kde je EU Act označen za „nejpokročilejší, ale nejtvrdší“. Doporučené kroky pro compliance jsou konkretizovány v článku Kdy AI nepoužívat: 7 scénářů, kde je lidské rozhodnutí nenahraditelné.
Co sledovat v Q2–Q3 2026
Stanford AI Index 2026 je fotografií stavu k lednu 2026. Během dvou čtvrtletí, která zbývají do konce fiskálního roku, se odhaduje, že tři věci změní strukturu vyprávění: (1) DeepSeek V4 nebo ekvivalent čínské reakce na US embargo GPU — pokud vyjde podle plánu v Q3 na Ascend 950PR a zúží Elo rozdíl pod 1 %, narativ „Čína dohnala USA“ získá novou vlnu. (2) Druhá FMTI iterace v říjnu 2026, která by po dvou úpadcích mohla ukázat obrat směrem k regulované transparenci, zejména pokud vstoupí v platnost EU Code of Practice pro foundation modely. (3) První výsledky regulatorní implementace EU AI Act Annex IV v polovině 2026 — zda firmy reportovat budou nebo ne, a jak se bude počítat definice „systemic risk modelu“.
Pro české čtenáře jsou prioritní tři místní události: schválení českého AI školského zákona v Q3 2026, uvedení první CSRD reportovací sezony v první polovině 2027 s daty za 2026 (kde se AI Scope 3 poprvé objeví v povinném reportingu) a rozhodnutí o přímých investicích do českých datacenter (Google Jihlava, Microsoft Mošnov, Amazon Praha-západ). Na globální úrovni bude zajímavá AI Safety Summit v Barceloně 13.–14. 11. 2026, kde má 32 zemí projednat kompatibilitu EU, US a čínského pojetí AI bezpečnosti.
Závěr: lepší nástroj, horší infrastruktura
Stanford AI Index 2026 dokládá realitu, která je paradoxní, ale logická. AI je v roce 2026 schopnějším nástrojem než kdykoliv dřív — HLE 50+, Arena Elo 1480, agentní úlohy 72 %, klinické LLM na úrovni PhD ve 5 oblastech. Zároveň je průhlednější méně než kdykoliv dřív — FMTI pokles o 18 bodů, zmizení vodní stopy z reportů, koncentrace financování v 4 firmách. A důvěra veřejnosti v AI firmy je nižší než kdy dřív — 47 %, pokles 14 bodů za 24 měsíců.
Pro firmu, která v roce 2026 zvažuje nákup nebo rozšíření AI, to znamená jedno praktické pravidlo: oddělte schopnost od důvěryhodnosti. Schopnější model neznamená lepší dodavatele. Pohybovat se v AI trhu 2026 znamená mít technickou evaluaci (benchmarky, tasks, cost), ale také governance evaluaci (FMTI, data residency, incident response, regulatorní compliance). Firmy, které zvládnou obojí, získají kompetitivní výhodu. Firmy, které si vyberou jen jedno — obvykle to technické — se v horizontu 18 měsíců dostanou do problémů, které se nebudou měřit v ušetřených tokenech, ale v regulatorních pokutách, pojistných rizicích a reputačních ztrátách.
AI Index 2026 to říká mezi řádky, ale jasně: Doba, kdy se AI prodávala sama na demo páteční odpoledne, skončila. Začala doba, kdy se AI musí prodávat auditním výborem, právníky a reputačními specialisty.
Často kladené otázky
Co je Stanford AI Index 2026 a kdo ho píše?
Stanford AI Index je nejrozsáhlejší výroční datová zpráva o stavu AI, publikovaná Stanford Institute for Human-Centered Artificial Intelligence (HAI). Edici 2026 (vydána 13. 4. 2026) vedli Ray Perrault a Yolanda Gil, s přispěním desítek výzkumníků a spolupracujících organizací jako Epoch AI, OECD AI, Lightcast a MIT Digital Economy Lab. Obsahuje 9 kapitol, 400+ grafů a přes 200 datových sad. Slouží jako referenční dokument pro regulátory, akademiky a enterprise strategy týmy.
Co znamená skok na benchmarku HLE z 8,8 % na 50+ %?
Humanity's Last Exam (HLE) je benchmark s 2 500 otázkami z 100 akademických oborů na úrovni PhD, navržený tak, aby byl těžký i pro expertní publikum. V lednu 2025 na něm nejlepší model skóroval 8,8 %, v lednu 2026 překročil hranici 50 %. Za 12 měsíců tak došlo k růstu o přibližně 41 procentních bodů, což je historicky nejrychlejší zlepšení na jakémkoli benchmarku. Znamená to, že frontier modely dokážou správně odpovědět na polovinu extrémně obtížných otázek, na které průměrný expert odpovídá 70–80 %.
Proč je rozdíl 2,7 % mezi USA a Čínou zavádějící?
Rozdíl 2,7 procentního bodu v Chatbot Arena Elo mezi nejlepším americkým a nejlepším čínským modelem je pravdivá, ale úzká metrika. Arena měří preference uživatelů při krátkých chatovacích úlohách v angličtině a čínštině. Nerozlišuje spolehlivost na dlouhých agentních úlohách (kde čínské modely ztrácejí ~8 %), bezpečnostní alignment, cenu inference, firemní integraci nebo širší jazykové pokrytí. Při započtení HLE, SWE-Bench Verified a GPQA-Diamond je reálný odstup americké špičky 6–11 % a strukturálně stabilní. Čína naopak vede v počtu AI patentů (8,6×), instalaci průmyslových robotů a počtu publikací — ale v kvalitativních metrikách zaostává.
Co je FMTI a proč poklesl z 58 na 40?
Foundation Model Transparency Index (FMTI) je metodika Stanford HAI, která hodnotí 100 aspektů transparentnosti u vývojářů foundation modelů: trénovací data, práce lidských anotátorů, výpočetní zdroje, evaluace, politika rizik, distribuce, dopady na trh práce a životní prostředí. Průměrné skóre frontier labů pokleslo z 58/100 v roce 2023 na 40/100 v roce 2025. Důvody: výraznější konkurence mezi labi, obavy z autorských žalob (NYT vs. OpenAI), komerční tajemství o tréninkovém mixu, regulatorní defenziva. V reálném výsledku to znamená, že firma nemůže u svého AI dodavatele dohledat, na čem byl model trénován, kolik spotřeboval energie nebo jak se chová na minoritních evaluacích.
Jaké jsou 3 nejdůležitější důsledky AI Indexu 2026 pro českou firmu?
Za prvé dodavatelský audit: u AI dodavatelů s FMTI pod 50 bodů je nutné kontraktuálně vyžadovat auditní právo a model card commitment, jinak firma nesplní CSRD Scope 3 reporting. Za druhé multi-model strategie: rozdíl mezi top-1 a top-10 modelem je 5,3 %, ale cenový rozdíl 20×, tj. monopol jednoho dodavatele je ekonomicky neracionální. Za třetí regulatorní timeline: 2. 8. 2026 registrace high-risk AI podle EU Act Annex III, 1. 1. 2027 rozšíření CSRD na SME (obrat nad 40 mil. Kč), Q3 2026 český zákon o AI ve školství. Kdo začne přípravu v Q2 2026, zvládne termíny v klidu. Kdo ne, bude vyjednávat pod tlakem.
Primární zdroje
- Stanford HAI — AI Index Report 2026 (publikováno 13. 4. 2026)
- Stanford CRFM — Foundation Model Transparency Index 2025
- LMSYS Chatbot Arena — leaderboard (duben 2026)
- Epoch AI — Notable Models Database 2025
- OECD AI Incidents Database
- Center for AI Safety — Humanity's Last Exam
- Edelman AI Trust Barometer 2025
- International Energy Agency — Energy and AI, 2025
- MIT Digital Economy Lab — Consumer Surplus GenAI, 2026
- Crunchbase — AI Funding Q1 2026
- humai.blog — US-China AI gap analysis, 14. 4. 2026
- Lightcast — AI Jobs Report 2025
- OECD AI Policy Observatory
- Artificial Analysis — Model Performance Benchmarks, 2026