AI a čeština: Co funguje, co ne a jak to otestovat
Na stejném testu dosáhla AI v angličtině 70,9 % — a v češtině jen 55,3 %. Patnáct bodů. Tolik ztrácí čeština oproti angličtině v benchmarcích jazykových modelů. A to není vše: za stejnou práci zaplatíte v češtině 1,5× až 2,5× víc tokenů, protože české slovo se v tokenizéru často rozpadne na víc částí než anglické. Výsledek? Horší kvalita za vyšší cenu. Jenže většina českých uživatelů AI o tomhle netuší — a místo systematického testování se spoléhá na pocit, že „to je dobrý". Tento článek vysvětluje, proč je čeština pro AI objektivně těžší než angličtina, kde konkrétně modely chybují, který model je v češtině nejlepší — a přináší 8bodový test, kterým si za 10 minut ověříte, jak dobře vaše AI češtinu skutečně zvládá.
TL;DR — Klíčová zjištění
- Měřitelný deficit: AI modely dosahují v češtině o 15+ procentních bodů horší výsledky než v angličtině. Příčiny jsou tři: tokenizace, morfologie a objem trénovacích dat.
- Tokenizace stojí peníze: České texty spotřebují 1,5–2,5× víc tokenů než anglické. To znamená vyšší náklady na API, rychlejší vyčerpání kontextového okna a nižší kvalitu u dlouhých úloh.
- 8bodový Český AI test: Praktický testovací protokol, který za 10 minut odhalí, jak dobře váš AI model zvládá češtinu — od skloňování přes idiomy po kulturní znalosti.
Proč je čeština pro AI těžší než angličtina
Všechny velké jazykové modely jsou v jádru anglické. GPT, Claude, Gemini — všechny byly primárně trénovány na anglických datech. Angličtina tvoří odhadem 60–80 % trénovacích korpusů, zatímco čeština se pohybuje v jednotkách promile. To má tři konkrétní, měřitelné důsledky.
Tokenizace — české slovo stojí víc
Tokenizér je software, který před zpracováním textu rozseká slova na menší části — tokeny. Protože je tokenizér trénovaný primárně na angličtině, anglická slova většinou zůstanou celá: „company" = 1 token. České slovo se ale často rozpadne na 2–3 části: „společnost" → „spol" + „ečnost" = 2 tokeny. Slovo „nejneobhospodařovatelnější"? To je pro tokenizér noční můra.
V praxi to znamená dvě věci. Za prvé, za stejnou práci zaplatíte víc — API poplatky se počítají za tokeny, takže český text stojí 1,5–2,5× víc než anglický. Za druhé, rychleji vyčerpáte kontextové okno. Pokud model má limit 128 000 tokenů, v angličtině se do něj vejde zhruba 96 000 slov. V češtině jen 50 000–65 000. A kratší kontext znamená horší kvalitu u složitějších úloh — model „zapomíná" dřív.
Morfologie — 7 pádů, 14 vzorů, volný slovosled
Angličtina je analytický jazyk — vztahy mezi slovy vyjadřuje slovosledem a předložkami. „The dog sees the cat" — pořadí slov určuje, kdo koho vidí. Čeština je flektivní — stejnou informaci nese koncovka slova. „Pes vidí kočku" = „Kočku vidí pes" — obojí znamená totéž, protože koncovka „-u" označuje předmět.
Pro AI je tohle zásadní problém. Model musí zvládnout 7 pádů (nominativ, genitiv, dativ, akuzativ, vokativ, lokál, instrumentál), 14 deklinačních vzorů pro podstatná jména a ještě hláskové alternace — zámek → v zámcích, kniha → v knize, moucha → s mouškou. Každá z těchto změn vyžaduje znalost gramatických pravidel, která se v angličtině jednoduše nevyskytují. A protože model nemá gramatiku — pouze statistické vzory z trénovacích dat — chyby v koncovkách jsou nejčastějším typem české AI chyby.
Objem dat — angličtina je 100× větší
Internet je anglický. Odhadem 55–60 % veškerého webového obsahu je v angličtině, čeština představuje zhruba 0,5 %. Pro jazykový model to znamená, že na angličtině viděl stovky miliard slov — a na češtině řádově miliardy. Méně dat = méně vzorů = víc chyb. Zvlášť u specializovaného obsahu — právní texty, technická dokumentace, regionální terminologie — může být česká datová základna kriticky malá.
Tokenizace v číslech
Projekt Occiglot analyzoval tokenizační efektivitu pro evropské jazyky a stanovil práh 2,0 „fertility" (poměr tokenů k slovům) jako cíl pro bilingvální modely. Většina komerčních modelů tento práh pro slovanské jazyky překračuje. Praktický důsledek: pokud pracujete s AI přes API v češtině, počítejte s 50–150 % vyššími náklady oproti anglickému ekvivalentu.
Kde AI v češtině funguje — a kde selhává
Česká AI není úplně špatná — je nerovnoměrná. Na některých úlohách funguje skoro stejně dobře jako v angličtině. Na jiných selhává způsobem, který je pro rodilého mluvčího okamžitě viditelný. Rozdíl je v tom, jak moc daná úloha závisí na gramatické přesnosti a kulturním kontextu.
| Typ úlohy | Kvalita v češtině | Typické problémy |
|---|---|---|
| Konverzace a brainstorming | ★★★★☆ Velmi dobrá | Občas nepřirozené obraty, ale celkově plynulá čeština |
| Shrnutí textu | ★★★★☆ Velmi dobrá | Někdy přílišná formálnost, ale faktická přesnost OK |
| Překlad EN → CZ | ★★★★☆ Velmi dobrá | Konkurenceschopný s DeepL, občas doslovný překlad idiomů |
| Kód s českými komentáři | ★★★☆☆ Dobrá | Kód OK, české komentáře někdy nepřirozené |
| Formální dopisy a e-maily | ★★★☆☆ Dobrá | Chyby v oslovení, nekonzistentní vykání/tykání |
| Kreativní psaní | ★★★☆☆ Dobrá | Příliš „překladová" čeština, chybějící české reálie |
| Odborné texty (právo, medicína) | ★★☆☆☆ Slabá | Nesprávná terminologie, anglické calky, chyby v pádech |
| Idiomy a přísloví | ★★☆☆☆ Slabá | Doslovný překlad z angličtiny, neznalost českých frazémů |
| České kulturní znalosti | ★☆☆☆☆ Velmi slabá | Halucinace, záměny slovenštiny, neznalost reálií |
| Český humor a ironie | ★☆☆☆☆ Velmi slabá | Model nezná české kulturní reference, vtip nefunguje |
Typické české chyby AI — příklady z praxe
Následující chyby nejsou teoretické — objevují se v reálných výstupech komerčních modelů při běžné práci v češtině.
7 typů chyb, které AI v češtině dělá nejčastěji
1. Špatné pády po předložkách: „Děkuji za vaší pomoc" (správně: „vaši pomoc" — akuzativ, ne instrumentál). AI často zaměňuje akuzativ a instrumentál u ženského rodu.
2. Anglický slovosled: „To je důležité pro firmu udělat" místo „Pro firmu je důležité to udělat." AI kopíruje anglickou strukturu Subject-Verb-Object i tam, kde čeština preferuje jiné pořadí.
3. Chybějící nebo špatná diakritika: „Práce s umělou inteligenci" (správně: „inteligencí"). Háčky a čárky na koncovkách rozlišují pády — AI to občas ignoruje.
4. Nekonzistentní vykání: Text začne vykáním („můžete"), přepne do tykání („zkus"), pak zpět. U delších textů je tato nekonzistence velmi častá.
5. Překladové calky: „Dělat smysl" místo „dávat smysl". „Být na stejné stránce" místo „být na stejné vlně" nebo „být zajedno". AI doslovně překládá anglické fráze.
6. Záměna slovenštiny a češtiny: „Pracovisko" místo „pracoviště". „Pohľad" místo „pohled". Zvlášť u menších modelů se slovenština občas vmísí do českého textu.
7. Neznalost českých konvencí: Formátování data jako „April 7, 2026" místo „7. dubna 2026". Telefonní čísla bez české předvolby. Měna v dolarech místo v korunách.
BenCzechMark — jak se objektivně měří kvalita AI v češtině
Jak vlastně víme, že AI v češtině zaostává? Díky práci českých výzkumníků, kteří vytvořili první komplexní benchmark navržený speciálně pro hodnocení jazykových modelů v češtině. BenCzechMark (BCM), publikovaný v prestižním časopise Transactions of the Association for Computational Linguistics, přinesl do diskuze o AI v češtině něco, co tu dosud chybělo — tvrdá data.
Benchmark zahrnuje 50 úloh ve 8 kategoriích — od porozumění textu přes gramatiku a znalosti až po generování a klasifikaci. Klíčové je, že 14 z těchto úloh bylo vytvořeno speciálně pro češtinu a testuje věci, které se v angličtině vůbec nevyskytují: správné skloňování, použití pádů po předložkách nebo znalost českých historických událostí.
Za projektem stojí CZLC — Czech LLM Consortium, skupina českých výzkumníků, kteří se zaměřují na zlepšení AI pro češtinu. Součástí projektu je i BUT-Large Czech Collection, největší veřejně dostupný čistý český jazykový korpus, který slouží jako základ pro trénování nových modelů s lepší českou podporou.
Na leaderboardu BenCzechMark (huggingface.co/spaces/CZLC/BenCzechMark) bylo v době psaní článku hodnoceno přes 50 modelů. Výsledky potvrzují to, co čeští uživatelé intuitivně cítí — i nejlepší modely mají v češtině prostor ke zlepšení, zvlášť u úloh vyžadujících gramatickou přesnost a kulturní znalosti.
Který model je v češtině nejlepší — praktické srovnání 2026
Žádný model není v češtině jednoznačně nejlepší ve všem. Záleží na úloze. Následující srovnání vychází z kombinace benchmarkových dat, testů české komunity a praktických zkušeností s reálným nasazením.
| Model | Gramatika CZ | Kreativní CZ | Odborné CZ | Cena (tokeny) | Celkový verdikt |
|---|---|---|---|---|---|
| Claude Opus 4.6 | ★★★★★ | ★★★★☆ | ★★★★☆ | $$$ | Nejlepší čeština celkově |
| GPT-5.4 | ★★★★☆ | ★★★★☆ | ★★★☆☆ | $$ | Dobrá čeština, občas formální |
| Gemini 3.1 Pro | ★★★★☆ | ★★★☆☆ | ★★★★☆ | $$ | Silný v analýze, slabší kreativa |
| Claude Sonnet 4.6 | ★★★★☆ | ★★★☆☆ | ★★★☆☆ | $ | Nejlepší poměr cena/kvalita |
| DeepSeek V3 | ★★★☆☆ | ★★★☆☆ | ★★★☆☆ | $ | Překvapivě slušná čeština za zlomek ceny |
| Llama 4 (lokální) | ★★☆☆☆ | ★★☆☆☆ | ★☆☆☆☆ | Zdarma | Pro rychlé úlohy OK, na kvalitní češtinu ne |
Kdy který model v češtině?
Pro nejlepší gramatiku: Claude Opus 4.6 — konzistentně nejpřesnější pády, nejpřirozenější slovosled. Pro nejlepší poměr cena/výkon: Claude Sonnet 4.6 nebo GPT-5.4. Pro dlouhé analýzy: Gemini 3.1 Pro (1M tokenový kontext). Pro soukromá data: lokální modely přes Ollama — ale počítejte s výrazně horší gramatikou. Podrobnější srovnání modelů najdete v článku ChatGPT vs Claude vs Gemini. Kompletní rozhodovací framework pro výběr AI modelu (nejen podle jazyka, ale i ceny, úkolu a latence) nabízí Jak vybrat správný AI model pro váš úkol.
8bodový Český AI test — ověřte si kvalitu za 10 minut
Místo spekulací a pocitů nabízíme konkrétní testovací protokol. Zadejte svému AI modelu následujících 8 promptů a ohodnoťte odpovědi. Celý test zabere maximálně 10 minut a ukáže přesně, kde má váš model v češtině silné a slabé stránky.
Hodnocení: Za každý prompt dejte 0–2 body (0 = zásadní chyby, 1 = drobné nepřesnosti, 2 = perfektní). Skóre 14–16: model má výbornou češtinu. 10–13: dobrý pro běžnou práci, ale pozor u formálních textů. 6–9: slabá čeština, vždy kontrolovat. 0–5: pro seriózní českou práci nevhodný.
Doplň správné tvary do věty:
„Šel jsem do obchodu s ____ (kamarád, mn. č., instrumentál) a koupili jsme dárek pro ____ (učitelka, j. č., akuzativ) od ____ (student, mn. č., genitiv)."
Správně: „...s kamarády...pro učitelku...od studentů."
Jak z AI dostat lepší češtinu — praktické tipy
Znát problém je polovina řešení. Druhá polovina jsou konkrétní techniky, které kvalitu českého výstupu prokazatelně zlepšují. Žádná z nich nevyžaduje technické znalosti — stačí upravit způsob, jakým s AI komunikujete.
Promptovat v češtině, nebo v angličtině?
Překvapivě — záleží na úloze. Pro generování českého textu promptujte v češtině. Model pak „myslí" v češtině od začátku a neprovádí interní překlad. Výsledek je přirozenější. Pro analytické a logické úlohy může být anglický prompt lepší — model má v angličtině silnější reasoning schopnosti. Kompromis: zadejte instrukce v angličtině, ale přidejte „Answer in Czech" a ukázkový text v češtině. Kombinace anglické preciznosti a českého výstupu často dává nejlepší výsledky.
Systémový prompt pro kvalitní češtinu
Piš v přirozené, plynulé češtině. Dodržuj tato pravidla:
1. Konzistentní vykání v celém textu.
2. Správné skloňování ve všech pádech — zvlášť po předložkách (s + instrumentál, pro + akuzativ, od + genitiv).
3. Český slovosled — ne anglický vzor Subject-Verb-Object.
4. České discourse markers: tedy, přitom, ostatně, zkrátka, koneckonců, nicméně.
5. České konvence: data ve formátu „7. dubna 2026", měna v Kč, telefonní čísla s +420.
6. Žádné překladové calky: ne „dělat smysl", ano „dávat smysl". Ne „na konci dne", ano „v konečném důsledku".
7. Krátké odstavce, variabilní délka vět. Střídej jednoduché věty se souvětími.
Few-shot příklady v češtině
Jedna z nejúčinnějších technik: přidejte do promptu ukázku požadovaného stylu. Stačí 2–3 odstavce textu, který odpovídá tónu a kvalitě, jakou očekáváte. AI je výborné v napodobování vzorů — a pokud dostane vzor v kvalitní češtině, výstup se dramaticky zlepší. Podrobně se tímto přístupem zabývá článek Jak dostat z AI text, který nezní jako robot.
Iterativní zpětná vazba
Neočekávejte perfektní výsledek na první pokus. Nejlepší výsledky přináší feedback loop: vygenerujte text → identifikujte konkrétní chyby → řekněte AI, co opravit → zopakujte. Klíčové je být konkrétní: ne „oprav gramatiku", ale „ve třetím odstavci je špatný pád po předložce ‚s' — má být instrumentál". Čím přesnější zpětná vazba, tím lepší korekce.
Zákeřný test přirozené češtiny
Chcete rychle zjistit, jestli AI text zní přirozeně? Přečtěte si ho nahlas. Lidský mozek okamžitě zachytí nepřirozený slovosled, chybějící discourse markers a příliš formální obraty — věci, které při tichém čtení snadno přehlédnete. Pokud se při hlasitém čtení zakoknete, model potřebuje lepší instrukce.
České AI nástroje a budoucnost češtiny v AI
Čeština v AI není odsouzena k roli občana druhé kategorie. Na zlepšení pracuje několik paralelních iniciativ — od akademických projektů přes komerční nástroje až po vládní programy.
Česky.AI nabízí nejkvalitnější přepis mluvené češtiny — řeč-na-text s podporou českých specifik (diakritika, vlastní jména, odborná terminologie). Pro přepis porad, rozhovorů a přednášek je aktuálně nejlepší volba na trhu.
CZLC — Czech LLM Consortium je akademická iniciativa sdružující české výzkumníky na HuggingFace. Kromě BenCzechMark benchmarku vytvořili BUT-Large Czech Collection (největší čistý český korpus) a pracují na prvním českém 7B modelu s tokenizací optimalizovanou pro češtinu. Ten by měl dramaticky zlepšit poměr tokenů — a tedy i cenu a kvalitu.
OpenEuroLLM je mezinárodní projekt s účastí Česka, jehož cílem je vytvořit jazykové modely pro všechny evropské jazyky. Česká vláda projekt podporuje jako součást strategie digitální jazykové suverenity.
Seznam.cz investuje do vlastních českých embedding modelů a continued pretraining na čistých českých datech. Pro e-commerce a vyhledávání v češtině představují tyto modely zajímavou alternativu k mezinárodním řešením.
Do konce roku 2026 se situace výrazně změní. Kombinace českého 7B modelu (CZLC), lepší tokenizace v nových verzích komerčních modelů a rostoucího objemu kvalitních českých trénovacích dat znamená, že dosavadní 15bodový deficit se bude zmenšovat. Nezanikne úplně — angličtina bude mít vždy datovou převahu — ale pro většinu praktických úloh bude čeština „dostatečně dobrá" i bez speciálních obezliček. Do té doby: testujte, kontrolujte, používejte systémové prompty. Pokud se chcete systematicky připravit na práci s českými AI nástroji, je klíčové si osvojit dovednosti potřebné pro efektivní používání AI v praxi.
Často kladené otázky
Je lepší promptovat v češtině, nebo v angličtině?
Záleží na úloze. Pro generování českého textu (články, e-maily, copy) promptujte v češtině — model pak „myslí" v češtině od začátku. Pro analytické úlohy (kód, logika, matematika) může být anglický prompt s instrukcí „odpověz v češtině" efektivnější, protože reasoning schopnosti jsou v angličtině silnější. Nejlepší praxe: instrukce v angličtině + ukázkový text v češtině.
Který AI model nejlépe zvládá české pády a skloňování?
Claude Opus 4.6 je v roce 2026 konzistentně nejpřesnější v české gramatice — správné pády po předložkách, minimální chyby v koncovkách, přirozený slovosled. GPT-5.4 je blízko, ale občas sklouzne k formálnějšímu tónu. Pro nejlepší poměr cena/výkon je Claude Sonnet 4.6 solidní volba s mírně nižší gramatickou precizností.
Kolik stojí práce s AI v češtině oproti angličtině?
Přibližně 1,5–2,5× více. Český text spotřebuje kvůli tokenizaci víc tokenů — a API poplatky se počítají za tokeny. Na 10 000 slovech je to rozdíl zhruba $0,50–$1,50 u nejlepších modelů. Pro měsíční produkci obsahu (řekněme 50 000 slov) se jedná o desítky dolarů navíc. Placeným uživatelům (ChatGPT Plus, Claude Pro) se token limit vyčerpá rychleji — v praxi dostanete z předplatného méně českého textu než anglického.
Existuje AI model trénovaný přímo na češtině?
Ano, ale zatím v akademické fázi. CZLC (Czech LLM Consortium) vytvořil první český 7B model s českou tokenizací, ale ten zatím nedosahuje kvality komerčních modelů na obecných úlohách. Seznam.cz má interní české modely pro embedding a vyhledávání. OpenEuroLLM projekt s českou účastí pracuje na vícejazyčných modelech. Pro produkční nasazení jsou v roce 2026 stále nejlepší komerční modely (Claude, GPT, Gemini) s kvalitními českými systémovými prompty.
Jak poznám, že AI udělalo chybu v českém textu?
Přečtěte si text nahlas. Nepřirozený slovosled, špatné pády a chybějící discourse markers okamžitě vyniknou při hlasitém čtení. Dále sledujte: nekonzistentní vykání/tykání (časté u delších textů), překladové calky („dělat smysl" místo „dávat smysl"), anglický formát dat a měny, a záměnu slovenštiny s češtinou. Pro systematické testování použijte 8bodový Český AI test z tohoto článku.
Zdroje a reference
- BenCzechMark: A Czech-centric Multitask and Multimetric Benchmark — TACL / MIT Press (2025), arxiv.org/abs/2412.17933
- Multilingual Performance Biases of Large Language Models in Education — arxiv.org/abs/2504.17720 (2025), English 70.9 % vs Czech 55.3 %
- Occiglot: EU Tokenizer Performance Analysis — occiglot.eu/posts/eu_tokenizer_performance (2024)
- Tokenization efficiency of current foundational LLMs — Frontiers in AI (2025), PMC/12380774
- CZLC (Czech LLM Consortium) — huggingface.co/CZLC, BUT-Large Czech Collection
- A survey of multilingual large language models — Patterns / Cell Press (2024), doi.org/10.1016/j.patter.2024.101103
- Evaluating LLMs for natural-language-to-code generation on Czech public health data — medRxiv (2025)
- Czech-Spanish translation quality: DeepL, Google Translate, ChatGPT — Études romanes de Brno (2025)
- Havel & Partners: How will AI language models cope with Czech law? — havelpartners.blog (2025)
- OpenEuroLLM — ollama.com/jobautomation/OpenEuroLLM-Czech
- Seznam.cz: Czech semantic embedding models — github.com/seznam/czech-semantic-embedding-models
- Živě.cz: Která AI je nejlepší? Gemini 3.1 Pro vs Claude Opus 4.6 (2026)