AI a čeština: Co funguje, co ne a jak to otestovat

· 22 min čtení · Kategorie: Umělá inteligence
AI a čeština: Co funguje, co ne a jak to otestovat

Na stejném testu dosáhla AI v angličtině 70,9 % — a v češtině jen 55,3 %. Patnáct bodů. Tolik ztrácí čeština oproti angličtině v benchmarcích jazykových modelů. A to není vše: za stejnou práci zaplatíte v češtině 1,5× až 2,5× víc tokenů, protože české slovo se v tokenizéru často rozpadne na víc částí než anglické. Výsledek? Horší kvalita za vyšší cenu. Jenže většina českých uživatelů AI o tomhle netuší — a místo systematického testování se spoléhá na pocit, že „to je dobrý". Tento článek vysvětluje, proč je čeština pro AI objektivně těžší než angličtina, kde konkrétně modely chybují, který model je v češtině nejlepší — a přináší 8bodový test, kterým si za 10 minut ověříte, jak dobře vaše AI češtinu skutečně zvládá.

TL;DR — Klíčová zjištění

  • Měřitelný deficit: AI modely dosahují v češtině o 15+ procentních bodů horší výsledky než v angličtině. Příčiny jsou tři: tokenizace, morfologie a objem trénovacích dat.
  • Tokenizace stojí peníze: České texty spotřebují 1,5–2,5× víc tokenů než anglické. To znamená vyšší náklady na API, rychlejší vyčerpání kontextového okna a nižší kvalitu u dlouhých úloh.
  • 8bodový Český AI test: Praktický testovací protokol, který za 10 minut odhalí, jak dobře váš AI model zvládá češtinu — od skloňování přes idiomy po kulturní znalosti.
ANGLIČTINA The company achieved great results in the first quarter. ↓ Tokenizace ↓ The company achieved great results in the first quarter . 9 tokenů = $0.0003 ČEŠTINA Společnost dosáhla skvělých výsledků v prvním čtvrtletí. ↓ Tokenizace ↓ Spol ečnost dos áhla skv ělých výsl edků v prvn ím čtvrt letí . 14 tokenů = $0.0005 +56 % tokenů za stejnou informaci Na dlouhém textu je rozdíl ještě větší.
15,6 pp
o tolik horší výsledky dosahuje AI v češtině oproti angličtině na vzdělávacích úlohách
Multilingual Performance Biases of LLMs 2025
1,5–2,5×
více tokenů spotřebuje čeština oproti angličtině pro stejný obsah
Occiglot Tokenizer Analysis
7 pádů
a 14 deklinačních vzorů — čeština má jednu z nejsložitějších morfologií v Evropě
Czech Linguistic Typology
50 úloh
obsahuje BenCzechMark — první komplexní benchmark AI pro češtinu
CZLC / TACL 2025

Proč je čeština pro AI těžší než angličtina

Všechny velké jazykové modely jsou v jádru anglické. GPT, Claude, Gemini — všechny byly primárně trénovány na anglických datech. Angličtina tvoří odhadem 60–80 % trénovacích korpusů, zatímco čeština se pohybuje v jednotkách promile. To má tři konkrétní, měřitelné důsledky.

Tokenizace — české slovo stojí víc

Tokenizér je software, který před zpracováním textu rozseká slova na menší části — tokeny. Protože je tokenizér trénovaný primárně na angličtině, anglická slova většinou zůstanou celá: „company" = 1 token. České slovo se ale často rozpadne na 2–3 části: „společnost" → „spol" + „ečnost" = 2 tokeny. Slovo „nejneobhospodařovatelnější"? To je pro tokenizér noční můra.

V praxi to znamená dvě věci. Za prvé, za stejnou práci zaplatíte víc — API poplatky se počítají za tokeny, takže český text stojí 1,5–2,5× víc než anglický. Za druhé, rychleji vyčerpáte kontextové okno. Pokud model má limit 128 000 tokenů, v angličtině se do něj vejde zhruba 96 000 slov. V češtině jen 50 000–65 000. A kratší kontext znamená horší kvalitu u složitějších úloh — model „zapomíná" dřív.

Morfologie — 7 pádů, 14 vzorů, volný slovosled

Angličtina je analytický jazyk — vztahy mezi slovy vyjadřuje slovosledem a předložkami. „The dog sees the cat" — pořadí slov určuje, kdo koho vidí. Čeština je flektivní — stejnou informaci nese koncovka slova. „Pes vidí kočku" = „Kočku vidí pes" — obojí znamená totéž, protože koncovka „-u" označuje předmět.

Pro AI je tohle zásadní problém. Model musí zvládnout 7 pádů (nominativ, genitiv, dativ, akuzativ, vokativ, lokál, instrumentál), 14 deklinačních vzorů pro podstatná jména a ještě hláskové alternace — zámek → v zámcích, kniha → v knize, moucha → s mouškou. Každá z těchto změn vyžaduje znalost gramatických pravidel, která se v angličtině jednoduše nevyskytují. A protože model nemá gramatiku — pouze statistické vzory z trénovacích dat — chyby v koncovkách jsou nejčastějším typem české AI chyby.

Objem dat — angličtina je 100× větší

Internet je anglický. Odhadem 55–60 % veškerého webového obsahu je v angličtině, čeština představuje zhruba 0,5 %. Pro jazykový model to znamená, že na angličtině viděl stovky miliard slov — a na češtině řádově miliardy. Méně dat = méně vzorů = víc chyb. Zvlášť u specializovaného obsahu — právní texty, technická dokumentace, regionální terminologie — může být česká datová základna kriticky malá.

Tokenizace v číslech

Projekt Occiglot analyzoval tokenizační efektivitu pro evropské jazyky a stanovil práh 2,0 „fertility" (poměr tokenů k slovům) jako cíl pro bilingvální modely. Většina komerčních modelů tento práh pro slovanské jazyky překračuje. Praktický důsledek: pokud pracujete s AI přes API v češtině, počítejte s 50–150 % vyššími náklady oproti anglickému ekvivalentu.

Kde AI v češtině funguje — a kde selhává

Česká AI není úplně špatná — je nerovnoměrná. Na některých úlohách funguje skoro stejně dobře jako v angličtině. Na jiných selhává způsobem, který je pro rodilého mluvčího okamžitě viditelný. Rozdíl je v tom, jak moc daná úloha závisí na gramatické přesnosti a kulturním kontextu.

Typ úlohy Kvalita v češtině Typické problémy
Konverzace a brainstorming ★★★★☆ Velmi dobrá Občas nepřirozené obraty, ale celkově plynulá čeština
Shrnutí textu ★★★★☆ Velmi dobrá Někdy přílišná formálnost, ale faktická přesnost OK
Překlad EN → CZ ★★★★☆ Velmi dobrá Konkurenceschopný s DeepL, občas doslovný překlad idiomů
Kód s českými komentáři ★★★☆☆ Dobrá Kód OK, české komentáře někdy nepřirozené
Formální dopisy a e-maily ★★★☆☆ Dobrá Chyby v oslovení, nekonzistentní vykání/tykání
Kreativní psaní ★★★☆☆ Dobrá Příliš „překladová" čeština, chybějící české reálie
Odborné texty (právo, medicína) ★★☆☆☆ Slabá Nesprávná terminologie, anglické calky, chyby v pádech
Idiomy a přísloví ★★☆☆☆ Slabá Doslovný překlad z angličtiny, neznalost českých frazémů
České kulturní znalosti ★☆☆☆☆ Velmi slabá Halucinace, záměny slovenštiny, neznalost reálií
Český humor a ironie ★☆☆☆☆ Velmi slabá Model nezná české kulturní reference, vtip nefunguje

Typické české chyby AI — příklady z praxe

Následující chyby nejsou teoretické — objevují se v reálných výstupech komerčních modelů při běžné práci v češtině.

7 typů chyb, které AI v češtině dělá nejčastěji

1. Špatné pády po předložkách: „Děkuji za vaší pomoc" (správně: „vaši pomoc" — akuzativ, ne instrumentál). AI často zaměňuje akuzativ a instrumentál u ženského rodu.

2. Anglický slovosled: „To je důležité pro firmu udělat" místo „Pro firmu je důležité to udělat." AI kopíruje anglickou strukturu Subject-Verb-Object i tam, kde čeština preferuje jiné pořadí.

3. Chybějící nebo špatná diakritika: „Práce s umělou inteligenci" (správně: „inteligencí"). Háčky a čárky na koncovkách rozlišují pády — AI to občas ignoruje.

4. Nekonzistentní vykání: Text začne vykáním („můžete"), přepne do tykání („zkus"), pak zpět. U delších textů je tato nekonzistence velmi častá.

5. Překladové calky: „Dělat smysl" místo „dávat smysl". „Být na stejné stránce" místo „být na stejné vlně" nebo „být zajedno". AI doslovně překládá anglické fráze.

6. Záměna slovenštiny a češtiny: „Pracovisko" místo „pracoviště". „Pohľad" místo „pohled". Zvlášť u menších modelů se slovenština občas vmísí do českého textu.

7. Neznalost českých konvencí: Formátování data jako „April 7, 2026" místo „7. dubna 2026". Telefonní čísla bez české předvolby. Měna v dolarech místo v korunách.

BenCzechMark — jak se objektivně měří kvalita AI v češtině

Jak vlastně víme, že AI v češtině zaostává? Díky práci českých výzkumníků, kteří vytvořili první komplexní benchmark navržený speciálně pro hodnocení jazykových modelů v češtině. BenCzechMark (BCM), publikovaný v prestižním časopise Transactions of the Association for Computational Linguistics, přinesl do diskuze o AI v češtině něco, co tu dosud chybělo — tvrdá data.

BenCzechMark — 8 kategorií, 50 úloh pro hodnocení AI v češtině
BCM 50 úloh Porozumění textu čtení, QA, inference Znalosti historie, geografie, právo Gramatika pády, shoda, diakritika Reasoning logika, matematika Generování překlad, parafraze, styl Sentiment analýza tónu, emocí Sumarizace zprávy, dokumenty Klasifikace kategorie, NER, detekce

Benchmark zahrnuje 50 úloh ve 8 kategoriích — od porozumění textu přes gramatiku a znalosti až po generování a klasifikaci. Klíčové je, že 14 z těchto úloh bylo vytvořeno speciálně pro češtinu a testuje věci, které se v angličtině vůbec nevyskytují: správné skloňování, použití pádů po předložkách nebo znalost českých historických událostí.

Za projektem stojí CZLC — Czech LLM Consortium, skupina českých výzkumníků, kteří se zaměřují na zlepšení AI pro češtinu. Součástí projektu je i BUT-Large Czech Collection, největší veřejně dostupný čistý český jazykový korpus, který slouží jako základ pro trénování nových modelů s lepší českou podporou.

Na leaderboardu BenCzechMark (huggingface.co/spaces/CZLC/BenCzechMark) bylo v době psaní článku hodnoceno přes 50 modelů. Výsledky potvrzují to, co čeští uživatelé intuitivně cítí — i nejlepší modely mají v češtině prostor ke zlepšení, zvlášť u úloh vyžadujících gramatickou přesnost a kulturní znalosti.

Který model je v češtině nejlepší — praktické srovnání 2026

Žádný model není v češtině jednoznačně nejlepší ve všem. Záleží na úloze. Následující srovnání vychází z kombinace benchmarkových dat, testů české komunity a praktických zkušeností s reálným nasazením.

Model Gramatika CZ Kreativní CZ Odborné CZ Cena (tokeny) Celkový verdikt
Claude Opus 4.6 ★★★★★ ★★★★☆ ★★★★☆ $$$ Nejlepší čeština celkově
GPT-5.4 ★★★★☆ ★★★★☆ ★★★☆☆ $$ Dobrá čeština, občas formální
Gemini 3.1 Pro ★★★★☆ ★★★☆☆ ★★★★☆ $$ Silný v analýze, slabší kreativa
Claude Sonnet 4.6 ★★★★☆ ★★★☆☆ ★★★☆☆ $ Nejlepší poměr cena/kvalita
DeepSeek V3 ★★★☆☆ ★★★☆☆ ★★★☆☆ $ Překvapivě slušná čeština za zlomek ceny
Llama 4 (lokální) ★★☆☆☆ ★★☆☆☆ ★☆☆☆☆ Zdarma Pro rychlé úlohy OK, na kvalitní češtinu ne

Kdy který model v češtině?

Pro nejlepší gramatiku: Claude Opus 4.6 — konzistentně nejpřesnější pády, nejpřirozenější slovosled. Pro nejlepší poměr cena/výkon: Claude Sonnet 4.6 nebo GPT-5.4. Pro dlouhé analýzy: Gemini 3.1 Pro (1M tokenový kontext). Pro soukromá data: lokální modely přes Ollama — ale počítejte s výrazně horší gramatikou. Podrobnější srovnání modelů najdete v článku ChatGPT vs Claude vs Gemini. Kompletní rozhodovací framework pro výběr AI modelu (nejen podle jazyka, ale i ceny, úkolu a latence) nabízí Jak vybrat správný AI model pro váš úkol.

8bodový Český AI test — ověřte si kvalitu za 10 minut

Místo spekulací a pocitů nabízíme konkrétní testovací protokol. Zadejte svému AI modelu následujících 8 promptů a ohodnoťte odpovědi. Celý test zabere maximálně 10 minut a ukáže přesně, kde má váš model v češtině silné a slabé stránky.

Český AI test — 8 kontrolních promptů
1. Skloňování (pády): „Vyskloňuj slovo ‚průvodce' ve všech 7 pádech v jednotném i množném čísle." → Kontrola: správné tvary ve všech pádech, zvlášť genitiv plurálu.
2. Shoda přísudku: „Napiš 5 vět, kde je podmět v množném čísle rodu ženského." → Kontrola: správná shoda přísudku s podmětem (děvčata přišly → přišla).
3. České idiomy: „Vysvětli, co znamená ‚nosit dříví do lesa', ‚být v čudu' a ‚mít pod čepicí'." → Kontrola: správný význam, ne doslovný překlad z angličtiny.
4. Kulturní znalosti: „Kdo byl Jára Cimrman a proč je důležitý pro českou kulturu?" → Kontrola: správná identifikace jako fiktivní postavy, kontext Divadla Járy Cimrmana.
5. Formální e-mail: „Napiš formální e-mail řediteli české firmy s žádostí o schůzku. Konzistentní vykání." → Kontrola: správné oslovení, konzistentní vykání, český formát data a pozdrav.
6. Zákeřné minimální páry: „Jaký je rozdíl mezi: ‚být' a ‚bít', ‚práce' (nom.) a ‚práci' (akuz.), ‚moře' a ‚moří'?" → Kontrola: správné rozlišení homonymů a pádových tvarů.
7. Odborný text: „Napiš odstavec o insolvečním řízení v ČR podle aktuální legislativy." → Kontrola: správná česká právní terminologie, ne anglické calky.
8. Kreativní psaní: „Napiš krátký odstavec v tónu Karla Čapka — téma: robot v české domácnosti." → Kontrola: přirozená čeština, stylizace, absence anglicismů.

Hodnocení: Za každý prompt dejte 0–2 body (0 = zásadní chyby, 1 = drobné nepřesnosti, 2 = perfektní). Skóre 14–16: model má výbornou češtinu. 10–13: dobrý pro běžnou práci, ale pozor u formálních textů. 6–9: slabá čeština, vždy kontrolovat. 0–5: pro seriózní českou práci nevhodný.

Ukázkový prompt — zákeřný test skloňování

Doplň správné tvary do věty:

„Šel jsem do obchodu s ____ (kamarád, mn. č., instrumentál) a koupili jsme dárek pro ____ (učitelka, j. č., akuzativ) od ____ (student, mn. č., genitiv)."

Správně: „...s kamarády...pro učitelku...od studentů."

Jak z AI dostat lepší češtinu — praktické tipy

Znát problém je polovina řešení. Druhá polovina jsou konkrétní techniky, které kvalitu českého výstupu prokazatelně zlepšují. Žádná z nich nevyžaduje technické znalosti — stačí upravit způsob, jakým s AI komunikujete.

Promptovat v češtině, nebo v angličtině?

Překvapivě — záleží na úloze. Pro generování českého textu promptujte v češtině. Model pak „myslí" v češtině od začátku a neprovádí interní překlad. Výsledek je přirozenější. Pro analytické a logické úlohy může být anglický prompt lepší — model má v angličtině silnější reasoning schopnosti. Kompromis: zadejte instrukce v angličtině, ale přidejte „Answer in Czech" a ukázkový text v češtině. Kombinace anglické preciznosti a českého výstupu často dává nejlepší výsledky.

Systémový prompt pro kvalitní češtinu

Šablona: systémový prompt pro přirozenou češtinu

Piš v přirozené, plynulé češtině. Dodržuj tato pravidla:

1. Konzistentní vykání v celém textu.

2. Správné skloňování ve všech pádech — zvlášť po předložkách (s + instrumentál, pro + akuzativ, od + genitiv).

3. Český slovosled — ne anglický vzor Subject-Verb-Object.

4. České discourse markers: tedy, přitom, ostatně, zkrátka, koneckonců, nicméně.

5. České konvence: data ve formátu „7. dubna 2026", měna v Kč, telefonní čísla s +420.

6. Žádné překladové calky: ne „dělat smysl", ano „dávat smysl". Ne „na konci dne", ano „v konečném důsledku".

7. Krátké odstavce, variabilní délka vět. Střídej jednoduché věty se souvětími.

Few-shot příklady v češtině

Jedna z nejúčinnějších technik: přidejte do promptu ukázku požadovaného stylu. Stačí 2–3 odstavce textu, který odpovídá tónu a kvalitě, jakou očekáváte. AI je výborné v napodobování vzorů — a pokud dostane vzor v kvalitní češtině, výstup se dramaticky zlepší. Podrobně se tímto přístupem zabývá článek Jak dostat z AI text, který nezní jako robot.

Iterativní zpětná vazba

Neočekávejte perfektní výsledek na první pokus. Nejlepší výsledky přináší feedback loop: vygenerujte text → identifikujte konkrétní chyby → řekněte AI, co opravit → zopakujte. Klíčové je být konkrétní: ne „oprav gramatiku", ale „ve třetím odstavci je špatný pád po předložce ‚s' — má být instrumentál". Čím přesnější zpětná vazba, tím lepší korekce.

Zákeřný test přirozené češtiny

Chcete rychle zjistit, jestli AI text zní přirozeně? Přečtěte si ho nahlas. Lidský mozek okamžitě zachytí nepřirozený slovosled, chybějící discourse markers a příliš formální obraty — věci, které při tichém čtení snadno přehlédnete. Pokud se při hlasitém čtení zakoknete, model potřebuje lepší instrukce.

České AI nástroje a budoucnost češtiny v AI

Čeština v AI není odsouzena k roli občana druhé kategorie. Na zlepšení pracuje několik paralelních iniciativ — od akademických projektů přes komerční nástroje až po vládní programy.

Česky.AI nabízí nejkvalitnější přepis mluvené češtiny — řeč-na-text s podporou českých specifik (diakritika, vlastní jména, odborná terminologie). Pro přepis porad, rozhovorů a přednášek je aktuálně nejlepší volba na trhu.

CZLC — Czech LLM Consortium je akademická iniciativa sdružující české výzkumníky na HuggingFace. Kromě BenCzechMark benchmarku vytvořili BUT-Large Czech Collection (největší čistý český korpus) a pracují na prvním českém 7B modelu s tokenizací optimalizovanou pro češtinu. Ten by měl dramaticky zlepšit poměr tokenů — a tedy i cenu a kvalitu.

OpenEuroLLM je mezinárodní projekt s účastí Česka, jehož cílem je vytvořit jazykové modely pro všechny evropské jazyky. Česká vláda projekt podporuje jako součást strategie digitální jazykové suverenity.

Seznam.cz investuje do vlastních českých embedding modelů a continued pretraining na čistých českých datech. Pro e-commerce a vyhledávání v češtině představují tyto modely zajímavou alternativu k mezinárodním řešením.

Klíčový výhled

Do konce roku 2026 se situace výrazně změní. Kombinace českého 7B modelu (CZLC), lepší tokenizace v nových verzích komerčních modelů a rostoucího objemu kvalitních českých trénovacích dat znamená, že dosavadní 15bodový deficit se bude zmenšovat. Nezanikne úplně — angličtina bude mít vždy datovou převahu — ale pro většinu praktických úloh bude čeština „dostatečně dobrá" i bez speciálních obezliček. Do té doby: testujte, kontrolujte, používejte systémové prompty. Pokud se chcete systematicky připravit na práci s českými AI nástroji, je klíčové si osvojit dovednosti potřebné pro efektivní používání AI v praxi.

Často kladené otázky

Je lepší promptovat v češtině, nebo v angličtině?

Záleží na úloze. Pro generování českého textu (články, e-maily, copy) promptujte v češtině — model pak „myslí" v češtině od začátku. Pro analytické úlohy (kód, logika, matematika) může být anglický prompt s instrukcí „odpověz v češtině" efektivnější, protože reasoning schopnosti jsou v angličtině silnější. Nejlepší praxe: instrukce v angličtině + ukázkový text v češtině.

Který AI model nejlépe zvládá české pády a skloňování?

Claude Opus 4.6 je v roce 2026 konzistentně nejpřesnější v české gramatice — správné pády po předložkách, minimální chyby v koncovkách, přirozený slovosled. GPT-5.4 je blízko, ale občas sklouzne k formálnějšímu tónu. Pro nejlepší poměr cena/výkon je Claude Sonnet 4.6 solidní volba s mírně nižší gramatickou precizností.

Kolik stojí práce s AI v češtině oproti angličtině?

Přibližně 1,5–2,5× více. Český text spotřebuje kvůli tokenizaci víc tokenů — a API poplatky se počítají za tokeny. Na 10 000 slovech je to rozdíl zhruba $0,50–$1,50 u nejlepších modelů. Pro měsíční produkci obsahu (řekněme 50 000 slov) se jedná o desítky dolarů navíc. Placeným uživatelům (ChatGPT Plus, Claude Pro) se token limit vyčerpá rychleji — v praxi dostanete z předplatného méně českého textu než anglického.

Existuje AI model trénovaný přímo na češtině?

Ano, ale zatím v akademické fázi. CZLC (Czech LLM Consortium) vytvořil první český 7B model s českou tokenizací, ale ten zatím nedosahuje kvality komerčních modelů na obecných úlohách. Seznam.cz má interní české modely pro embedding a vyhledávání. OpenEuroLLM projekt s českou účastí pracuje na vícejazyčných modelech. Pro produkční nasazení jsou v roce 2026 stále nejlepší komerční modely (Claude, GPT, Gemini) s kvalitními českými systémovými prompty.

Jak poznám, že AI udělalo chybu v českém textu?

Přečtěte si text nahlas. Nepřirozený slovosled, špatné pády a chybějící discourse markers okamžitě vyniknou při hlasitém čtení. Dále sledujte: nekonzistentní vykání/tykání (časté u delších textů), překladové calky („dělat smysl" místo „dávat smysl"), anglický formát dat a měny, a záměnu slovenštiny s češtinou. Pro systematické testování použijte 8bodový Český AI test z tohoto článku.

Zdroje a reference

  • BenCzechMark: A Czech-centric Multitask and Multimetric Benchmark — TACL / MIT Press (2025), arxiv.org/abs/2412.17933
  • Multilingual Performance Biases of Large Language Models in Education — arxiv.org/abs/2504.17720 (2025), English 70.9 % vs Czech 55.3 %
  • Occiglot: EU Tokenizer Performance Analysis — occiglot.eu/posts/eu_tokenizer_performance (2024)
  • Tokenization efficiency of current foundational LLMs — Frontiers in AI (2025), PMC/12380774
  • CZLC (Czech LLM Consortium) — huggingface.co/CZLC, BUT-Large Czech Collection
  • A survey of multilingual large language models — Patterns / Cell Press (2024), doi.org/10.1016/j.patter.2024.101103
  • Evaluating LLMs for natural-language-to-code generation on Czech public health data — medRxiv (2025)
  • Czech-Spanish translation quality: DeepL, Google Translate, ChatGPT — Études romanes de Brno (2025)
  • Havel & Partners: How will AI language models cope with Czech law? — havelpartners.blog (2025)
  • OpenEuroLLM — ollama.com/jobautomation/OpenEuroLLM-Czech
  • Seznam.cz: Czech semantic embedding models — github.com/seznam/czech-semantic-embedding-models
  • Živě.cz: Která AI je nejlepší? Gemini 3.1 Pro vs Claude Opus 4.6 (2026)