Claude Opus 4.7: Cena stejná, účet vyšší o 35 %. Tichý zdražovák Anthropic

17. 4. 2026 · 18 min čtení · Kategorie: novinky

Ve čtvrtek 16. dubna 2026 kolem 14:30 UTC se na blogu Anthropicu objevil krátký post. Žádné launch video. Žádný keynote od Daria Amodeie. Žádná lavina benchmark grafů, kterou firma provázela předchozí flagship updates. Jen oznámení, model card a tichá aktualizace API dokumentace. A přesto během několika hodin obsadil nový model — Claude Opus 4.7 — první místa většiny veřejných coding žebříčků: SWE-bench Verified 87,6 %, SWE-bench Pro 64,3 %, GPQA Diamond 94,2 %. Ceník zůstal beze změny: 5 dolarů za milion vstupních tokenů, 25 za milion výstupních. Jenže v jedné řádce, která žije v docs a blog post ji přeskočil, stojí věta, která celé „stejné ceně" dává jiný význam: nový tokenizer může na identický text spotřebovat až 1,35× víc tokenů než Opus 4.6. Tato analýza to rozpočítá v korunách na čtyři typické české workloady, postaví vydání do kontextu EU AI Actu (účinnost článku 55 od 2. srpna 2026) a ukáže, proč „stejná cena" není to samé co „stejné náklady".

TL;DR — Klíčová zjištění

Claude Opus 4.7 (16. 4. 2026) drží stejný ceník $5/$25 za milion tokenů jako Opus 4.6, ale nový tokenizer spotřebuje na identický text 1,0–1,35× víc tokenů. Sám Anthropic v migration guide doporučuje zvýšit `max_tokens` o stejnou marži — tedy fakticky přiznání reálného zdražení bez slova „zdražení".
Model překonává GPT-5.4 i Gemini 3.1 Pro na SWE-bench Pro (64,3 %), ale Anthropic sám veřejně přiznává, že je slabší než neveřejný Mythos Preview (77,8 %). Mythos zůstává omezen na partnery Project Glasswing. Nová „real-time cybersecurity safeguards" odmítnou 33 % legitimních úloh bezpečnostního výzkumu.
Pro české firmy to znamená tři praktické úkoly: přeměřit skutečné náklady ne ceník (u 10-dev startupu ~9 700 Kč/rok nárůst přes API, u SaaS s RAG ~365 000 Kč/rok), připravit se na článek 50 a 55 EU AI Act (účinnost 2. 8. 2026) a pro bezpečnostní use-case podat žádost do Cyber Verification Programu ještě před upgradem.

Ceník stejný, účet roste — rozevírání nůžek po 16. 4. 2026

Claude Opus 4.7 v číslech

+35 %

max. nárůst token countu na stejný vstup

Anthropic docs, 16. 4. 2026

3×

kolikrát víc produkčních SWE úloh vyřeší 4.7 než 4.6

Anthropic blog, Rakuten-SWE-Bench

33 %

podíl legitimních safety research úloh, které 4.7 odmítne

The Decoder, 16. 4. 2026

10 týdnů

doba mezi Opus 4.6 a 4.7 (nejrychlejší cadence frontier vendoru)

The New Stack

Co se přesně stalo 16. dubna

Anthropic zveřejnil Claude Opus 4.7 ve čtvrtek 16. 4. 2026 ve 14:30 UTC na svém blogu a zároveň aktualizoval API dokumentaci. Model byl v týž den dostupný napříč všemi Claude produkty, API, Amazon Bedrock, Google Vertex AI i Microsoft Foundry. GitHub Copilot ohlásil dostupnost zhruba o dvě hodiny později. Snowflake Cortex AI publikoval vlastní oznámení 16. 4. večer středoevropského času.

Featured snippet odpověď: Anthropic 16. 4. 2026 ~14:30 UTC zveřejnil Claude Opus 4.7 — nejschopnější veřejně dostupný model, který na SWE-bench Verified dosahuje 87,6 % a na SWE-bench Pro 64,3 %. Cena zůstává 5 dolarů za milion vstupních a 25 za milion výstupních tokenů, ale nový tokenizer zvedne účet o 0–35 %. Model je zároveň dostupný na AWS Bedrock, Google Vertex a Microsoft Foundry.

Co řekl blog post, co tichá docs

Oficiální oznámení na anthropic.com/news/claude-opus-4-7 obsahuje tři ústřední tvrzení: (1) „a notable improvement on Opus 4.6 in advanced software engineering", (2) „pricing remains the same as Opus 4.6: $5 per million input tokens and $25 per million output tokens", (3) „less broadly capable than our most powerful model, Claude Mythos Preview". Tento tón — lepší na coding, stejná cena, horší než Mythos — byl převzat do českých překladových článků bez změny.

Kritický detail ale žije jinde. V sekci „What's new in Claude Opus 4.7" na platform.claude.com/docs stojí přesná věta: „Claude Opus 4.7 uses a new tokenizer, contributing to its improved performance on a wide range of tasks. This new tokenizer may use roughly 1x to 1.35x as many tokens when processing text compared to previous models (up to ~35 % more, varying by content)." Následující odstavec přidává operativní doporučení: „We suggest updating your `max_tokens` parameters to give additional headroom, including compaction triggers." Tato dvě souvětí — ne blog post — formulují skutečnou změnu v ekonomice modelu.

Benchmarky, které Anthropic uvedl

Benchmark	Opus 4.6	Opus 4.7	GPT-5.4	Gemini 3.1 Pro	Mythos Preview
SWE-bench Verified	80,8 %	87,6 %	86,1 %	80,6 %	93,9 %
SWE-bench Pro	53,4 %	64,3 %	57,7 %	54,2 %	77,8 %
GPQA Diamond	91,3 %	94,2 %	94,4 %	90,1 %	94,6 %
CursorBench	58 %	70 %	—	—	—
Visual acuity	54,5 %	98,5 %	—	—	—
Finance Agent eval	—	0,715	—	—	—
Max image resolution	1 568 px / 1,15 MP	2 576 px / 3,75 MP	—	—	—
Kontextové okno	1M tokens	1M tokens	400K	1M	1M

Z čísel vyplývá jeden obraz: 4.7 skutečně dominuje většině veřejných žebříčků v coding a reasoning kategorii. GPQA Diamond je těsně za GPT-5.4 (94,2 % vs. 94,4 %), SWE-bench Pro vede o 6,6 bodu nad GPT-5.4. Na vision benchmarku je skok z 54,5 na 98,5 % (čtyřnásobné zlepšení visual acuity), ale s poznámkou: vyšší resolution = víc tokenů za obrázek.

Mezera je jinde. Na všech hlavních benchmarkcích je Mythos Preview nadále před Opusem 4.7 — SWE-bench Pro 77,8 % (vs. 64,3), SWE-bench Verified 93,9 % (vs. 87,6). Anthropic to v blog postu nezastírá, spíš z toho dělá bezpečnostní argument: méně schopný, tedy méně riskantní model dostane širokou distribuci, zatímco Mythos zůstane v omezeném okruhu.

Co se změnilo v API (breaking changes)

⚠ Migrace z Opus 4.6 na 4.7 není drop-in

Messages API přineslo tři breaking changes, které zlomí produkční integrace bez předchozího auditu request bodies:

Extended thinking budget odstraněn. Volání s thinking: {"type":"enabled","budget_tokens":N} vrací 400 error. Jediný podporovaný režim je adaptive thinking (type: "adaptive").
Sampling parametry pryč. temperature, top_p, top_k s jinou než default hodnotou vrací 400 error. Anthropic migration guide doporučuje parametry zcela vypustit a chování řídit promptingem.
Thinking content defaultně skrytý. Pole thinking v odpovědi je ve 4.7 prázdné, pokud integrace explicitně nenastaví display: "summarized". Pro produkty streamující reasoning uživateli to znamená dlouhou pauzu před začátkem výstupu bez dalšího zásahu.

Pozitivní novinky: nový effort level xhigh (doporučovaný pro coding a agentní use-case) a beta parametr task_budget, který dá modelu orientační token rozpočet pro celý agentní loop (minimum 20 000 tokenů, aktivuje se hlavičkou task-budgets-2026-03-13). Oba mechanismy jsou Anthropicem rámované jako nástroje pro kontrolu nákladů — což je implicitní potvrzení, že kontrola nákladů byla prioritou zákazníků po přepnutí.

Behaviorální změny (ne formálně breaking, ale s dopadem na existující prompty): více literální následování instrukcí, méně automatického generalizování mezi položkami, méně tool calls by default (preferování reasoning), přímější tón s méně „validation-forward" frází a méně emoji. Pokud existující prompt obsahuje mitigace pro dřívější chování („double-check before returning", „return exactly three items"), Anthropic v migration guide doporučuje tyto instrukce odstranit a znovu baseline-ovat.

Tokenizer — 15 slov v docs, které stojí statisíce korun ročně

Featured snippet: Anthropic v docs Opus 4.7 přiznává, že nový tokenizer spotřebuje na identický text 1,0–1,35× víc tokenů. Protože per-token cena zůstává stejná ($5 vstup, $25 výstup za milion), reálný měsíční účet za stejný workload může narůst o 0 až 35 %. Nejvíc to postihne kód, JSON a neanglický text — tedy typické vstupy evropských firem.

Jak funguje nová tokenizace

Tokenizer je komponenta LLM, která rozdělí vstupní text na bloky (tokeny), se kterými model pracuje jako s atomickými jednotkami. Předchozí tokenizer Opus 4.6 rozpadal český text a kód do relativně velkých tokenů (typicky 3–4 znaky na token pro angličtinu, 2–3 znaky pro češtinu). Nový tokenizer Opus 4.7 používá jemnější rozpad — podle reverse-engineering analýz komunity (HN thread #47793411) zhruba o 15–30 % víc tokenů pro stejný text v angličtině a až o 35 % víc pro kód, strukturovaná data a flektivní jazyky.

Motivace je z pohledu modelu technicky smysluplná: jemnější tokenizace umožňuje přesnější reprezentaci okrajových konstrukcí (speciální znaky, kód s hluboce zanořenými strukturami, ideogramy, české diakritické kombinace). Anthropic to spojuje s výkonnostními zisky: „contributing to its improved performance on a wide range of tasks". Ekonomický důsledek je ale přímočarý — zákazník, který dříve platil za 10 000 tokenů promptu, nyní platí za 11 500–13 500 tokenů za identický text.

Kde se 35 % projeví nejvíc

Horní mez 1,35× se podle wording Anthropicu („up to ~35 % more, varying by content") aplikuje na:

Zdrojový kód — hustota speciálních znaků, zanořené závorky, JSON, YAML, TOML, SQL. Zákazník provozující coding agenta cítí nejvyšší nárůst.
Strukturovaná data — API payloady, logy, databázové dumpy, XML.
Neanglický text — čeština, polština, finština, maďarština (flektivní nebo aglutinativní jazyky s vysokou variabilitou koncovek). Diakritika zvyšuje token count.
Obrázky ve vysokém rozlišení — pozdvižení max image resolution na 2 576 px / 3,75 MP znamená, že vision payload může spotřebovat až 3× víc image tokenů než na 4.6 (pokud integrace posílá originální rozlišení bez downsamplu).

💡 Praktický tip — jak multiplier opravdu změřit

Před upgrade použijte endpoint /v1/messages/count_tokens s model: "claude-opus-4-7" na 50 reprezentativních promptech z produkce. Porovnejte s výsledkem téhož endpointu pro claude-opus-4-6. Průměrný multiplier (typicky 1,10–1,30 v CZ kontextu) vynásobte stávajícími měsíčními API náklady. To je vaše skutečné ekonomické delta — ne teoretická horní mez 35 %.

Kalkulace dopadu pro čtyři typické české profily

Následující tabulka aplikuje horní mez multiplieru 1,35 (worst-case; realistický průměr pro CZ workloady je 1,15–1,25) na pět charakteristických českých profilů. Kurz: ČNB 16. 4. 2026, 23,16 Kč/USD.

Profil	Typický měsíční workload	4.6 účet	4.7 účet (1,35×)	Delta/rok	V Kč/rok
Freelance vývojář na Max 20x subscription	Max plan, sdílené limity	$200 / měs	$200 / měs	$0 (rate limit dopad)	0 Kč (viz níže)
Freelance vývojář přes API	1M in / 200K out denně	$10 / měs	$13,50 / měs	+$42	~973 Kč
10-dev CZ startup (API)	10M in / 2M out měsíčně	$100 / měs	$135 / měs	+$420	~9 727 Kč
SaaS s RAG produktem	500M in / 50M out měsíčně	$3 750 / měs	$5 063 / měs	+$15 750	~364 770 Kč
Autonomní SWE agent (nonstop)	10M in / 2M out denně	$3 000 / měs	$4 050 / měs	+$12 600	~291 816 Kč

Pro Max subscription uživatele se cena nezmění. Měsíční paušál zůstává $100 (Max 5x) nebo $200 (Max 20x). Co se ale změní, je rychlost spotřeby 5-hour rate limit okna. Typický Claude Code uživatel, který na 4.6 vyčerpal okno za 4 hodiny intenzivního kódování, na 4.7 narazí na limit za ~3 hodiny. V absolutních Kč tedy žádný dopad — v kvalitě zkušenosti a v počtu využitelných session hodin ano.

Pro SaaS provozovatele s RAG produktem je dopad nejbrutálnější. 365 000 Kč navíc za rok — zhruba mzda juniorního vývojáře — za identický objem uživatelských požadavků. Protože RAG pipeline posílá do LLM dlouhé kontexty (často desítky tisíc tokenů retrieved chunks), efekt se násobí přes všechna volání.

Proč Anthropic neříká „zdražujeme"

Komunikačně je stabilita ceníku silná zpráva pro CFO a finanční ředitele sledující SaaS rozpočet. „Pricing remains the same" zapadne do rozpočtových modelů bez nutnosti schvalovat navýšení. Zároveň vendor technicky nelže — per-token rate skutečně nezměnil.

Technicky je změna tokenizace obhájitelná výkonnostními benefity. Finout ve své analýze z 17. 4. 2026 to pojmenovává jako „token price versus task price": pokud Opus 4.7 dokončí 3× více Rakuten-SWE-Bench úloh než 4.6, stojí sice o 35 % víc tokenů, ale dokončená práce je podstatně lacinější per completed task. Tento argument stojí — ovšem pouze pokud firma měří dokončené úkoly, ne objem tokenů.

Fakticky se účty zvednou u firem, které měří a rozpočtují podle objemu tokenů. A to je většina z nich — zejména v Evropě, kde CFO pracuje s předpovědí měsíčních cloud nákladů a odchylku 20 % řeší eskalací.

Tichý launch: proč chyběl Dario Amodei

Featured snippet: Vydání Opus 4.7 proběhlo 16. 4. 2026 bez launch videa, bez Dario Amodei keynote a bez obvyklého benchmark chart floodu. To je odchylka od standardu, s nímž Anthropic doprovázel předchozí flagship updates. Trh to čte dvěma způsoby: buď firma drží komunikační energii pro neveřejný Mythos a 4.7 je „interim step", nebo jde o prostou únavu médií z desetinedělní cadence frontier modelů.

Mythos Preview — flagship za zdí

Anthropic v postu Opus 4.7 explicitně uvádí: „Opus 4.7 is less broadly capable than our most powerful model, Claude Mythos Preview." Tato věta je strategická. Mythos Preview byl ohlášen už 27. 3. 2026 (pokrytí v článku AI cyber-závody: Mythos vs. GPT), ale nikdy neprošel širokou distribucí. Drží ho omezený okruh Project Glasswing partnerů: Amazon Web Services, Apple, Cisco, CrowdStrike, Google, JPMorgan, Linux Foundation, Microsoft, NVIDIA a Palo Alto Networks.

Vydání Opus 4.7 je z tohoto pohledu dvoustupňová distribuce. Na jedné straně komerční model pro široký trh se „safety measures" (real-time cyber safeguards, 33% refusal rate na safety research). Na druhé straně flagship Mythos za NDA a proprietárním cloud ekosystémem Glasswing partnerů. Anthropic tvrdí, že jde o „test safeguards on less capable models first", ekonomicky ale vzniká tiered AI trh, kde kdo neuzavřel enterprise kontrakt s Glasswing partnerem, dostane strojově osekanou verzi schopností.

Dvoustupňová distribuce Anthropic Opus 4.7 × Mythos Preview

Marketingová strategie, nebo prostá únava trhu

Mezi Opus 4.6 (začátek února 2026) a Opus 4.7 (16. 4. 2026) uběhlo zhruba 10 týdnů. To je rychlejší cadence než u jakéhokoli jiného frontier vendoru: GPT-5.4 přišel po 16 týdnech od GPT-5.3, Gemini 3.1 Pro po 14 týdnech od 3.0. Ohlášení Mythos Preview v březnu se překrylo s Meta Muse Spark (8. 4.), Boston Dynamics + Gemini Robotics (8.–14. 4.) i Stanford AI Index (13. 4.).

The New Stack ve svém postu z 16. 4. interpretuje tichý launch jako ztrátu novosti: „the release arrived without the customary launch video, without a benchmark chart flood, and without the Dario Amodei keynote that usually accompanies a flagship update". Čtenářská únava frontier modelů je podle nich vysoká — point-release co dva měsíce nevygeneruje zájem dostatečný pro celodenní launch event.

Alternativní výklad (LessWrong, Gizmodo) je kritičtější: Anthropic šetří komunikační energii pro Mythos, který představuje skutečný skok, a 4.7 vydává z povinnosti konkurovat GPT-5.4 na veřejných žebříčcích. Gizmodo titul „Anthropic Releases Opus 4.7 to Remind Everyone How Great Mythos Is" tuto interpretaci pojmenovává přímo.

Ekonomika dvoustupňového trhu

Z pohledu CZ zákazníka je důležitý důsledek: nejschopnější model Anthropicu není k dispozici. Pro většinu typických use-case (coding agent, RAG, content generation) je 4.7 více než dostatečný. Pro úlohy, kde hraje roli 10 procentních bodů na SWE-bench Pro, nebo kde je třeba legitimní cyber research bez refusalu, existuje třímožná strategie: (1) žádost do Project Glasswing (prakticky nerealistické pro CZ SME), (2) enterprise kontrakt přes Glasswing partnera (AWS Bedrock + specifický agreement), (3) multi-provider backup (GPT-5.4-Cyber, open-source Mistral Magistral Large, DeepSeek R2 pro specifické úlohy).

33 % odmítnutých úloh: cyber refusal jako feature

Featured snippet: Opus 4.7 má „real-time cybersecurity safeguards" — mechanismus, který odmítne požadavky spadající pod high-risk cyber use. Sám Anthropic uvádí, že model odmítá 33 % simulovaných legitimních bezpečnostních úloh (zlepšení z 88 % u Opus 4.6, ale stále vysoké). Pro pentestery, red teams a NIS2-regulované české subjekty je jediná cesta přes Cyber Verification Program.

Co přesně je Cyber Verification Program

Cyber Verification Program je nový approval mechanismus Anthropicu, oznámený v paralelním postu 16. 4. 2026. Zajišťuje legitimní přístup k cyber capabilities Opus 4.7 pro ověřené profesionály: vulnerability research, penetration testing, red-teaming. Formulář je na claude.com/form/cyber-use-case, zpracování podle Help Net Security trvá „dny až týdny" a vyžaduje identifikaci zaměstnavatele, rozsah projektu a doklad o legitimním bezpečnostním mandátu.

Bez approvalu narazí uživatel při typické cyber úloze (SQL injection proof-of-concept, exploit analysis, reverse-engineering obfuskovaného vzorku) na odpověď modelu, která úlohu odmítne bez ohledu na context a účel. 33% refusal rate znamená, že každá třetí legitimní bezpečnostní otázka vyžaduje alternativní vendor nebo workaround.

Dopad na ~6 000 NIS2 subjektů v ČR

Směrnice NIS2 (ČR: zákon o kyberbezpečnosti, transpozice účinná od 1. 1. 2026) pokrývá v ČR podle NÚKIB zhruba 6 000 entit. Tyto organizace — zdravotnická zařízení, poskytovatelé digitálních služeb, energetické firmy, finanční instituce, ale i velké části dodavatelského řetězce — mají povinnost dokumentovat „state-of-the-art" opatření. Pokud tato opatření zahrnují LLM jako součást bezpečnostního stacku (detekce anomálií, threat hunting, log analysis), hraje refusal rate roli pro auditní stopu.

Paradox je popsaný už v analýze AI cyber-závodů: NIS2 vyžaduje opatření na úrovni aktuálního stavu techniky, aktuální stav techniky odkazuje na nejnovější modely, a nejnovější modely mají vestavěný refusal mechanismus, který brání legitimnímu použití. Výsledkem je, že CZ firma musí auditorovi doložit buď Cyber Verification approval (pokud je dostupný), nebo multi-provider strategii se záložním modelem.

Porovnání refusal rates napříč vendory

📊 Refusal rate na legitimní safety research (interní evaly vendorů, 2026)

Claude Opus 4.6: 88 % odmítnutých úloh
Claude Opus 4.7: 33 %
GPT-5.4-Cyber (enterprise tier): ~12 %
Claude Mythos Preview (přes Glasswing): ~4 %
Open-source Mistral Magistral Large: ~5 %
DeepSeek R2: ~3 %

Zdroj: Anthropic model card, The Decoder, OpenAI system card, Hugging Face evals. Interpretace: komerční Opus 4.7 je uprostřed spektra — zásadně lepší než 4.6, ale pořád více odmítá než GPT-5.4-Cyber nebo open-source alternativy.

"New tokenizer may use roughly 1x to 1.35x as many tokens when processing text compared to previous models." — Anthropic Claude Opus 4.7 migration guide, 16. 4. 2026

Co se změnilo v API: breaking changes, které položí produkci

Featured snippet: Migrace z Opus 4.6 na 4.7 není drop-in. Tři breaking changes v Messages API: thinking budget s explicitní hodnotou vrací 400 error, temperature a top_p/top_k s jinou než default hodnotou vrací 400 error, a thinking content je v odpovědi defaultně skrytý. Pro produkční integrace to znamená audit všech request bodies před přepnutím modelu.

Thinking API — adaptive thinking namísto extended

Nejvýraznější breaking change se týká extended thinking. Opus 4.6 podporoval explicitní token budget pro thinking (budget_tokens). Opus 4.7 to odmítá:

Před (Opus 4.6)

response = client.messages.create(
    model="claude-opus-4-6",
    thinking={"type": "enabled", "budget_tokens": 32000},
    messages=[...]
)

Po (Opus 4.7)

response = client.messages.create(
    model="claude-opus-4-7",
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},
    messages=[...]
)

Adaptive thinking je off by default — pokud integrace nenastaví thinking pole explicitně, model běží bez interního rezonování. Podle Anthropic docs „adaptive thinking v interních evaluacích reliably outperforms extended thinking", ale změna defaultu znamená, že dosavadní integrace bez explicitního zapnutí mohou vidět zhoršení kvality na reasoning-heavy úlohách čistě kvůli přepnutí modelu bez úpravy request body.

Deprecated sampling parameters

Druhá bomba: temperature, top_p a top_k s jinou než default hodnotou vrací 400 Bad Request. Anthropic migration guide doporučuje parametry zcela vypustit z requestů a chování řídit promptingem. Pro týmy, které používaly temperature=0 jako proxy pro determinismus, je důležitá poznámka z docs: „it never guaranteed identical outputs" — tedy bylo to vždy jen sníženou variabilitou, ne skutečnou determinističností.

Task budgets (beta) — soft rozpočet pro celý agentní loop

Nová beta funkce task_budget je Anthropicem rámovaná jako nástroj pro kontrolu nákladů. Aktivuje se hlavičkou task-budgets-2026-03-13 a dá modelu orientační token rozpočet pro celý agentní loop (thinking + tool calls + tool results + final output). Minimum je 20 000 tokenů. Na rozdíl od max_tokens, které je hard cap na výstup jednoho volání, task_budget je soft signal — model vidí běžící countdown a prioritizuje dokončení úlohy, než rozpočet vyčerpá.

V kontextu 35% tokenizer multiplieru je tato funkce obzvlášť relevantní: firma, která dříve nastavovala max_tokens: 100000 jako bezpečný horní limit agentního run, musí nyní uvažovat v rozpočtu a s headroomem. Migration guide doporučuje zvýšit max_tokens „include compaction triggers" — tedy počítat s tím, že agentní smyčka může spadnout na buffer, dříve než skončí úlohu.

✓ Migration checklist — 7 kroků před přepnutím na Opus 4.7

1. Zvedněte max_tokens o +35 % v produkčních API voláních, včetně compaction trigger thresholdů.

2. Přeměřte skutečnou token spotřebu přes /v1/messages/count_tokens na 50 reprezentativních promptech z produkce PŘED upgradem.

3. Odstraňte temperature, top_p, top_k ze všech Messages API volání (→ 400 error na 4.7, pokud nejsou defaultní).

4. Migrujte thinking konfiguraci z {"type": "enabled", "budget_tokens": N} na {"type": "adaptive"} + output_config.effort: "high".

5. Pokud streamujete reasoning uživatelům, explicitně nastavte thinking.display: "summarized" — jinak dlouhá pauza před výstupem.

6. Překalkulujte BSC/OKR pro AI náklady — 35% tokenizer multiplier se při fixed max_tokens projeví jako neočekávaná stop_reason: "max_tokens", ne jako faktura.

7. Pro bezpečnostní use-case (pentesting, red-team, vulnerability research) podejte žádost do Cyber Verification Programu na claude.com/form/cyber-use-case ještě PŘED upgrade — zpracování trvá dny až týdny.

Co to znamená pro české vývojáře a firmy

Featured snippet: Pro české firmy Opus 4.7 znamená tři praktické úkoly: přeměřit skutečné token náklady na reprezentativních promptech (ne ceník), revidovat max_tokens headroom v produkčních pipelines (+35 %), a pro bezpečnostní use-case podat žádost do Cyber Verification Programu. K tomu: EU AI Act článek 55 (systemic risk GPAI) začne být vymahatelný od 2. srpna 2026 — s pokutami až 3 % ročního obratu.

Finanční dopad: čtyři typické CZ firmy

Pro rychlou orientaci: výše uvedená tabulka pokrývá freelancera na Max subscription (nulový dopad na fakturu, ~25 % rychlejší vyčerpání rate limit okna), freelancera přes API (~1 000 Kč/rok), 10-dev startup přes API (~10 000 Kč/rok), SaaS s RAG (~365 000 Kč/rok) a autonomní SWE agent (~292 000 Kč/rok). Medián dopadu pro typickou CZ SaaS firmu, která provozuje klientské AI workflows v rozsahu 50–200M tokenů měsíčně, je 50 000 až 150 000 Kč/rok.

Relevantní srovnání: průměrná mzda juniorního AI inženýra v ČR (2026) je podle StartupJobs ~90 000 Kč hrubého měsíčně. Nárůst 365 000 Kč u SaaS s RAG odpovídá zhruba 4 měsíční mzdě. Pro firmu, která zvažovala v Q3 2026 rozšíření týmu, je to nezanedbatelný rozpočtový přesun.

EU AI Act článek 55 a článek 50 — jak nové cyber safeguards zapadají

Nařízení Evropského parlamentu a Rady (EU) 2024/1689 (AI Act) začne být pro GPAI poskytovatele s „high-impact capabilities" vymahatelné od 2. srpna 2026. Anthropic s trainingem nad 10²⁵ FLOPs (interní tvrzení) spadá pod článek 55: „providers of general-purpose AI models with systemic risk shall continuously assess and mitigate systemic risks", což zahrnuje každoroční hlášení „serious incidents" do AI Office (Brusel) a zveřejňování „state-of-the-art evaluations".

Záměrné osekání cyber capabilities v Opus 4.7 je formálně splnění článku 55 — model má dokumentovaný refusal mechanismus, který Anthropic prezentuje jako risk mitigation. Zároveň ale existence neveřejného Mythos Preview vyvolává otázku dual-class transparency: zveřejňovat „state-of-the-art" znamená zveřejňovat to, co je skutečně nejvyspělejší dostupnou technologií, ne to, co je prostě veřejně dostupné. Jak to AI Office vyhodnotí, bude součástí prvních enforcement akcí očekávaných v Q4 2026.

Článek 50 (transparency GPAI) ukládá povinnost zveřejnit „sufficiently detailed summary" tréninkových dat. Změna tokenizace se netýká dat přímo, ale je to „substantial modification", která by podle čl. 50 měla být reflektována v aktualizovaném model card. Anthropic to ve verzi 4.7 model cardu splňuje textem „we've updated our tokenization strategy" — marginálně, ne bohatě.

⚠ Deadline: 2. srpna 2026

EU AI Office začne vymáhat ustanovení pro GPAI poskytovatele s systemic risk. Pokuty: až 3 % globálního ročního obratu za porušení článků 50–55 (pro kontext: Anthropic Q4 2025 globální tržby byly zhruba 3,5 mld. USD). Pro CZ firmy, které AI nasazují v kritické infrastruktuře nebo v produktech pro EU trh, článek 26 (deployer obligations) znamená vlastní povinnosti: dokumentovat vstupní data, monitorovat výstupy, reportovat serious incidents.

Multi-provider strategie — proč je dnes relevantnější než včera

Kombinace tichého zdražení přes tokenizer + cyber refusal + dvoustupňový trh s drženým Mythosem tvoří vendor risk, který už není teoretický. CZ firma, která postavila stack čistě na Anthropic API, sedí na single-vendor riziku v kategorii, kde vendor:

má flagship model, ke kterému nemá přístup (Mythos);
změnil ekonomiku API bez změny ceníku (tokenizer);
blokuje 33 % legitimních bezpečnostních úloh a pustí je jen po approvalu;
vstupuje do regulatorního rámce (EU AI Act), kde každé dopnutí compliance znamená další variability.

Prakticky to znamená tři úrovně záložní strategie. První: vendor-agnostic abstrakce (OpenAI SDK kompatibilní wrapper, LiteLLM, OpenRouter). Druhá: secondary provider pro cyber a pro long-context (GPT-5.4-Cyber, Gemini 3.1 Pro, Mistral Magistral Large). Třetí: open-source fallback pro citlivé workloady (DeepSeek R2, Llama 3.3, Qwen 3 přes Ollama nebo vLLM self-hosted). Žádná ze tří cest není plný náhradník, ale každá snižuje jednopunktové selhání, pokud Anthropic provede další tichý pivot.

Shadow AI reminder: Max subscription uživatelé

Zatímco API zákazníci dostanou zvýšený účet, uživatelé Max subscription ($100 / $200 měsíčně) narazí na rychlejší vyčerpání 5-hour rate limit okna. Typický Claude Code uživatel, který na Opus 4.6 vyčerpal denní limit za 4 hodiny intenzivního coding session, na 4.7 narazí na stejný limit za ~3 hodiny, pokud workload obsahuje převážně kód (kde je multiplier nejvyšší). Pro firmy s interními shadow AI uživateli (zaměstnanci, kteří nemají oficiální IT-schválenou subscription) to znamená auditní slepé místo: rate limit errors ve workflow, aniž by IT oddělení vědělo proč.

Pokrytí pro shadow AI existuje v Shadow AI analýze — a Opus 4.7 je dobrý prompt pro compliance tým, aby revidoval AI policy a zajistil centrální viditelnost AI nákladů napříč firmou.

Co sledovat dál

Featured snippet: Klíčové signály pro následujících 4–8 týdnů: kvartální výkaz Anthropic revenue Q2 2026 (zda je 4.7 „interim step"), širší dostupnost Mythos Preview (rozšíření Glasswing okruhu), první EU AI Office enforcement akce po 2. srpnu 2026, reakce GPT-5.5 a Gemini 3.2 na token pricing parametry a veřejná disclosure refusal rate u konkurenčních safeguards.

Co sledovat do konce Q2 2026 — timeline signálů

Co se musí stát, aby byl pesimistický pohled správný

Teze „Opus 4.7 je tichý zdražovák" bude potvrzena, pokud:

Reálně naměřený multiplier u CZ workloadů bude konzistentně nad 1,20× (tedy nárůst 20 % a víc). Dvě nezávislé analýzy (HN community, Finout) už publikovaly čísla v rozmezí 1,15–1,35×.
Mythos Preview zůstane gatekept i po 2. srpnu 2026 a Glasswing okruh se nerozšíří. To by znamenalo, že dvoustupňový trh je trvalá struktura, ne dočasné opatření.
OpenAI ani Google nesníží ceny GPT-5.4 / Gemini 3.1 Pro v reakci — pokud konkurence neudělá cenové protiopatření, Opus 4.7 se de facto stane novým benchmark-price standardem.
Cyber Verification Program bude mít vysokou míru zamítnutí u běžných CZ SME, které nemají enterprise vztah s Anthropicem. V takovém případě 33% refusal rate znamená pro pentest firmy reálné omezení v provozu.

Co se musí stát, aby byl optimistický pohled správný

Alternativní interpretace — „Opus 4.7 je legitimní upgrade, tokenizer je technický detail" — bude potvrzena, pokud:

Real-world multiplier u CZ workloadů bude v průměru 1,05–1,15× (nárůst 5–15 %), vyvážený 3× lepším task completion rate na SWE-bench.
Anthropic v následujících týdnech oznámí rozšíření Mythos dostupnosti (např. na Bedrock s enterprise agreement).
Konkurence (GPT-5.4, Gemini 3.1 Pro) uvede podobné tokenizační změny — a stane se to standardním průmyslovým pohybem, ne jednotlivým vendor krokem.
Cyber Verification Program se ukáže jako efektivní gating mechanismus s rychlým turnaround — CZ pentest firmy ho naplno využijí do konce Q2.

Klíčový insight

Ceník je to, co vidíte ve faktuře. Skutečné náklady jsou součin cena × tokenová spotřeba. Když vám vendor řekne, že „cena zůstává", a zároveň doporučí „zvýšit max_tokens o 35 %", přeloženo do lidštiny to znamená: zdražujeme, ale ne přes ceník. Pro CFO to je forma skrytého výdaje, která obchází standardní schvalovací procesy pro cenové úpravy.

FAQ

Je Claude Opus 4.7 dražší než Opus 4.6?

Per-token cena je identická: 5 dolarů za milion vstupních, 25 za milion výstupních tokenů. Reálný měsíční účet může být ale o 0–35 % vyšší, protože nový tokenizer spotřebuje na identický text 1,0–1,35× víc tokenů. Sám Anthropic v migration guide doporučuje zvýšit max_tokens o stejnou marži.

Můžu Opus 4.7 použít pro penetrační testy v ČR?

Ne přímo — Opus 4.7 odmítá 33 % legitimních úloh bezpečnostního výzkumu. Pro pentest, red team a vulnerability research je nutné podat žádost do Cyber Verification Programu na claude.com/form/cyber-use-case. Zpracování trvá dny až týdny a vyžaduje identifikaci zaměstnavatele a doklad o legitimním mandátu.

Jak poznám, jestli stojí za to upgradovat na Opus 4.7?

Přeměřte endpoint /v1/messages/count_tokens na 50 reprezentativních promptech z produkce pro oba modely (4.6 i 4.7). Spočítejte skutečný multiplier (typicky 1,10–1,30 pro CZ workloady) a porovnejte s 3× zlepšením task completion na SWE-bench. Pokud provozujete coding agenta nebo SaaS s RAG, upgrade se většinou vyplatí; pokud generujete hlavně anglickou prózu, dopad je menší.

Kdy se Mythos Preview otevře širší distribuci?

Anthropic veřejně nesdělil datum. Mythos Preview je aktuálně omezen na Project Glasswing partnery (AWS, Apple, Cisco, CrowdStrike, Google, JPMorgan, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks). Rozšíření očekávané v průběhu Q2–Q3 2026, pravděpodobně přes enterprise AWS Bedrock a Google Vertex AI s individuálními agreementy.

Dotkne se změna tokenizace uživatelů Max subscription?

Měsíční paušál zůstává 100 dolarů (Max 5x) nebo 200 dolarů (Max 20x). Rate limit 5-hour window se ale vyčerpá zhruba o 25 % rychleji, pokud workload obsahuje hodně kódu, JSONu nebo českého textu. V absolutních korunách žádný dopad — v počtu využitelných session hodin ano.

Zdroje

Anthropic — Introducing Claude Opus 4.7 (16. 4. 2026)
Anthropic Docs — What's new in Claude Opus 4.7 (16. 4. 2026)
AWS Blog — Introducing Anthropic's Claude Opus 4.7 in Amazon Bedrock (16. 4. 2026)
GitHub Changelog — Claude Opus 4.7 is generally available (16. 4. 2026)
Snowflake — Announcing Claude Opus 4.7 on Snowflake Cortex AI (16. 4. 2026)
Finout — Claude Opus 4.7 Pricing: The Real Cost Story Behind the „Unchanged" Price Tag (17. 4. 2026)
The Decoder — Anthropic's Claude Opus 4.7 makes a big leap in coding, while deliberately scaling back cyber capabilities (16. 4. 2026)
Help Net Security — Anthropic releases Claude Opus 4.7 with automated cybersecurity safeguards (16. 4. 2026)
Axios — Anthropic releases Claude Opus 4.7, concedes it trails unreleased Mythos (16. 4. 2026)
CNBC — Anthropic rolls out Claude Opus 4.7, an AI model that is less risky than Mythos (16. 4. 2026)
Vellum AI — Claude Opus 4.7 Benchmarks Explained (16. 4. 2026)
The New Stack — Claude Opus 4.7 arrives with better vision, memory, and instruction-following (16. 4. 2026)
9to5Google — Claude Opus 4.7 launches with coding improvements, but it's no Mythos (16. 4. 2026)
Gizmodo — Anthropic Releases Claude Opus 4.7 to Remind Everyone How Great Mythos Is (16. 4. 2026)
LessWrong — Anthropic Releases Opus 4.7 (16. 4. 2026)
Hacker News — Claude Opus 4.7 (thread) (16. 4. 2026)
Hacker News — Claude Opus 4.7 Model Card (thread) (16. 4. 2026)
Nařízení (EU) 2024/1689 — AI Act, články 50 a 55 (účinnost GPAI ustanovení 2. 8. 2026)
NÚKIB — NIS2 a zákon o kyberbezpečnosti (účinnost v ČR 1. 1. 2026)
ČNB — Kurzovní lístek USD/CZK (16. 4. 2026: 23,16 Kč)

Související analýzy na josefd.cz: AI cyber-závody: Mythos našel 27letou díru v OpenBSD (kontext Project Glasswing), Anthropic právě vyhlásil válku Figmě (původní leak Opus 4.7 a Claude Studio ze 12.–15. 4.), Tichý pivot OpenAI (vendor risk a coding ekosystém), Náklady na AI API: Jak nekrvácet na tokenech (evergreen o tokenech a rate limiting), Stanford AI Index 2026 (FMTI pokles a public trust).