Jak vytvářet AI obrázky 2026: Průvodce, srovnání, kalkulátor

· 18 min čtení · Kategorie: navody
Jak vytvářet AI obrázky 2026: Průvodce, srovnání, kalkulátor

Jak vytvářet AI obrázky: Kompletní průvodce 2026

Za dva roky klesla cena jednoho AI obrázku z přibližně čtyř dolarů na čtyři centy. Dnes si za necelou korunu vygenerujete vizuál, za který byste ve fotobance zaplatili stovky. Rozdíl mezi nejdražším a nejlevnějším modelem přitom činí přes stonásobek, ačkoli na první pohled bývá kvalita prakticky nerozlišitelná. To mění pravidla hry: o výběru nástroje už nerozhoduje technická převaha, ale cena za tisíc obrázků měsíčně a schopnost správně napsat český text v obrázku. Tento průvodce shrnuje aktuální stav sedmi relevantních modelů pro rok 2026, ukazuje konkrétní náklady v korunách a nabízí rozhodovací strom pro typické použití — od hero obrázku na blog po logo pro malou firmu.

TL;DR — Klíčové body

  • Sedm modelů pokrývá 95 % potřeb: Midjourney V7/V8, GPT Image 1.5, Google Imagen 4, Flux 2, Ideogram 3.0, Recraft V4 a open-source cesta přes SDXL/FLUX.1. Každý má jasnou silnou stránku — nemá smysl hledat jeden „nejlepší".
  • Cena rozhoduje víc než kvalita: Pro malou firmu s 500 obrázky měsíčně se vyplatí API (Imagen 4 Fast nebo Flux 2 Klein), pro 2 000+ obrázků měsíčně předplatné Midjourney Standard. Open-source self-host dává smysl až od zhruba 5 000 obrázků měsíčně.
  • Pro text v obrázku s češtinou: Ideogram 3.0 a GPT Image 1.5 zvládají diakritiku nejlépe. Midjourney a Flux 2 ji často komolí — u těchto modelů se vyplatí obrázek generovat bez textu a typografii doplnit v Canvě nebo Figmě.
100×
rozdíl v ceně za obrázek
Flux 2 Klein vs. Midjourney V8, 2026
3–15 s
doba generování
Průměr top modelů, duben 2026
7
modelů, které se vyplatí znát
Zbytek je derivát nebo legacy

Výběr modelu dneska neřeší kvalita — řeší ho cena a čeština

Ještě v roce 2024 se debata kolem AI obrázků točila kolem jediné otázky: který model generuje nejhezčí výsledek. Midjourney tehdy jasně vedl, DALL-E 3 byl levnější alternativa a Stable Diffusion se používal hlavně pro experimenty. Od té doby se ale trh srovnal. Top pět modelů dnes produkuje natolik vyrovnanou kvalitu, že běžný uživatel při slepém testu neurčí, co vytvořil který nástroj. To platí pro fotorealismus, pro ilustraci i pro umělecký styl.

Když kvalita přestane rozhodovat, nastoupí dva jiné parametry. První je cena za obrázek v reálné produkci — nikoli marketingový výkřik s nejnižším tarifem, ale skutečné náklady pro desítky až tisíce obrázků měsíčně, které většina firem a kreativců potřebuje. Druhý je schopnost modelu správně vykreslit text v obrázku, a to včetně české diakritiky. Plakát, logo nebo infografika se bez čitelného textu neobejdou a právě tady se modely liší výrazně.

Featured answer: Který AI nástroj na obrázky je nejlepší?

Jednoznačný vítěz neexistuje. Pro umělecké ilustrace vyhrává Midjourney V7/V8, pro text v obrázku Ideogram 3.0 nebo GPT Image 1.5, pro fotorealismus Flux 2 Pro a pro rychlou produkci Google Imagen 4 Fast za zhruba půl koruny na obrázek. Rozhodujte podle konkrétního úkolu, ne podle popularity.

Druhý důležitý posun se týká distribuce nástrojů. Před rokem znamenala práce s Midjourney nutnost učit se Discord; dnes má web rozhraní na midjourney.com a dokonce vlastní Alpha klienta. GPT Image 1.5 je integrovaný přímo v ChatGPT — takže kdo používá placený plán ChatGPT+, dostává generování obrázků v ceně. Google Imagen 4 funguje jak přes Gemini aplikaci, tak přes Google Cloud API. Rozdíl mezi „konzumentským" a „API" přístupem se rozmazává.

Třetí faktor, který si málokdo uvědomí: open-source modely jako FLUX.1 Schnell nebo Stable Diffusion XL jsou dnes zdarma a kvalitou dotahují placené modely z roku 2024. Běží na herní grafické kartě s 12 GB paměti. To znamená, že firmy, které generují tisíce obrázků měsíčně a mají citlivá data (například fotografie produktů před launchem), nemusí obrázky vůbec posílat na cloudové API.

Sedm modelů, které v roce 2026 stojí za zkoušku

Seznam relevantních nástrojů je krátký. Trh prošel konsolidací a většina menších generátorů je buď derivát těchto sedmi modelů, nebo kombinace některého z nich s designovou nadstavbou typu Canva. Následující přehled pokrývá vše, co potřebujete pro práci od blogu až po produktovou fotografii.

Midjourney V7 a V8 Alpha — umělecká jednička

Midjourney si drží pozici nejsilnějšího modelu pro umělecké a stylizované vizuály. Verze V7 je od jara 2025 výchozí, V8 Alpha se spustila 17. března 2026 a běží na samostatné doméně alpha.midjourney.com. Hlavní posun ve V8 je 4–5× rychlejší renderování (15 sekund místo minuty) a nativní 2K rozlišení bez nutnosti upscalingu.

Cena začíná na 10 dolarech měsíčně za Basic plán (přibližně 230 Kč při aktuálním kurzu, 3,3 hodiny „fast" GPU času), pokračuje přes Standard za 30 dolarů (15 hodin fast + unlimited Relax), Pro za 60 dolarů a Mega za 120 dolarů měsíčně. Roční předplatné ubere 20 %. Free verze neexistuje, což Midjourney dlouhodobě drží pod tlakem levnějších alternativ.

Silná stránka: konzistentní estetika, personalizační profily (model si pamatuje preferovaný styl) a kvalitní zpracování složitých kompozic. Slabá stránka: slabé vykreslování textu (i když V7 v tom kus pokroku udělal), časté vypadání sekundárních objektů z promptu a problematická komerční licence pro Basic plán.

GPT Image 1.5 — nástupce DALL-E 3

Tady je nutné vyjasnit terminologii, protože kolem ní panuje chaos: DALL-E 3 už není aktuální model. OpenAI ho v průběhu roku 2025 nahradilo postupně modelem GPT Image 1 a od začátku roku 2026 pak GPT Image 1.5. Nový model je čtyřikrát rychlejší, má lepší fotorealismus a hlavně výborně vykresluje text včetně diakritiky.

Pozor na záměnu DALL-E 3 / GPT Image 1.5

Mnoho starších tutoriálů a srovnání mluví o „DALL-E 3 v ChatGPT". V aktuálním ChatGPT už běží GPT Image 1.5, DALL-E 3 je označen jako „previous image generation model". Názvy v marketingových materiálech jsou občas nedůsledné — důležitá je funkce, ne jméno.

Přes API stojí GPT Image 1.5 od 0,009 dolaru (nejnižší kvalita, přibližně 21 haléřů) po 0,08 dolaru (vysoká kvalita, zhruba 1,85 Kč) za obrázek 1024×1024. Kdo má předplatné ChatGPT Plus za 20 dolarů měsíčně, má generování zdarma v rámci běžných limitů konverzace. Pro většinu uživatelů, kteří již ChatGPT používají k psaní, je to nejnižší bariéra vstupu — žádný nový účet, žádná nová platba.

Silná stránka: přesný text v obrázku, dobrá znalost kontextu z předchozí konverzace, bezplatný přístup pro plátce ChatGPT. Slabá stránka: občas zbytečně konzervativní moderace (odmítá prompty s jmény reálných osob), menší kontrola nad stylem než u Midjourney.

Google Imagen 4 — rychlost a typografie

Imagen 4 je méně známý, ale pro komerční produkci extrémně vhodný model. Google ho nabízí ve dvou variantách: Imagen 4 Fast za 0,02 dolaru na obrázek (zhruba 46 haléřů, tedy polovina koruny) a Imagen 4 Ultra za 0,06 dolaru (asi 1,40 Kč). Rozlišení jde nativně na 2K a čas generování se pohybuje mezi třemi a pěti sekundami.

Přístup existuje dvěma cestami: přes Gemini aplikaci pro běžné uživatele (integrovaná s textovým modelem, podobně jako GPT Image v ChatGPT), nebo přes Google Cloud Vertex AI pro vývojáře a firmy. Imagen vede v přesnosti typografie — pokud potřebujete čitelný nadpis nebo popisek v obrázku, zvládá to stejně dobře jako Ideogram, navíc rychleji.

Silná stránka: poměr cena / kvalita / rychlost je v celém trhu nejlepší pro běžnou produkci, 2K výstup bez upscalingu, rozumná typografie. Slabá stránka: stylově konzervativní (fotografie a realistické vizuály ano, divoké umělecké styly ne), API nastavení je pro začátečníky složitější než ChatGPT.

Flux 2 — fotorealismus a dlouhé prompty

Flux 2 od berlínské firmy Black Forest Labs vyšel v listopadu 2025 a stal se během čtyř měsíců de facto standardem pro fotorealistickou produktovou fotografii a realistické portréty. Model chápe detaily, které ostatním dělají problém: textury pleti, odraz světla na fazetách sklenice, záhyby látky.

Rodina má tři varianty: Flux 2 Klein (nejlevnější, 0,014 dolaru ≈ 32 haléřů), Flux 2 Pro (0,03 dolaru / megapixel, většinou 0,03–0,05 dolaru ≈ 70 haléřů až 1,15 Kč) a Flux 2 Max (0,07 dolaru / megapixel, přibližně 1,60 Kč). Flux 2 Max je jediný aktuální model, který spolehlivě zpracuje 200slovný prompt bez ztráty detailů.

Flux 2 běží přes více poskytovatelů: Replicate, fal.ai, WaveSpeedAI, Together AI i přímo přes Black Forest Labs. Vedle toho existuje FLUX.1 Schnell — dřívější generace modelu pod open-source licencí, která se dá provozovat lokálně na grafické kartě s 12 GB VRAM.

Silná stránka: fotorealismus, dlouhé prompty, rozsáhlá API nabídka. Slabá stránka: anglicky orientovaný trénink (čeština v textu obrázku často selže), méně „uměleckých" stylů než Midjourney.

Ideogram 3.0 — specialista na text v obrázku

Ideogram se od začátku soustředil na jednu věc: přesný, čitelný text v obrázku. Loga, plakáty, obálky časopisů, tabule s nápisy. V roce 2026 je verze 3.0 spolu s GPT Image 1.5 jediná, která spolehlivě vykreslí český text s diakritikou — háčky a čárky neskáčou, písmena nesplývají.

Free tier nabízí 10 promptů denně (obvykle 40 obrázků, protože každý prompt generuje čtyři varianty). Placený plán Basic stojí 8 dolarů měsíčně (kolem 185 Kč), vyšší tier Plus 16 dolarů. Pro většinu tvůrců obsahu, kteří dělají jeden až dva plakáty denně, Free tier stačí.

Silná stránka: text v obrázku, loga, jednoduché webové rozhraní bez Discordu. Slabá stránka: ve fotorealistických portrétech nevyniká, nemá tolik stylových presetů jako Midjourney.

Recraft V4 — vektorová grafika a loga

Recraft řeší problém, který ostatní modely neřeší vůbec: výstup ve vektorovém SVG formátu. Pro loga, ikony a brand assety je to rozhodující rozdíl, protože vektorový soubor lze libovolně zvětšovat bez ztráty kvality. Recraft V4 je podle benchmarku HuggingFace nejlepší aktuální model pro logo design.

Cena: zdarma 50 kreditů denně, placený plán startuje na 10 dolarech měsíčně. Obrázek stojí přibližně jeden kredit, SVG export 2–5 kreditů. Nástroj navíc nabízí brand styly — zadáte jednou barevnou paletu, fonty a vizuální DNA a model drží styl konzistentně napříč obrázky.

Silná stránka: SVG výstup, brand systém, logo design. Slabá stránka: rastrové fotografie nejsou tak silné jako u Flux 2 nebo Midjourney.

Open-source cesta — SDXL a FLUX.1 Schnell

Stable Diffusion XL (SDXL) a FLUX.1 Schnell se dají stáhnout zdarma a provozovat lokálně. SDXL má největší ekosystém na trhu: tisíce LoRA modelů (styl fine-tune), vlastních checkpointů, rozšíření a komunitních nástrojů. FLUX.1 Schnell vyrovnává SDXL v kvalitě, ale generuje o poznání rychleji.

Pro běžné spuštění stačí grafická karta s 12 GB VRAM (NVIDIA RTX 3060 nebo lépe). Plná verze FLUX.1 Dev vyžaduje 24 GB VRAM, tedy RTX 3090, RTX 4090 nebo srovnatelnou profesionální kartu. Ovládání probíhá přes uživatelské rozhraní jako ComfyUI (vizuální node-based workflow) nebo Stable Diffusion WebUI (formulář s poli).

Silná stránka: nula korun za obrázek po jednorázové investici do hardwaru, plná kontrola nad daty, možnost fine-tune vlastním datasetem. Slabá stránka: učící křivka desítek hodin, bez GPU to nepůjde, kvalita závisí na schopnosti promptovat a vybrat správné rozšíření. Detailní licenční rozbor (FLUX.1 Dev NC vs Schnell Apache vs SD 3.5 Community License), hardware v Kč a rozhodovací strom pěti otázek pro volbu modelu řeší samostatný článek FLUX vs Stable Diffusion 2026: licence, hardware a Kč rozbor.

Srovnávací tabulka: co umí který model

Následující tabulka shrnuje sedm modelů v pěti parametrech, které nejčastěji rozhodují při výběru. Ceny jsou přepočteny na české koruny (kurz 23 Kč za USD, duben 2026). Hvězdičky indikují praktické hodnocení, ne marketingová tvrzení výrobců.

Model Cena za obrázek Free tier Český text Hlavní použití
Midjourney V7/V8 Od 230 Kč/měs (Basic) Ne ★★☆☆☆ Umělecké ilustrace, stylizace
GPT Image 1.5 0,21–1,85 Kč (API) V ChatGPT zdarma ★★★★★ Všestranný, text v obrázku
Google Imagen 4 Fast 0,46 Kč Kredity v Gemini ★★★★☆ Rychlá produkce, fotografie
Flux 2 Pro 0,70–1,15 Kč Hugging Face (pomalé) ★★☆☆☆ Fotorealismus, produktovka
Flux 2 Klein 0,32 Kč Hugging Face ★★☆☆☆ Nejlevnější fotorealismus
Ideogram 3.0 0 Kč (10 promptů/den) Ano (40 obrázků/den) ★★★★★ Plakáty, loga, text v obrázku
Recraft V4 Od 230 Kč/měs 50 kreditů/den ★★★★☆ SVG, logo design, brand
FLUX.1 / SDXL (lokálně) 0 Kč/img + el. Plně zdarma ★★☆☆☆ Privátní data, fine-tune, škálování

Kolik to stojí v praxi — tabulka v korunách

Jedna věc je marketingová cena za obrázek, druhá realita měsíčních nákladů. Následující kalkulace modeluje čtyři typické scénáře: tvůrce obsahu (100 obrázků/měsíc), malá firma (500 obrázků), agentura (1 000 obrázků) a e-shop nebo média (5 000 obrázků). Předpokládá průměrnou kvalitu a standardní rozlišení.

Nástroj 100 obr./měs 500 obr./měs 1 000 obr./měs 5 000 obr./měs
Midjourney Basic ($10) 230 Kč vyčerpáno* vyčerpáno* vyčerpáno*
Midjourney Standard ($30) 690 Kč 690 Kč 690 Kč (Relax) 690 Kč (Relax)
GPT Image 1.5 medium (API) ~90 Kč ~460 Kč ~920 Kč ~4 600 Kč
Imagen 4 Fast 46 Kč 230 Kč 460 Kč 2 300 Kč
Flux 2 Klein 32 Kč 160 Kč 320 Kč 1 600 Kč
Flux 2 Pro (průměr) ~95 Kč ~475 Kč ~950 Kč ~4 750 Kč
Ideogram Free 0 Kč 0 Kč (hraniční) 0 Kč (nestíhá) nestíhá
Ideogram Plus ($16) 370 Kč 370 Kč 370 Kč 370 Kč (limit)
Open-source (po HW) cca 15 Kč el. cca 75 Kč el. cca 150 Kč el. cca 750 Kč el.

* Basic plán má 3,3 hodiny „fast" GPU času, což pokryje přibližně 200 obrázků. Nad rámec nutno dokupovat.

Klíčový poznatek: break-even

Pro méně než 200 obrázků měsíčně vyhrává Ideogram Free plus Imagen 4 Fast (kombinace za nulu nebo pár desítek korun). Od 400 obrázků se vyplatí Midjourney Standard nad Basic (rychlejší generace, unlimited Relax). Od 2 000 obrázků je Midjourney Standard nejvýhodnější varianta na trhu díky unlimited Relax módu. Nad 5 000 obrázků začíná dávat smysl jednorázová investice do self-hostingu SDXL nebo FLUX.1.

Jeden nepsaný trik v praxi: kombinujte levný model pro draft a drahý pro finálku. Například deset kandidátů vygenerujte ve Flux 2 Klein za čtyři koruny celkem, vyberte nejlepší a ten přegenerujte v Midjourney nebo Flux 2 Max. Snížíte celkové náklady o 70–80 % při zachování finální kvality.

Rozhodovací strom — co kdy použít

Místo obecného „Midjourney je nejlepší" následuje konkrétní rozhodnutí podle úkolu. Níže je šest typických použití a u každého primární volba plus záložní varianta.

Rozhodovací strom podle úkolu

1. Hero obrázek na blog nebo newsletter
→ Primární: Google Imagen 4 Fast (rychlost, poměr cena/kvalita).
→ Záloha: GPT Image 1.5 v ChatGPT, pokud tvůrce nechce platit zvlášť.
→ Vyhnout se: Midjourney Basic pro jednorázové použití je zbytečně drahý.

2. Logo nebo ikonový set
→ Primární: Recraft V4 (vektorový SVG výstup je rozhodující, lze libovolně zvětšovat).
→ Záloha: Ideogram 3.0 pro rastrovou variantu s textem.
→ Vyhnout se: Midjourney — loga s textem vypadají „AI generated" na první pohled.

3. Produktová fotografie
→ Primární: Flux 2 Pro (detaily textur, odrazů, pleti na ruce držící produkt).
→ Záloha: Imagen 4 Ultra nebo Midjourney V8 Alpha.
→ Vyhnout se: Ideogram (fotorealismus neumí) a GPT Image Low (přehřívá barvy).

4. Ilustrace do článku nebo sociálních sítí
→ Primární: Midjourney V7 (nejkonzistentnější umělecký styl) nebo GPT Image 1.5 (zdarma v ChatGPT).
→ Záloha: Flux 2 Klein pro nejnižší cenu.
→ Vyhnout se: Imagen 4 (stylově konzervativní, působí genericky).

5. Portrét virtuální postavy
→ Primární: Flux 2 Pro nebo Max (pleť, osvětlení, oči).
→ Záloha: Midjourney V8 Alpha s personalizačním profilem.
→ Vyhnout se: SDXL bez fine-tune LoRA (obličeje bývají neostré).

6. Plakát, infografika nebo obal s textem
→ Primární: Ideogram 3.0 (čitelný text včetně diakritiky).
→ Záloha: GPT Image 1.5 (druhá nejlepší typografie).
→ Vyhnout se: Midjourney a Flux 2 — text bude buď chybět, nebo zkomolený.

Jedno obecné pravidlo se prolíná všemi šesti scénáři: nezačínejte u nástroje, začněte u úkolu. Většina začátečnických frustrací pramení z toho, že si někdo předplatí Midjourney kvůli reelům na Instagramu a pak se diví, proč mu model nedělá poster s názvem akce.

Jak napsat prompt, který funguje

Kvalita výsledku závisí z osmdesáti procent na promptu a jen z dvaceti na volbě modelu. To je dobrá zpráva: investice do umění psaní promptů se vám vrátí bez ohledu na to, jaký nástroj si zrovna předplatíte. Špatný prompt nedokáže zachránit ani ten nejlepší model.

Featured answer: Jak napsat dobrý prompt?

Dobrý prompt má pět částí: hlavní téma, prostředí, nálada nebo světlo, umělecký styl a technický parametr (například fotografický styl, 35mm objektiv). Místo „krásný les" napište „mlhavý jehličnatý les, ranní paprsky, mech na kmenech, fotografický styl, 35mm, teplý nádech". Specifičnost poráží výběr modelu.

Pětisložková formule promptu

1. Hlavní téma — co na obrázku je. Přesné podstatné jméno, ideálně jedno. Ne „scéna s lidmi a budovami", ale „pekař za pultem pekařství".

2. Prostředí — kde to je. Konkrétní kulisa, ne „exteriér". „Brněnská secesní kavárna v neděli odpoledne" nese desetkrát víc informace než „kavárna".

3. Nálada a světlo. „Teplé ranní světlo, měkké stíny" posune celkový tón víc než jakákoli jiná část promptu. AI modely reagují na světlo velmi citlivě.

4. Umělecký styl. Fotografie, akvarel, 3D render, ilustrace, Studio Ghibli, Bauhaus. Stylové odkazy na konkrétní hnutí nebo estetiku fungují nejlépe.

5. Technický parametr. U fotografií: objektiv (35 mm, 85 mm, makro), kompozice (zlatý řez, centrická), orientace (portrét, krajina). U ilustrací: tloušťka tahu, barevná paleta.

Tři vzorové prompty v češtině

Hero obrázek na článek o domácí kávě: „Porcelánový hrnek espressa na hrubém dubovém stole, pára stoupá proti oknu s dopadajícím ranním světlem, teplé tóny, fotografický styl, 50 mm objektiv, mělká hloubka ostrosti, stín padá přes levou část scény."

Ilustrace do newsletteru o AI: „Malý roboticky stylizovaný asistent sedí u starého mechanického psacího stroje, okolo něj létají papíry s grafy, teplá paleta žluté a šedé, ilustrace ve stylu Richarda Scarryho, měkké obrysy, dětsky přátelský výraz."

Plakát na akci s českým textem (Ideogram): „Minimalistický plakát na konferenci 'AI v českých firmách 2026', geometrická kompozice, fialové a bílé barvy, velký nadpis nahoře čitelným bezpatkovým písmem, podnadpis 'Praha, 15. září', styl švýcarské typografické školy."

Iterujte — třetí pokus bývá nejlepší

Největší chyba začátečníků spočívá v tom, že první výsledek považují za finální. Zkušení uživatelé vědí, že tři až pět iterací je norma. Model vygeneruje variantu, vy upravíte jeden až dva parametry (světlo, kompozici, styl) a necháte znovu vygenerovat.

U Midjourney se kromě toho vyplatí používat operaci Vary (Subtle) a Vary (Strong) — model si pamatuje základní kompozici a vygeneruje drobné varianty. U GPT Image 1.5 stačí napsat „vygeneruj to samé, ale v modré paletě" a ChatGPT si kontext podrží.

Negativní prompty: kdy ano, kdy ne

U Midjourney existuje parametr --no, který modelu říká, čemu se má vyhnout: --no text, watermark, blur. Funguje, ale s výhradou — Midjourney čte každé slovo zvlášť. Napíšete-li --no moderní oblečení, model to čte jako „no moderní" a „no oblečení", což může vést k nahým postavám. Pro jistotu formulujte negativní prompty v angličtině a jednoslovně.

Obecně platí: pozitivní prompt poráží negativní. Místo „žádné nápisy" napište „čisté pozadí bez textu". Místo „nejsou brýle" napište „bezprostřední přirozený obličej". Model lépe pochopí, co chcete vidět, než co nechcete.

Český text v obrázku — co funguje a co ne

Generování obrázků bylo dlouho doménou angličtiny a tréninkové datasety to odrážejí. Když potřebujete v obrázku český text s diakritikou, modely se rozdělí na tři kategorie: použitelné, částečně použitelné a nepoužitelné.

Featured answer: Umí AI obrázky češtinu?

Text v češtině s diakritikou zvládá nejlépe Ideogram 3.0 a GPT Image 1.5. Midjourney a Flux 2 diakritiku často vynechají nebo zkomolí. Pro jistotu se vyplatí obrázek generovat bez textu a českou typografii doplnit v Canvě nebo Figmě.

Model Krátké slovo (3–5 písmen) Věta (5–10 slov) Háčky a čárky Doporučení
Ideogram 3.0 Spolehlivě Většinou Zvládá První volba pro text
GPT Image 1.5 Spolehlivě Většinou Zvládá Druhá volba, zdarma v ChatGPT
Imagen 4 Spolehlivě Občas chyba Občas vypadne Krátké titulky ano, dlouhé ne
Recraft V4 Spolehlivě Spolehlivě (lze ručně upravit) Zvládá Text zadáváte samostatně
Flux 2 Pro / Max Občas Zřídka Vynechá Text generujte bez diakritiky
Midjourney V7/V8 Občas Zřídka Vynechá Text raději nedávejte do promptu
SDXL (bez LoRA) Zřídka Skoro nikdy Skoro nikdy Jen s textovou LoRA

Důvod, proč některé modely češtinu prakticky nevidí, je trénink. Open-source modely jako SDXL se trénovaly na datasetu LAION-5B, kde textový popis obrázku byl v drtivé většině případů v angličtině. Modely tak mají v hlavě slabou asociaci mezi vizuální formou znaku „ř" nebo „š" a jeho sémantikou. Nové generace (GPT Image 1.5, Imagen 4, Ideogram 3) mají přimíchanou podstatně větší porci českých dat, proto zvládají diakritiku lépe.

Praktický trik: generovat bez textu, text doplnit samostatně

Pokud máte na výběr, generujte obrázek bez textu a typografii přidejte v Canvě, Figmě nebo Photoshopu. Výsledek bude vždy čitelný, konzistentní s firemním fontem a bez nutnosti iterovat kvůli chybějícímu háčku. Tato hybridní cesta funguje univerzálně — AI pro vizuál, klasické nástroje pro finální typografii.

Self-hosted cesta — kdy má smysl open source

Běžnému začátečníkovi nedoporučujeme otevírat ComfyUI dříve, než si vyzkouší alespoň jeden placený API model. Open-source stack má totiž strmou křivku učení a řadu pastí, které zabijí produktivitu na týdny. Přesto existují scénáře, kdy je self-hosting jediná rozumná cesta.

Pět situací, kdy self-host vyhraje

1. Objem přes 5 000 obrázků měsíčně. Jakmile překročíte tuto hranici, měsíční náklady na API (i u nejlevnějšího Flux 2 Klein) přesáhnou cenu střední grafické karty do půl roku.

2. Citlivá data nesmí opustit firmu. Produktové fotografie před launchem, fotografie zaměstnanců pro interní use, medicínské snímky. Veřejné API je jejich odesláním vystavuje riziku úniku.

3. Potřeba fine-tune. Pokud chcete model natrénovat na vlastní brand styl nebo specifickou postavu (maskot, opakující se produkt), LoRA fine-tune nad SDXL nebo FLUX.1 řeší to, co žádné veřejné API nepodporuje.

4. Batch pipeline a automatizace. Tisíce obrázků denně v konstantním workflow (například katalog e-shopu) se lépe škálují přes lokální GPU než přes rate-limitované API.

5. Experiment a výzkum. Modelové parametry, kombinace LoRA, nové sampling metody — všechno vyžaduje přímý přístup k modelu, který API neposkytují.

Pro self-hosting

  • Nula korun za obrázek po nákupu HW
  • Plná kontrola nad daty
  • LoRA fine-tune a vlastní modely
  • Tisíce komunitních rozšíření
  • Žádné limity ani rate-limiting

Proti self-hostingu

  • Nutná grafická karta od 12 GB VRAM
  • Desítky hodin učící křivky
  • Žádný support, jen komunita
  • Vyšší spotřeba elektřiny
  • Čas údržby a aktualizací

Hardware a software v kostce

Minimální doporučená sestava: grafická karta NVIDIA RTX 3060 12 GB (v bazaru kolem 6 000 Kč) nebo novější RTX 4070 (nová cca 18 000 Kč). Plná verze FLUX.2 Dev vyžaduje 24 GB VRAM — tedy RTX 3090 z druhé ruky (15 000 Kč) nebo RTX 4090 (45 000 Kč nová). Na AMD a Apple Silicon (M-chipy) modely také běží, ale pomaleji a s občasnými kompatibilitními problémy.

Z pohledu softwaru existují dva hlavní proudy: ComfyUI (node-based vizuální workflow, plná kontrola, startovací bariéra 2–3 dny) a Stable Diffusion WebUI (klasické formuláře, rychlejší start, méně flexibility). Pro začátek doporučujeme Stability Matrix — správce, který nainstaluje obojí včetně modelů jedním klikem.

Sedm chyb, kterým se začátečník vyhne

Začátečnické chyby jsou natolik opakující se, že z nich lze složit kontrolní seznam. Pokud vám obrázky nevychází, pravděpodobně děláte některou z následujících sedmi věcí.

Checklist — čeho se vyvarovat

  1. Příliš obecný prompt. „Hezký obrázek" vede k generické stockové estetice. Vždy přidejte minimálně čtyři z pěti složek formule (téma, prostředí, světlo, styl, parametr).
  2. Ignorování stylu. Bez stylové kotvy (fotografie, akvarel, 3D render, Bauhaus) model vybere průměr. Výsledek bude vypadat jako každý druhý AI obrázek.
  3. První pokus jako finální. Nejlepší obrázek přichází obvykle při třetí až páté iteraci. Kdo se spokojí s prvním, zahazuje 80 % potenciálu.
  4. Generování pro „hezké" místo pro cíl. Obrázek má splnit konkrétní funkci — hero, ilustrace, produktová fotka. Estetika je prostředek, ne cíl.
  5. Neukládání promptů. Povedený prompt je majetek. Kdo si ho neuloží do poznámky nebo sdíleného dokumentu, opakuje práci pokaždé od nuly.
  6. Přeceňování negativních promptů. Midjourney --no nebo ekvivalenty v jiných nástrojích řeší okrajové případy. Pozitivní formulace funguje lépe.
  7. Ignorování povinného označení (EU AI Act). Od srpna 2026 platí v EU povinnost označovat AI-generovaný obsah. Kdo dnes publikuje bez metadat nebo watermarku, za pár měsíců porušuje předpis.

Týdenní plán: od nuly k použitelnému workflow

Kdo s AI obrázky začíná od nuly, pravděpodobně ztratí týden jen vybíráním nástroje. Následující plán tenhle paralyzační krok odstraňuje — každý den má konkrétní cíl a končí reálným výstupem.

Sedmidenní plán

Den 1 — GPT Image 1.5 v ChatGPT. Pokud máte ChatGPT Plus, zadejte první prompt podle pětisložkové formule. Vygenerujte pět variant stejného tématu s různými styly (fotografie, akvarel, ilustrace, 3D, minimalismus). Cíl: zjistit, jak moc styl mění výsledek.

Den 2–3 — Ideogram Free. Zaregistrujte se a využijte 10 promptů denně (celkem 80 obrázků za dva dny). Soustřeďte se na prompty s českým textem: plakáty, loga s názvem firmy, obálky článků. Cíl: zjistit, jak funguje typografie v češtině.

Den 4 — Rozhodovací strom. Projděte si šest use-casů v tomto článku a určete, které z nich vás čekají v příštích 30 dnech. Podle toho vyberte primární placený nástroj — pravděpodobně jeden z trojice Midjourney Standard, Flux 2 Pro (API přes Replicate) nebo Imagen 4 Fast.

Den 5 — Prompt knihovna. Uložte si 10 nejlepších promptů z prvních čtyř dnů do poznámkového nástroje (Notion, Obsidian, Apple Notes). Každý prompt opatřete popiskem, modelem a ukázkovým výstupem. Tato knihovna se bude rozrůstat měsíce.

Den 6–7 — Reálná produkce. Vygenerujte 20–30 obrázků k reálnému účelu: hero obrázky na článek, ilustrace do newsletteru, produktové fotky, sociální posty. Sledujte, kde model vytváří hodnotu a kde naopak přidává zbytečný krok.

Po sedmi dnech budete mít přehled o cenách, kvalitě, silných a slabých stránkách každého modelu a hlavně prompt knihovnu, ze které budete čerpat dalších dvanáct měsíců. Investice času do tohoto týdne se obvykle vrátí do měsíce v podobě úspor za stockové fotografie nebo externího grafika.

Co dál: pokročilé techniky

Jakmile zvládnete základ, čeká vás druhá úroveň. Čtyři techniky, které dělají rozdíl mezi amatérským a profesionálním workflow:

Upscaling. AI modely často generují obrázky v rozlišení 1024 × 1024 nebo 1536 × 1536 pixelů. Pro tisk nebo hero na velké obrazovky je to málo. Nástroje jako Topaz Gigapixel, Real-ESRGAN nebo vestavěný upscaler v Midjourney zvětší obrázek čtyřnásobně bez viditelné ztráty kvality.

Inpainting. Některé modely (ChatGPT v editačním režimu, Adobe Firefly, ComfyUI) umí přepsat jen část obrázku. Změníte barvu košile, přidáte do ruky knihu, odstraníte nepotřebný objekt — bez nutnosti generovat celou scénu znovu.

Referenční obrázky. Midjourney, Flux 2 a Imagen 4 přijímají vstupní obrázek jako referenci. Model pak aplikuje svou stylizaci na vaši kompozici. Používá se pro udržení konzistentní postavy napříč scénami (komiks, knižní ilustrace) nebo pro doladění konkrétního stylu.

Batch a variace. Když máte fungující prompt, nechte model vygenerovat 20–50 variant a vyberte top tři. Řada firem na objemové produkci má automatizované pipelines, které generují stovky variací přes noc a ráno je k revizi předkládá grafik.

Časté otázky

Potřebuji grafické vzdělání, abych s AI obrázky začal?

Ne. Dobrý prompt vychází spíš z jazykové přesnosti než z výtvarné průpravy. Kdo umí popsat scénu v jasných detailech, zvládne generovat obrázky okamžitě. Základní principy kompozice (pravidlo třetin, zlatý řez, pohled fotoaparátu) se hodí, ale nejsou nutné pro start.

Můžu vygenerované obrázky komerčně použít?

Ve většině případů ano, ale licence se liší mezi nástroji a tarify. Midjourney Basic má omezení pro firmy nad 1 milion dolarů ročního obratu, Ideogram a GPT Image 1.5 poskytují komerční práva i ve free tieru. Detailní rozbor je v navazujícím článku AI obrázky a autorská práva: Co smíte a co ne, který řeší i povinné označování od srpna 2026.

Který model je nejlepší pro realistickou fotografii?

Pro fotorealismus aktuálně vede Flux 2 Pro nebo Max (detaily pleti, textury, osvětlení). Druhá volba je Midjourney V8 Alpha se stylem --style raw. Imagen 4 Ultra je srovnatelný a levnější, za cenu menší stylové flexibility.

Proč mi modely nedělají správně češtinu v obrázku?

Trénovací data většiny modelů byla převážně anglická. Nové verze (GPT Image 1.5, Imagen 4, Ideogram 3.0) zvládají českou diakritiku podstatně lépe, ale Midjourney, Flux 2 a SDXL bez specializované LoRA ji často vynechají. V praxi se vyplatí generovat obrázek bez textu a typografii přidat v Canvě nebo Figmě.

Kolik mě to bude stát za rok?

Záleží na objemu. Tvůrce obsahu se 100 obrázky měsíčně vystačí s Ideogram Free plus občasným Imagen 4 Fast za zhruba 500–1 000 Kč ročně. Malá firma s 500 obrázky měsíčně utratí 2 000–8 000 Kč ročně podle výběru modelu. Agentura nebo e-shop se stovkami obrázků denně mění rovnici ve prospěch Midjourney Standard nebo self-hostingu.

Vyplatí se self-hosted řešení pro malou firmu?

Obvykle ne. Náklady na grafickou kartu (15–45 tisíc Kč) a čas potřebný na učení (desítky hodin) se zaplatí až při objemu přes 5 000 obrázků měsíčně. Menší objemy jsou na API nástroji levnější i časově efektivnější.

Závěr: začněte dnes, neřešte nástroj

Největší překážkou v AI obrázcích není technologie, ale paralýza z výběru. Kdo stráví týden čtením srovnání, ztratí týden, kdy mohl generovat. Ať už vyberete GPT Image 1.5 v ChatGPT, Ideogram Free nebo Imagen 4 Fast, první obrázek můžete mít za pět minut. Špatná volba modelu vás stojí tři dolary; čekání na správný moment stojí měsíce.

Hlavní posun roku 2026 spočívá v tom, že cena přestala být bariérou. Za stokorunu měsíčně dnes dostanete profesionální nástroj, který v roce 2023 neexistoval v žádné cenové hladině. Otázka už nezní „Mohu si to dovolit?", ale „Na co to využiju a jak napíšu dobrý prompt?". Odpovědi najdete v tomto článku; zbytek je praxe.

Doporučujeme začít jednoduchým pokusem: otevřete ChatGPT, napište prompt podle pětisložkové formule a za tři minuty budete mít první obrázek. Pokud později potřebujete řešit autorská práva, komerční licence nebo povinné označování podle EU AI Act, podívejte se na náš článek AI obrázky a autorská práva: Co smíte a co ne. Obecnější náklady a ekonomiku AI API pokrývá text Náklady na AI API: Jak nekrvácet na tokenech a širší kontext kreativní AI najdete v článku AI a kreativita: Jak mění hudbu, film a design.