Blog

ChatGPT přidává knihovnu obrázků

ChatGPT má novou knihovnu pro obrázky. Uživatelé konečně získávají přehled

OpenAI přidalo do ChatGPT funkci, která výrazně zlepšuje práci s vizuálním obsahem. Jde o novou knihovnu obrázků, která automaticky ukládá všechny vizuály vygenerované pomocí AI. Uživatelé tak konečně nemusí složitě procházet historii chatu, aby se dostali ke starším výstupům.

Všechny obrázky přehledně na jednom místě

Knihovna je přístupná v levém panelu rozhraní ChatGPT, a to jak na webu, tak v mobilní aplikaci pro iOS a Android. Po kliknutí na záložku „Knihovna“ se zobrazí mřížka s přehledem všech dříve vygenerovaných obrázků. Funkce je dostupná pro všechny uživatele – bez ohledu na to, zda používají bezplatnou nebo placenou verzi (Free, Plus, Pro).

Co knihovna aktuálně umí

Každý obrázek lze:

  • zobrazit ve vysokém rozlišení,
  • uložit do zařízení (Save),
  • zkopírovat (Copy),
  • sdílet přes jinou aplikaci (Share).

Kromě toho je možné přímo z knihovny obrázky dále upravovat. Tlačítko „Edit“ vytvoří nový chat, kde lze zadat nový prompt pro úpravu. Funkce „Select“ umožňuje vybrat konkrétní část obrázku pro selektivní editaci, přičemž výběrový nástroj má nastavitelné rozměry a lze využít i funkce zpět/vpřed.

Pro pohodlné navázání práce je ve spodní části obrazovky k dispozici tlačítko „Make Image“, které umožní okamžité vytvoření nového obrázku bez nutnosti přecházet do nového chatu.

V krátkém videu OpenAI ukazuje, jak to funguje:

Ne všechny obrázky se zobrazí hned

Aktuálně knihovna zobrazuje pouze obrázky vytvořené novým modelem GPT-4o. Starší obrázky vytvořené pomocí DALL·E 2 nebo předchozích generací se do knihovny nezobrazí automaticky. OpenAI však potvrdilo, že probíhá zpětné doplňování starších výstupů (tzv. backfilling), takže se některé obrázky mohou objevit s odstupem několika dní.

Odstranění obrázku je zatím složité

Uživatelé zatím nemohou obrázky mazat přímo z knihovny. Aby byl obrázek odstraněn, je nutné:

  • najít původní konverzaci, ve které byl vytvořen,
  • smazat celý chat.

To je aktuálně považováno za největší nedostatek knihovny a očekává se, že OpenAI brzy přidá i přímé tlačítko pro mazání jednotlivých obrázků přímo z knihovny.

Užitečný nástroj pro všechny, kdo s AI obrázky pracují

Ačkoli se jedná o relativně jednoduchou funkci, představuje pro pravidelné uživatele AI generovaných obrázků výrazné zlepšení. Knihovna usnadňuje orientaci, šetří čas a dává lepší kontrolu nad vizuálními výstupy.

Očekává se, že OpenAI bude knihovnu dále rozvíjet – například přidáním možnosti řazení, filtrování, tagování nebo přímé archivace. Už nyní ale patří mezi funkce, které výrazně zvyšují použitelnost ChatGPT pro kreativní i pracovní účely.

ChatGPT se posouvá i v oblasti multimédií

Tato novinka přichází krátce po uvedení modelu GPT-4o (označovaný jako „GPT-4 Omni“), který propojuje práci s textem, obrázky i zvukem do jednoho plynulého systému. Uživatelé nyní mohou vytvářet multimodální výstupy efektivněji než kdy dřív, a právě knihovna obrázků zapadá do této širší strategie OpenAI – nabídnout všechen obsah generovaný umělou inteligencí na jednom místě a pod jedním účtem.

Vedle nové knihovny OpenAI zároveň testuje funkce, které dále rozšiřují práci s vizuálním obsahem. Mezi ně patří:

  • generování více variant jednoho výstupu,
  • přesnější editace pomocí pokynů (např. styl „inpainting“),
  • možnosti tzv. image remixingu, tedy přetváření původního výstupu podle nové instrukce.

Tyto možnosti zatím nejsou dostupné všem, ale ukazují, kam vývoj směřuje.

Je to jen začátek

Ačkoli může knihovna působit jako drobná úprava, ve skutečnosti znamená zásadní posun v uživatelské přívětivosti a správě obsahu. Mnozí, kdo s ChatGPT pracují intenzivně, ocení, že už není třeba složitě proklikávat historii konverzací a ztrácet čas hledáním.

Dá se předpokládat, že OpenAI tuto filozofii rozšíří i na další výstupy – například texty nebo zvukové záznamy. Cílem je vytvořit jeden ucelený prostor, kde má uživatel přístup ke všem svým výtvorům, ať už byly vytvořeny kdykoli a jakoukoli modalitou.

🔗 Zdroje

OpenAI – ChatGPT Image Library (duben 2025)
The Verge – ChatGPT gets a new image library (16. dubna 2025)
Lifehacker – ChatGPT's new image library explained (16. dubna 2025)

Grok je na Androidu

Grok od Elona Muska nově zdarma na Androidu i v Česku: Co umí a jak si vede proti konkurenci?

Elon Musk rozšiřuje dosah své umělé inteligence Grok. Od 8. dubna 2025 je aplikace dostupná zdarma ke stažení na Google Play i pro české uživatele. Jaká je realita za marketingem „pochopení vesmíru“ a stojí Grok za vyzkoušení?

Grok dorazil do Česka: Kde a jak ho stáhnout?

Grok, chatbot vyvíjený společností xAI a propojený s Muskovou sítí X (dříve Twitter), se v Česku oficiálně objevuje jako mobilní aplikace.

📱 Dostupnost:

  • Platforma: Android (verze 9 a vyšší)
  • Jazyk: Čeština
  • Cena: Zdarma (beta verze)
  • Ke stažení: Google Play – Grok

Už dříve bylo možné Grok používat přes X nebo na webu Grok.com, ale mobilní verze přináší uživatelsky přívětivější rozhraní pro každodenní využití. Aplikace se zatím nachází v beta režimu, což s sebou nese určité limity, ale také příležitost sledovat její rychlý vývoj.

První spuštění: Přihlášení a výběr modelu

Po instalaci vás čeká přihlášení – přes Google, účet X nebo e-mail. Následně musíte povolit nebo odmítnout zasílání notifikací a potvrdit svůj věk.

Po přihlášení vás přivítá chatbot a hned na hlavní obrazovce si můžete vybrat, který model chcete používat:

  • Grok 2 – základní model
  • Grok 3 – výchozí, nejchytřejší model zdarma
  • SuperGrok – placený model s rozšířenými funkcemi

💰 Cena SuperGroku:

  • Měsíčně: 849,99 Kč
  • Ročně: 8 599,99 Kč

Prémiový tarif odemyká funkce jako DeepSearch, Think, předčasný přístup k novinkám a prioritní podporu. Cenově jde o nejdražší AI předplatné na trhu – pro srovnání, GPT-4 Turbo od OpenAI (v rámci ChatGPT Plus) vyjde na cca 470 Kč měsíčně.

Co Grok umí a co zatím ne?

Základní konverzace probíhají podobně jako u jiných chatbotů – kladete otázky, žádáte o rady, tvoříte texty. Chaty se ukládají a můžete je sdílet, upravovat i hodnotit.

🔧 Další funkce v aplikaci:

  • Přidávání fotek z galerie
  • Nahrávání souborů
  • Pořizování fotek přes fotoaparát (pouze uložení, žádná vizuální analýza)

Generování obrázků: Zatím velké zklamání

Ačkoliv Grok deklaruje schopnost generovat obrázky, v praxi je tato funkce velmi omezená. Při pokusu o vygenerování opice byly jako výstup zobrazeny dvě fotky Baracka Obamy. A složitější výstup – například chlapce na pískovišti – skončil hláškou o nevhodném obsahu.

V oblasti obrazové AI tak Grok výrazně zaostává za konkurencí typu ChatGPT s DALL·E 3, Gemini, nebo Midjourney. Nejde ani tak o nedostatek schopností, ale spíše o přehnanou moderaci, která filtruje i běžné dotazy.

Webová verze Groku: Pro náročnější úkoly

Zatímco mobilní aplikace je ideální pro rychlé dotazy a zábavné konverzace, webová verze na Grok.com nabízí pokročilejší funkce jako:

  • Práce s kódem
  • Analýza dat
  • Lepší stabilita při generování obsahu

Jak si Grok vede proti konkurenci?

FunkceGrokChatGPT (GPT-4 Turbo)Gemini (Pro 1.5)
Cena (měsíčně)849 Kč (SuperGrok)cca 470 Kčzdarma / Gemini Advanced (cca 540 Kč)
Generování obrázkůNedokonaléVýborné (DALL·E 3)Dobré
Práce s dokumentyOmezenáAno (soubory, PDF)Ano
Mobilní aplikaceNově dostupnáAnoAno
ČeštinaAnoAnoAno

Aktuální vývoj a budoucnost Groku

Grok je stále ve vývoji, a to poměrně rychlém. Elon Musk oznámil, že do budoucna plánuje integraci Groku do dalších produktů Tesly a SpaceX, stejně jako propojení s rozhraním Neuralink. Na jaře 2025 se očekává nasazení Grok 4, který má přinést výrazné zlepšení schopností u generování multimédií a kontextového chápání.

🔗 Zdroje

Google Blog – Gemini 2.5: Our most intelligent AI model (25. března 2025)
TechCrunch – Gemini 2.5 Pro is Google's most expensive AI model yet (4. dubna 2025)
xAI – Grok Beta for Android now available (8. dubna 2025)
Tom's Guide – Grok's Android app reviewed (9. dubna 2025)

LLAMA 4

Meta představuje Llama 4: Ambiciózní multimodální modely s kontroverzemi

Společnost Meta nedávno uvedla na trh novou generaci velkých jazykových modelů Llama 4, které slibují výrazné zlepšení výkonu a schopností oproti předchozím verzím. Nové modely přinášejí nativní multimodalitu, architekturu Mixture-of-Experts (MoE) a podporu pro více jazyků. Nicméně, kolem jejich schopností a benchmarkových výsledků se objevily pochybnosti.

Klíčové inovace Llama 4

1. Mixture-of-Experts (MoE) architektura

Llama 4 je první model od Mety, který využívá MoE architekturu. Namísto jedné velké neuronové sítě model aktivuje pouze podmnožinu „expertů“ specializovaných na různé úkoly. Tato architektura umožňuje efektivnější škálování výkonu a snižuje výpočetní náročnost.

2. Nativní multimodalita

Modely Llama 4 jsou schopny zpracovávat nejen text, ale i obrazové vstupy. Díky „early fusion“ přístupu integrují textové a vizuální informace již během tréninku, což zlepšuje jejich schopnost porozumět komplexním multimodálním datům.

3. Rozšířená jazyková podpora

Llama 4 byla trénována na datech ve více než 200 jazycích, přičemž u poloviny z nich bylo použito přes miliardu tokenů. Modely podporují 12 jazyků, včetně angličtiny, španělštiny, němčiny a francouzštiny.


Představení modelů Llama 4

Llama 4 Scout

  • Aktivní parametry: 17 miliard (celkem 109 miliard)
  • Počet expertů: 16
  • Kontextové okno: až 10 milionů tokenů
  • Využití: efektivní provoz na jednom GPU, vhodný pro úlohy vyžadující dlouhý kontext

Llama 4 Maverick

  • Aktivní parametry: 17 miliard (celkem 400 miliard)
  • Počet expertů: 128
  • Kontextové okno: až 1 milion tokenů
  • Využití: univerzální model pro chat, kódování a multimodální úlohy​

Llama 4 Behemoth (v přípravě)

  • Aktivní parametry: 288 miliard (celkem 2 biliony)
  • Počet expertů: 16
  • Stav: model je stále ve fázi tréninku, očekává se jeho uvedení v následujících měsících​

Kontroverze a pochybnosti

Spor o benchmarky

Meta čelí kritice za údajné manipulace s benchmarkovými testy. Model Llama 4 Maverick dosáhl vysokého skóre na platformě LMArena, avšak bylo zjištěno, že Meta použila speciálně upravenou verzi modelu optimalizovanou pro tento test. Tato verze nebyla veřejně dostupná, což vyvolalo otázky o transparentnosti a férovosti srovnání.

Pochybnosti o kontextovém okně

Meta tvrdí, že model Scout zvládne kontextové okno až 10 milionů tokenů. Nicméně, odborníci upozorňují na technické limity současného hardwaru a architektury, které mohou bránit efektivnímu využití takto rozsáhlého kontextu.

Etické otázky tréninkových dat

Interní dokumenty Mety odhalily, že při tréninku modelů Llama byly použity i neautorizované zdroje, včetně pirátských kopií knih. Tato praxe vyvolává otázky ohledně autorských práv a etiky při získávání tréninkových dat. ​


Shrnutí

Llama 4 představuje významný krok vpřed v oblasti velkých jazykových modelů, zejména díky zavedení MoE architektury a nativní multimodality. Nicméně, kontroverze kolem benchmarkových testů, technických omezení a etických otázek naznačují, že je třeba přistupovat k těmto novinkám s opatrností. Uživatelé by měli pečlivě zvážit, zda Llama 4 skutečně splňuje jejich specifické potřeby a očekávání.​


🔗 Zdroje

GEMINI 2.5 PRO

Gemini 2.5 Pro: Nejdražší, ale také nejvýkonnější AI model od Googlu

Google posouvá hranice umělé inteligence představením modelu Gemini 2.5 Pro – svého dosud nejvýkonnějšího jazykového modelu, který v benchmarkových testech překonává konkurenci. Spolu s tím však přichází i nejvyšší cenovka, jakou kdy Google za přístup k AI modelu požadoval. I přesto si model rychle nachází místo mezi profesionály a vývojáři, kteří hledají maximální výkon a přesnost.

Výkon, který předbíhá konkurenci

Gemini 2.5 Pro se prezentuje jako multimodální model s podporou dlouhého kontextu (až 1 milion tokenů pro čtení), vysokou přesností odpovědí a vynikajícími výsledky v odborných i syntetických testech.

V nezávislých měřeních, jako je SWE-Bench Verified či MMMU, dosahuje Gemini 2.5 Pro špičkových skóre. Výrazně se zlepšil také v oblasti tzv. „long-context“ pochopení a práci s dokumenty, což z něj činí ideální nástroj pro firemní implementace, výzkum i složitou automatizaci.

Cenová politika: Síla má svou cenu

Níže najdeš přehledné srovnání cen modelu Gemini 2.5 Pro v porovnání s jinými populárními modely na trhu:

ModelCena (vstup / mil. tokenů)Cena (výstup / mil. tokenů)
Gemini 2.5 Pro (do 200k tokenů)$1.25$10.00
Gemini 2.5 Pro (nad 200k tokenů)$2.50$15.00
Gemini 2.0 Flash$0.10$0.40
OpenAI o3-mini$1.10$4.40
DeepSeek R1$0.55$2.19
Claude 3.7 Sonnet$3.00$15.00
OpenAI GPT-4.5$75.00$150.00

Z tabulky je patrné, že Gemini 2.5 Pro se cenově řadí nad většinu běžně dostupných modelů, ale zároveň je dostupnější než modely jako GPT-4.5 od OpenAI. Tato cenová pozice potvrzuje ambici Googlu cílit na střední až vyšší segment uživatelů, kteří hledají kvalitu a spolehlivost.

Dynamika trhu a rostoucí poptávka

Vysoké ceny jsou do značné míry výsledkem stále rostoucí poptávky po výkonných AI modelech. Google uvádí, že počet vývojářů využívajících Gemini API nebo nástroje Google AI Studio vzrostl během posledního měsíce o 80 %. To poukazuje nejen na technologickou sílu modelu, ale i na důvěru, kterou v něj vývojářská komunita vkládá.

Současně se ukazuje, že napříč trhem dochází k výraznému zdražování – například nedávno vydaný model OpenAI o1-pro je dostupný za cenu až $150 za milion vstupních tokenů a $600 za milion výstupních tokenů.

Přístupnost a možnosti využití

Model Gemini 2.5 Pro je aktuálně k dispozici zdarma na oficiální stránce Gemini pro všechny uživatele, kteří se chtějí seznámit s jeho možnostmi. Bezplatná verze má omezený výkon a kontextové okno, ale postačí pro běžné testování.

Uživatelé, kteří si zaplatí Gemini Advanced ($20 měsíčně), získají výhody jako:

  • Delší kontextové okno
  • Více požadavků za minutu i den
  • Vyšší limity tokenů
  • Přístup k nejnovějším schopnostem modelu

Shrnutí: Výkon na úrovni – za cenu, která není pro každého

Gemini 2.5 Pro nastavuje laťku nejen z hlediska výkonu, ale i z pohledu ceny. Pro vývojáře, firmy a nadšence, kteří potřebují maximální přesnost, rozsah a stabilitu, se může jednat o ideální volbu – a to i navzdory vyšším nákladům. Díky výbornému poměru výkon/cena (ve srovnání s absolutní špičkou trhu) si Gemini 2.5 Pro rychle získává pozici v dynamicky se vyvíjejícím AI ekosystému.

🔗 Zdroje