AI modely: Google Gemini vs. Anthropic Claude
Jozo
Jozo
2024/09/12
16 min read

Gemini vs Claude: Porovnání vedoucích AI modelů a jejich budoucí důsledky

Umělá inteligence se rychle vyvíjí a pravidelně se objevují nové modely a schopnosti. Dva prominentní hráči v tomto oboru jsou Gemini od Googlu a rodina Claude 3 od Anthropic. Pojďme si podrobněji prohlédnout, jak se tyto AI modely porovnávají, a prozkoumejme některé z jejich fascinujících aspektů.

Úvod do modelů

  1. Gemini: Vyvinuto společností Google, je to nástupce Bard. Rodina zahrnuje:
    • Gemini Ultra: nejmocnější model s nejlepším výkonem na trhu na vysoce složité úkoly. Umí navigovat otevřené výzvy a scénáře bez znalostí s pozoruhodnou plynulostí a podobným chápáním člověka.
    • Gemini Pro: dosahuje ideální rovnováhy mezi inteligencí a rychlostí, zejména pro podnikové zatížení
    • Gemini Nano: nejrychlejší, nejkompaktnější model pro téměř okamžitou odezvu. Odpovídá na jednoduché dotazy a požadavky bezkonkurenční rychlostí.
    • Gemini Nano 2: nejrychlejší, nejkompaktnější model pro téměř okamžitou odezvu. Odpovídá na jednoduché dotazy a požadavky bezkonkurenční rychlostí.
  2. Rodina Claude 3: Vytvořeno společností Anthropic, zahrnuje tři modely:
    • Claude 3 Opus: nejinteligentnější model s nejlepším výkonem na trhu na vysoce složité úkoly. Umí navigovat otevřené výzvy a scénáře bez znalostí s pozoruhodnou plynulostí a podobným chápáním člověka.
    • Claude 3.5 Sonnet: dosahuje ideální rovnováhy mezi inteligencí a rychlostí, zejména pro podnikové zatížení
    • Claude 3 Haiku: nejrychlejší, nejkompaktnější model pro téměř okamžitou odezvu. Odpovídá na jednoduché dotazy a požadavky bezkonkurenční rychlostí.

Obecné možnosti

Oba GPT-4 a rodina Claude 3 jsou pokročilé jazykové modely. Mohou:

  • Rozumět a generovat text podobný člověku
  • Odpovídať na otázky na nejrůznější témata
  • Asistovat s různými úkoly jako je psaní a analýza
  • Použít schopnosti vidění k pochopení obrázků

Benchmarky

Multi-task Language Understanding on MMLU

Leaderboard

Multi-task Language Understanding on MMLU Leaderboard

Další benchmarky

Benchmarky pro Claude 3.5

Testy

Podívejme se, jak si tyto modely vedou v několika testech:

Uvažování

Co bylo dříve: slepice nebo vejce?

Gemini Flash:

Vejce přišlo dřív.

Přestože se to zdá kontraintuitivní, je tato starobylá hádanka skvělým příkladem kruhového argumentu. Vejce existovala dlouho před slepicemi. Denostaurů a mnoho dalších plazů kladlo vejce miliony let před první slepicí. Slepice, jak ji známe, je jednoduše potomkem těchto tvorů, kteří kladli vejce.

Vejce, v jeho obecnější podobě, tedy existovala před slepicí.

Claude Sonnet 3.5:

Klasická otázka "Co bylo dříve, slepice nebo vejce?" je jak filozofická, tak vědecká. Vědecky vzato, vejce přišlo dřív. Podle evoluční biologie se ptáci vyvinuli z plazů a plazi kladli vejce dlouho předtím, než existovaly slepice. Pokud tedy vysledujete lineáž slepic zpět skrz evoluční historii, bylo vejce kladené ptákem, který nebyl zcela slepicí, ale jeho potomek - slepice - se vylíhnul z tohoto vejce.

Filozoficky lze argumentovat oběma způsoby v závislosti na vašem pohledu na příčinu a následek. Ale z biologického hlediska má vejce výhodu!

Personalizace a paměť

Tato sekce se týká uživatelské zkušenosti při interakci s AI modely prostřednictvím jejich příslušných rozhraní.

  • Gemini: Rozhraní AI modelu Googlu, které poskytuje konverzační zkušenost, ale neuchovává trvalou paměť o uživatelských interakcích mezi sezeními.
  • Claude: Rozhraní AI asistenta od Anthropic, které také nabízí chat-based interakci, ale podobně neuchovává informace o uživateli mezi rozhovory.

Tyto rozdíly v možnostech paměti a personalizace mohou významně ovlivnit uživatelskou zkušenost a schopnost AI poskytovat kontextově relevantní odpovědi.

Kdo jsem?

Gemini Flash:

Jste uživatel, který si tuto otázku klade.

Chcete se dozvědět něco konkrétního sami o sobě? Možná se divíte na své zájmy, cíle nebo rysy osobnosti. Klidně se ptejte!

Claude Sonnet 3.5

Nemám žádné konkrétní informace o tom, kdo jste. Jsem AI asistent vytvořený společností Anthropic, aby byl užitečný, neškodný a poctivý. Nemám přístup k osobním informacím o jednotlivých uživatelích.

Obrázky

Popište obrázek

Elon Musk představující Tesla na pódiu

Gemini Flash:

Mohu extrahovat pouze text a identifikovat některé objekty a veřejné osobnosti na tomto obrázku.

Bohužel nemohu zpracovat obrázky přímo. Však si na základě poskytnutých informací mohu učinit nějaké kvalifikované odhady.

Možný obsah na obrázku:

Vozidla Tesla: Vzhledem ke klíčovým slovům "Tesla Model 3, Tesla Model S, Tesla" je pravděpodobné, že obrázek obsahuje jedno nebo více z těchto elektrických aut.
Elon Musk: Jako prominentní postava spojená s Teslou je možné, že je přítomen na obrázku, možná při projevu na akci nebo v póze s vozidlem Tesla.
Pokud byste mohli poskytnout více kontextu nebo popis obrázku, mohl bych vám dát přesnější odpověď.

Claude Sonnet 3.5: "Obrázek ukazuje muže v černém obleku procházejícího scénu a mávajícího publiku. V pozadí je velký obrázek nebo obrazovka zobrazující stříbřité elektrické auto Tesla. Auto se zdá být Model 3 Tesla nebo podobný model, zobrazený v pohybu na silnici.
Muž na scéně má krátké tmavé vlasy a nosí černý oblek s bílou košilí. Mává pravou rukou zvednutou. V popředí vidíme zvednuté ruce publika, což naznačuje, že se jedná o nějakou prezentaci nebo akci. Jedna osoba v publiku drží něco, co vypadá jako světle fialový nebo růžový list papíru.
Celková scéna naznačuje, že se jedná pravděpodobně o spuštění produktu Tesla nebo propagační akci, kde vedoucí společnosti představuje auto nadšenému publiku. "

Claude Sonnet 3.5:

Muž na scéně má krátké tmavé vlasy a nosí černý oblek s bílou košilí. Mává pravou rukou zvednutou.
V popředí vidíme zvednuté ruce publika, což naznačuje, že se jedná o nějakou prezentaci nebo akci. Jedna osoba v publiku drží něco, co vypadá jako světle fialový nebo růžový list papíru.<br/>
Celková scéna naznačuje, že se jedná pravděpodobně o spuštění produktu Tesla nebo propagační akci, kde vedoucí společnosti představuje auto nadšenému publiku.

Nástroje Google Gemini

Nástroje dostupné v rozhraní Gemini:

  • Google Search: Používám Google Search, abych získal některé své informace. Vydavatelé však mají možnost omezit přístup k jejich konkrétnímu obsahu nebo webům.
  • Google Flights: Mohu vyvolat informace z Google Flights.
  • Google Hotels: Mohu vyvolat informace z Google Hotels.
  • Google Maps: Mohu vyvolat informace z Google Maps.
  • YouTube: Mohu vyvolat informace z YouTube.
  • Gmail: Mohu používat Gmail k hledání e-mailů, shrnutí jednoho nebo více e-mailů a zodpovídání otázek, které si můžete položit z e-mailů. Mohu exportovat svou odpověď do vaší Gmailu.
  • Docs: Mohu prohledávat vaše dokumenty a pdf v jednotce. Mohu shrnout jeden nebo více vašich dokumentů a pdf a odpovědět na případné otázky ohledně jejich obsahu.
  • Gemini Advanced: Toto je upgradovaná verze nástroje, která může analyzovat různé běžné formáty textových, obrázkových a tabulkových souborů, včetně.doc,.docx,.pdf a.txt. Může analyzovat nahrané soubory až 1500 stran dlouhé.

Claude Artifacts

Jedinečná schopnost Claude vytvářet artefakty. Rozdělená obrazovka, vlevo chatujete a vpravo vidíte artefakty:

  • Dlouhé úryvky kódu nebo skripty
  • Markdown dokumenty
  • HTML, JS a CSS obsah
  • SVG obrázky
  • Mermaid diagramy
  • React komponenty

Claude Artifacts pro generování kódu a dokumentů

Znalosti a aktualizace

Je důležité poznamenat, že tyto AI modely mají "cutoff znalostí" - data, za kterou nemají informace o celosvětových událostech. Vždy si ověřte nejnovější dokumentaci, abyste se dozvěděli nejnovější informace o jejich schopnostech a znalostech.


ModelCutoff znalostí
Claude Sonnet 3.5Duben 2024
Google GeminiListopad 2023

Ceny

API

ModelVstupní tokenyVýstupní tokenyContext Caching
Claude 3.5 Sonnet$3$15$3.75 write, $0.3 write
Claude 3.5 Opus$15$75$18.75 write, $1.5 read
Claude 3.5 Haiku$0.25$1.25$0.3 write, $0.03 read
Gemini Flash <128k$0.075$0.30$0.01875
Gemini Flash >128k$0.150$0.60$0.0375
Gemini 1.5 Pro <128k$1.50$7.50$0.875
Gemini 1.5 Pro >128k$3.00$15.00$1.75

Jednotka v ceníku je "MTok" a znamená 1 milion tokenů

Cena Gemini pro dlouhá kontextová okna (>128k tokenů) je dvojnásobek základní ceny.

Modely Claude mají kontextové okno 200k tokenů. 500k v plánech pro podniky. Max 8k výstupních tokenů. Modely Gemini mají až 1M kontextové okno tokenů. Max 8k výstupních tokenů.

Webové rozhraní

ModelZdarmaJednotlivecTým
ClaudeS omezeními$20/osoba/měsíc$25/osoba/měsíc
GeminiGemini Flash$21.99/osoba/měsíc$20,$30/osoba/měsíc

Google Workspace: Gemini Business: $20

  • Gemini v Gmailu, Docs, Drive, Slides, Sheets a Meet
  • Přístup k Gemini s nejschopnějšími AI modely Googlu
  • 1 rok závazku

Gemini Workspace: Gemini Enterprise: $30

  • Pokročilá setkání s AI poznámkami a přeložené titulky v 65+ jazycích
  • Automaticky klasifikovat, označovat a chránit citlivé dokumenty s AI
  • Plný přístup a používání Gemini
  • 1 rok závazku

Závěr

Výběr mezi Gemini a Claude modely závisí na vašich konkrétních potřebách:

  • Gemini nabízí řadu možností:
    • Ultra pro složité úkoly a hluboké chápání
    • Pro vyváženou výkonnost v podnikových nastaveních
    • Nano pro rychlé, každodenní interakce
  • Modely Claude 3 poskytují specializované schopnosti:
    • Opus pro intriky úkoly a pokročilé uvažování
    • Sonnet (3.5) pro všestranné obecné použití
    • Haiku pro rychlé, efektivní odpovědi

Tyto AI modely přetvářejí naše chápání inteligence a zpochybňují tradiční představy o lidské poznání. Jak se AI krajina vyvíjí, představuje jak vzrušující příležitosti, tak složité výzvy.

Pro efektivní využití těchto technologií:

  • Zůstaňte informováni o nejnovších vývoji
  • Kriticky vyhodnoťte silné a slabé stránky každého modelu
  • Zvažte širší důsledky pro váš konkrétní případ použití

Pamatujte, že pole AI je dynamické. Vždy se obraťte na oficiální dokumentaci od Googlu a Anthropic, abyste získali nejnovější informace o modelech Gemini a Claude. Tím, že zůstanete informováni a schopni přizpůsobit se, můžete navigovat touto transformativní technologickou krajinou a odpovědně využívat její potenciál.