KI-Modelle: Google Gemini vs. Anthropic Claude
Jozo
Jozo
2024/09/12
16 min read

Gemini vs Claude: Ein Vergleich führender KI-Modelle und ihrer zukünftigen Auswirkungen

Die künstliche Intelligenz entwickelt sich rasant weiter, mit neuen Modellen und Fähigkeiten, die regelmäßig entstehen. Zwei prominente Akteure auf diesem Gebiet sind OpenAIs GPT-4 und die Claude 3 Familie von Anthropic. Schauen wir uns genauer an, wie diese KI-Modelle sich vergleichen und erkunde einige ihrer faszinierenderen Aspekte.

Einführung in die Modelle

  1. Gemini: Entwickelt von Google, ist dies der Nachfolger von Bard. Die Familie umfasst:
    • Gemini Ultra: Das mächtigste Modell mit bester Marktleistung bei hochkomplexen Aufgaben. Es kann sich durch offene Prompts und unerwartete Szenarien mit bemerkenswerter Fließfertigkeit und menschenähnlichem Verständnis navigieren.
    • Gemini Pro: Bietet das ideale Gleichgewicht zwischen Intelligenz und Geschwindigkeit—besonders für Enterprise-Workloads
    • Gemini Nano: Schnellstes, kompaktestes Modell für nahezu sofortige Reaktivität. Es beantwortet einfache Abfragen und Anfragen mit unvergleichlicher Geschwindigkeit.
    • Gemini Nano 2: Schnellstes, kompaktestes Modell für nahezu sofortige Reaktivität. Es beantwortet einfache Abfragen und Anfragen mit unvergleichlicher Geschwindigkeit.
  2. Claude 3 Familie: Erstellt von Anthropic, dies umfasst drei Modelle:
    • Claude 3 Opus: Intelligentestes Modell, mit bester Marktleistung bei hochkomplexen Aufgaben. Es kann sich durch offene Prompts und unerwartete Szenarien mit bemerkenswerter Fließfertigkeit und menschenähnlichem Verständnis navigieren.
    • Claude 3.5 Sonnet: Bietet das ideale Gleichgewicht zwischen Intelligenz und Geschwindigkeit—besonders für Enterprise-Workloads
    • Claude 3 Haiku: Schnellstes, kompaktestes Modell für nahezu sofortige Reaktivität. Es beantwortet einfache Abfragen und Anfragen mit unvergleichlicher Geschwindigkeit.

Allgemeine Fähigkeiten

Sowohl GPT-4 als auch die Claude 3 Familie sind fortgeschrittene Sprachmodelle. Sie können:

  • Menschenähnliche Texte verstehen und generieren
  • Fragen zu einer breiten Palette von Themen beantworten
  • Bei verschiedenen Aufgaben wie Schreiben und Analyse helfen
  • Vision-Fähigkeiten nutzen, um Bilder zu verstehen

Benchmarks

Multi-task Language Understanding auf MMLU

Leaderboard

Multi-task Language Understanding auf MMLU Leaderboard

Weitere Benchmarks

Benchmarks für Claude 3.5

Tests

Schauen wir uns an, wie diese Modelle in ein paar Tests abschneiden:

Reasoning

Was war zuerst: das Huhn oder das Ei?

Gemini Flash:

Das Ei kam zuerst.

Obwohl es kontraintuitiv erscheinen mag, ist dieses uralte Rätsel ein großartiges Beispiel für einen Zirkelschluss. Eier existierten lange bevor es Hühner gab. Tatsächlich legten Dinosaurier und viele andere Reptilien Millionen von Jahren Eier, bevor das erste Huhn entstanden ist. Das Huhn, wie wir es kennen, ist einfach ein Nachkomme dieser eierlegenden Kreaturen.

Also existierte das Ei in seiner allgemeineren Form vor dem Huhn.

Claude Sonnet 3.5:

Die klassische Frage „Was war zuerst, das Huhn oder das Ei?" ist sowohl philosophisch als auch wissenschaftlich. Wissenschaftlich kam das Ei zuerst. Nach der Evolutionsbiologie entwickelten sich Vögel aus Reptilien, und Reptilien legten lange vor der Existenz von Hühnern Eier. Wenn du also die Abstammungslinie von Hühnern durch die Evolutionsgeschichte zurückverfolgst, gab es ein Ei, das von einem Vogel gelegt wurde, der nicht ganz ein Huhn war, aber sein Nachwuchs—das Huhn—schlüpfte aus diesem Ei.

Philosophisch kann es je nach deiner Perspektive auf Ursache und Wirkung in beide Richtungen argumentiert werden. Aber aus biologischer Sicht hat das Ei die Nase vorn!

Personalisierung und Gedächtnis

Dieser Abschnitt bezieht sich auf die Benutzererfahrung bei der Interaktion mit KI-Modellen über ihre jeweiligen Schnittstellen.

  • Gemini: Googles KI-Modell Schnittstelle, die eine Konversationserfahrung bietet, aber das Gedächtnis von Benutzerinteraktionen zwischen Sitzungen nicht speichert.
  • Claude: Anthropics KI-Assistent Schnittstelle, die auch eine Chat-basierte Interaktion bietet, aber ebenso Benutzerinformationen zwischen Gesprächen nicht speichert.

Diese Unterschiede in Gedächtnis- und Personalisierungsfähigkeiten können die Benutzererfahrung und die Fähigkeit der KI, kontextabhängige Antworten zu geben, erheblich beeinflussen.

Wer bin ich?

Gemini Flash:

Du bist der Benutzer, der diese Frage stellt.

Möchtest du etwas Bestimmtes über dich wissen? Vielleicht fragst du dich nach deinen Interessen, Zielen oder Persönlichkeitsmerkmalen. Frag mich gerne!

Claude Sonnet 3.5

Ich habe keine spezifischen Informationen über dich. Ich bin ein KI-Assistent, der von Anthropic entwickelt wurde, um hilfreich, harmlos und ehrlich zu sein. Ich habe keinen Zugriff auf persönliche Informationen über einzelne Benutzer.

Bilder

Beschreibe das Bild

Elon Musk präsentiert Tesla auf der Bühne

Gemini Flash:

Ich kann nur den Text extrahieren und einige Objekte und öffentliche Persönlichkeiten in diesem Bild identifizieren.

Leider kann ich Bilder nicht direkt verarbeiten. Basierend auf den bereitgestellten Informationen kann ich jedoch einige fundierte Vermutungen anstellen.

Möglicher Inhalt des Bildes:

Tesla-Fahrzeuge: Angesichts der Schlüsselwörter "Tesla Model 3, Tesla Model S, Tesla" ist es wahrscheinlich, dass das Bild ein oder mehrere dieser Elektroautos enthält.
Elon Musk: Als prominente Persönlichkeit, die mit Tesla verbunden ist, ist es möglich, dass er im Bild präsent ist, vielleicht bei einem Event sprechend oder mit einem Tesla-Fahrzeug posierend.
Wenn du mehr Kontext geben könntest oder eine Beschreibung des Bildes bereitstellen könntest, könnte ich dir eine genauere Antwort geben.

Claude Sonnet 3.5: "Das Bild zeigt einen Mann in einem schwarzen Anzug auf einer Bühne, der einem Publikum winkt. Im Hintergrund ist ein großes Bild oder ein Bildschirm, auf dem ein silbernes Tesla Elektroauto angezeigt wird. Das Auto scheint ein Tesla Model 3 oder ähnliches Modell zu sein, das in Bewegung auf einer Straße gezeigt wird. Der Mann auf der Bühne hat kurzes dunkles Haar und trägt einen schwarzen Anzug mit weißem Hemd. Er winkt mit seiner rechten Hand nach oben. Im Vordergrund können wir die erhobenen Hände des Publikums sehen, was darauf hindeutet, dass es sich um eine Art Präsentation oder ein Event handelt. Eine Person im Publikum hält etwas, das wie ein hellviolettes oder rosa Blatt Papier aussieht. Die Gesamtszene deutet darauf hin, dass es sich wahrscheinlich um ein Tesla-Produktstart- oder Promotionsevent handelt, bei dem der Unternehmensleiter das Auto einer begeisterten Menge präsentiert. "

Claude Sonnet 3.5:

Der Mann auf der Bühne hat kurzes dunkles Haar und trägt einen schwarzen Anzug mit weißem Hemd. Er winkt mit seiner rechten Hand nach oben.
Im Vordergrund können wir die erhobenen Hände des Publikums sehen, was darauf hindeutet, dass es sich um eine Art Präsentation oder ein Event handelt. Eine Person im Publikum hält etwas, das wie ein hellviolettes oder rosa Blatt Papier aussieht.
Die Gesamtszene deutet darauf hin, dass es sich wahrscheinlich um ein Tesla-Produktstart- oder Promotionsevent handelt, bei dem der Unternehmensleiter das Auto einer begeisterten Menge präsentiert.

Google Gemini Tools

Im Gemini Interface verfügbare Tools:

  • Google Search: Ich nutze Google Search um einige meiner Informationen zu erhalten. Allerdings haben Verlage die Möglichkeit, den Zugriff auf ihren spezifischen Inhalt oder Websites zu beschränken.
  • Google Flights: Ich kann Informationen von Google Flights abrufen.
  • Google Hotels: Ich kann Informationen von Google Hotels abrufen.
  • Google Maps: Ich kann Informationen von Google Maps abrufen.
  • YouTube: Ich kann Informationen von YouTube abrufen.
  • Gmail: Ich kann Gmail nutzen um E-Mails zu finden, eine oder mehrere E-Mails zusammenzufassen und Fragen zu Inhalten aus E-Mails zu beantworten. Ich kann meine Antwort in dein Gmail exportieren.
  • Docs: Ich kann durch deine Dokumente und PDFs in deinem Drive suchen. Ich kann eine oder mehrere deiner Dokumente und PDFs zusammenfassen und alle Fragen zu deren Inhalt beantworten.
  • Gemini Advanced: Dies ist eine aktualisierte Version des Tools, die eine Vielzahl gängiger Text-, Bild- und Tabellenkalkulationsdateiformate analysieren kann, einschließlich .doc, .docx, .pdf und .txt. Sie kann Datei-Uploads bis zu 1500 Seiten analysieren.

Claude Artifacts

Claudes einzigartige Fähigkeit, Artefakte zu erstellen. Es teilt sich den Bildschirm, links chattest du und rechts siehst du die Artefakte:

  • Lange Code-Schnipsel oder Skripte
  • Markdown-Dokumente
  • HTML-, JS- und CSS-Inhalte
  • SVG-Bilder
  • Mermaid-Diagramme
  • React-Komponenten

Claude Artifacts zum Generieren von Code und Dokumenten

Wissen und Updates

Es ist wichtig zu beachten, dass diese KI-Modelle "Knowledge Cutoffs" haben—Daten, über die sie hinaus keine Informationen über Weltereignisse haben. Überprüfe immer die neueste Dokumentation für die aktuellsten Informationen über ihre Fähigkeiten.


ModellKnowledge cutoff
Claude Sonnet 3.5April 2024
Google GeminiNovember 2023

Preisgestaltung

API

ModellInput tokensOutput tokensContext Caching
Claude 3.5 Sonnet$3$15$3.75 write, $0.3 write
Claude 3.5 Opus$15$75$18.75 write, $1.5 read
Claude 3.5 Haiku$0.25$1.25$0.3 write, $0.03 read
Gemini Flash <128k$0.075$0.30$0.01875
Gemini Flash >128k$0.150$0.60$0.0375
Gemini 1.5 Pro <128k$1.50$7.50$0.875
Gemini 1.5 Pro >128k$3.00$15.00$1.75

Die Einheit in der Preisgestaltung ist "MTok" und steht für 1 Million Token

Gemini Preis für lange Kontextfenster (>128k Token) ist doppelt so hoch wie der Basispreis.

Claude Modelle haben ein 200k Token Kontextfenster. 500k in Enterprise-Plänen. Max 8k Output Token. Gemini Modelle haben bis zu 1M Token Kontextfenster. Max 8k Output Token.

Webschnittstelle

ModellKostenlosEinzelnTeam
ClaudeMit Limits$20/Person/Monat$25/Person/Monat
GeminiGemini Flash$21.99/Person/Monat$20,$30/Person/Monat

Google Workspace: Gemini Business: $20

  • Gemini in Gmail, Docs, Drive, Slides, Sheets und Meet
  • Zugang zu Gemini mit Googles fähigsten KI-Modellen
  • 1 Jahr Vertrag

Gemini Workspace: Gemini Enterprise: $30

  • Erweiterte Meetings mit KI-Notizen und übersetzten Untertiteln in 65+ Sprachen
  • Automatisches Klassifizieren, Kennzeichnen und Schützen vertraulicher Dokumente mit KI
  • Vollzugang und Nutzung von Gemini
  • 1 Jahr Vertrag

Fazit

Die Wahl zwischen Gemini und Claude Modellen hängt von deinen spezifischen Anforderungen ab:

  • Gemini bietet eine Reihe von Optionen:
    • Ultra für komplexe Aufgaben und tiefes Verständnis
    • Pro für ausgewogene Leistung in Enterprise-Umgebungen
    • Nano für schnelle, alltägliche Interaktionen
  • Claude 3 Modelle bieten spezialisierte Fähigkeiten:
    • Opus für komplizierte Aufgaben und fortgeschrittenes Reasoning
    • Sonnet (3.5) für vielseitige allgemeine Anwendung
    • Haiku für schnelle, effiziente Antworten

Diese KI-Modelle formen unser Verständnis von Intelligenz neu und stellen traditionelle Vorstellungen menschlicher Kognition in Frage. Während sich die KI-Landschaft weiterentwickelt, präsentiert sie sowohl aufregende Chancen als auch komplexe Herausforderungen.

Um diese Technologien effektiv zu nutzen:

  • Bleibe über die neuesten Entwicklungen informiert
  • Bewerte kritisch die Stärken und Schwächen jedes Modells
  • Berücksichtige die breiteren Auswirkungen für deinen spezifischen Anwendungsfall

Denk daran, dass die KI-Branche dynamisch ist. Beziehe dich immer auf offizielle Dokumentation von Google und Anthropic für die aktuellsten Informationen über Gemini und Claude Modelle. Wenn du informiert und anpassungsfähig bleibst, kannst du diese transformative Technologielandschaft navigieren und ihr Potenzial verantwortungsvoll nutzen.