Artisan + SaaStr: KI-SDRs, die tatsächlich funktionieren - Echte Daten von 21.000 Nachrichten
Perspektive
Diese Session ist eine Meisterklasse in KI-Produkt-Ehrlichkeit. Jason Lemkin (SaaStr-Gründer) und Jasper (Artisan CEO) teilen echte Daten aus SaaStrs eigenem Einsatz von Artisans KI-SDR, “Ava.” Die Schlüsseloffenbarung: diese Produkte funktionierten bis Q2 2024 nicht.
Lemkin setzt den Kontext deutlich: “Wenn Sie skeptisch hereinkamen, fair genug, denn diese Produkte waren schlecht bis Q2 dieses Jahres.” Er zitiert Gamma (gegründet 2020, funktionierte nicht bis Q2 2024), Replit (10 Jahre alt, nicht gut bis Februar 2024), und Lovable. Der Wendepunkt war der “Claude 4 Moment” - als Halluzinationen verschwanden und LLMs zuverlässig genug für den Produktiveinsatz wurden.
Die Daten sind erfrischend spezifisch: 21.000 Nachrichten über ~5 Monate gesendet, 7,5% Gesamtrücklaufquote, 4,5% positive Rücklaufquote. Die Rücklaufquote verbesserte sich tatsächlich im Laufe der Zeit (von 3,7% auf 4,5%) durch autonomes multivariates Testing. Sie testen 10+ Varianten von Schmerzpunkten, Lösungen, CTAs und Beweisstücken gleichzeitig - etwas, das Menschen einfach nicht im Maßstab tun können.
Praktische Einblicke gibt es reichlich: Warmes Outbound performt 2-3x besser als kaltes. LinkedIn funktionierte “zu gut” - sie haben es ausgeschaltet, weil Gründer zu viele Verbindungsanfragen bekamen. Zwei kleingeschriebene Wörter in Betreffzeilen übertreffen alles andere. Sonntagnachmittag ist die beste Zeit, um Gründer anzuschreiben (sie holen auf ohne Meetings).
Die ehrliche Diskussion über Buyer Personas ist wertvoll: Early-Stage-Unternehmen haben Gründer oder Sales Heads, die es besitzen; Enterprise hat RevOps/Sales Ops, die orchestrieren. Ein Fintech-Kunde führt KI-Emails im Namen von Tausenden von AEs - Sales Ops verwaltet es, AEs bekommen nur Leads geliefert.
Wichtige Erkenntnisse
- KI-SDR-Produkte erreichten einen Wendepunkt in Q2 2024 - davor “waren sie schlecht” aufgrund von Halluzinationen und Unzuverlässigkeit
- Warmes Outbound (bestehende Kontakte) performt 2-3x besser als reines Kalt; die meisten Unternehmen haben “Hunderttausende” ungepflegter CRM-Kontakte
- Multivariates Testing im Maßstab (10+ Varianten über 4 Variablen) schafft kontinuierliche Verbesserung, die Menschen nicht matchen können
- Zwei-Wochen-Domain-Warmup ist essentiell - sekundäre Domains aufsetzen, max 20 Emails/Tag pro Adresse, 2 Adressen pro Domain