KI-Leistungskennzahlen: Sieben KPIs, die jede Marke verfolgen sollte
Warum KI eigene Kennzahlen braucht
Agentic Commerce ist ein neuer Kanal. Wenn ein Nutzer ChatGPT nach einer Produktempfehlung fragt oder Perplexity nach einem Dienstleistungsvergleich, gibt es keine “Seite eins”, auf der man ranken kann. Es gibt eine Zitation, eine Zusammenfassung oder gar nichts. Ihre Marke taucht entweder in der KI-generierten Antwort auf, oder sie existiert in diesem Gespräch nicht.
Dieser Kanal braucht seinen eigenen Leistungsbericht - genauso wie Sie Berichte für Paid, Organic, Social und E-Mail haben.
Bei WISLR haben wir viel Zeit in die Forschung und Entwicklung der Kennzahlen investiert, die für diesen neuen Kanal relevant sind. Die KPIs, die KI-gesteuerte Entdeckung erfassen, unterscheiden sich grundlegend von allem in Ihren bestehenden Dashboards. Sie messen, ob KI-Systeme auf Ihre Inhalte zugreifen können, ob sie diese zitieren und ob diese Sichtbarkeit in Umsatz konvertiert.
Die sieben nachfolgenden KPIs bilden unser Framework für den Aufbau eines KI-Kanalberichts - vom Moment, in dem ein Bot Ihre Website crawlt, bis zum Moment, in dem ein Kunde konvertiert. Dies ist der Bericht, den jede Marke neben ihren bestehenden Kanal-Leistungsberichten erstellen sollte.
Sieben zentrale Leistungskennzahlen
Diese sieben Kennzahlen bieten eine vollständige Funnel-Ansicht der KI-Leistung - von der Infrastruktur bis zum Umsatz. Schauen wir uns jede einzelne an.
1. KI-Bot-Crawl-Rate
Was sie misst: Den Prozentsatz Ihrer Seiten, die KI-Crawler (GPTBot, ClaudeBot, PerplexityBot usw.) erfolgreich zugreifen und für Trainingsdaten verarbeiten.
Dies ist die grundlegende Kennzahl. Wenn KI-Bots Ihre Inhalte nicht crawlen können, erscheinen Ihre Seiten nicht in den Trainingsdaten.
So verfolgen Sie sie:
- Überwachen Sie Serverprotokolle auf KI-spezifische User Agents (GPTBot, anthropic-ai, PerplexityBot, Bytespider)
- Vergleichen Sie die Gesamtzahl der crawlbaren Seiten mit den tatsächlich gecrawlten Seiten pro Bot
- Verfolgen Sie Crawl-Frequenz-Trends über die Zeit
Was gute Werte bedeuten: Hochwertige Seiten (Produktseiten, Pillar-Content, Kategorieseiten) sollten eine konsistente Crawl-Aktivität der wichtigsten KI-Bots aufweisen.
Häufige Probleme: Zu restriktive robots.txt-Regeln, JavaScript-gerenderte Inhalte, die für Bots unsichtbar sind, serverseitige Rendering-Fehler und langsame Seitenladezeiten, die dazu führen, dass Crawler Anfragen abbrechen.
2. KI-Abrufrate
Was sie misst: Wie oft Ihre Marke oder Ihre Inhalte in KI-generierten Antworten zitiert, referenziert oder angezeigt werden.
Crawling ist notwendig, aber nicht ausreichend. Die Abrufrate erfasst, ob KI-Systeme Ihre Inhalte tatsächlich in ihre Antworten einbeziehen. Dies ist das KI-Äquivalent zum “Impression Share” - wie sichtbar Sie sind, wenn relevante Anfragen gestellt werden.
So verfolgen Sie sie:
- Überwachen Sie Serverprotokolle auf KI-abrufspezifische User Agents, die andere Signaturen tragen als die Bots für Crawling und Training
- Unterscheiden Sie zwischen Crawl-Anfragen (Erfassung von Trainingsdaten) und Abruf-Anfragen (Echtzeit-Inhaltsabruf zur Antwortgenerierung)
- Verfolgen Sie die Abrufhäufigkeit und welche Seiten in Live-KI-Antworten einbezogen werden
Was gute Werte bedeuten: Gleichbleibende oder zunehmende Abruf-Anfragen aus Echtzeit-Nutzerkonversationen über die Zeit, was darauf hinweist, dass KI-Plattformen Ihre Inhalte aktiv abrufen, um Live-Anfragen zu beantworten.
Häufige Probleme: Dünner Content, der nicht genügend Signal für eine KI-Zitation liefert, fehlende strukturierte Daten, die eine genaue Zuordnung verhindern, und Wettbewerber-Inhalte, die besser für den KI-Konsum optimiert sind.
3. KI-Empfehlungsverkehr-Rate
Was sie misst: Das Volumen und den Prozentsatz der Website-Besucher, die von KI-Plattformen kommen.
Hier beginnt KI-Sichtbarkeit, sich in geschäftliche Auswirkungen zu übersetzen. Wenn KI-Systeme Ihre Inhalte mit einem Link zitieren, klicken Nutzer durch. Die separate Erfassung dieses Traffics vom organischen Suchverkehr gibt Ihnen ein klares Bild des direkten KI-Beitrags.
So verfolgen Sie sie:
- Analysieren Sie Serverprotokolle und HTTP-Referral-Header für Traffic von KI-Plattformen (chat.openai.com, perplexity.ai, gemini.google.com)
- Segmentieren Sie KI-Empfehlungsverkehr von organischem Such- und Direktverkehr anhand von Referrer-Daten
- Verfolgen Sie das KI-Empfehlungsvolumen als Prozentsatz des gesamten Website-Traffics über die Zeit
Was gute Werte bedeuten: Ein wachsender Anteil an Empfehlungsverkehr von KI-Plattformen, sichtbar in Ihren Serverprotokollen und Referral-Header-Daten.
Häufige Probleme: Zuordnungslücken, wenn KI-Plattformen keine Referrer-Daten weitergeben, und fehlklassifizierter Traffic, der in Ihren Protokollen in die Kategorien “Direkt” oder “Sonstige” eingeordnet wird.
4. KI-Konversionsrate
Was sie misst: Den Prozentsatz der KI-verwiesenen Besucher, die einen Kauf oder eine gewünschte Aktion abschließen.
Aktuelle Verhaltensanalyse-Tools haben blinde Flecken beim KI-verwiesenen Traffic. Sitzungen übertragen Referrer-Daten möglicherweise nicht konsistent, und traditionelle Attributionsmodelle wurden nicht für diesen Kanal entwickelt. Deshalb ist der beste Ort, diese Kennzahl zu entwickeln, Ihre Serverprotokolle als Frühindikator, um sie dann, wo möglich, mit Transaktionsdaten aus Ihrem Auftragsverwaltungssystem abzugleichen.
So verfolgen Sie sie:
- Verwenden Sie Serverprotokolldaten, um Sitzungen zu identifizieren, die von KI-Referral-Headern stammen
- Gleichen Sie KI-verwiesene Sitzungen mit Transaktionsdatensätzen in Ihrem Auftragssystem ab
- Vergleichen Sie Konversionsmuster von KI-verwiesenem Traffic mit anderen Kanälen anhand von Protokoll- und Auftragsdaten
Was gute Werte bedeuten: Eine wachsende Anzahl von Transaktionen, die in Ihren Protokollen auf KI-Empfehlungssitzungen zurückgeführt werden können, wobei Auftragsdaten abgeschlossene Käufe bestätigen.
Häufige Probleme: Unvollständige Referrer-Daten, die es schwierig machen, Sitzungen mit Konversionen zu verknüpfen, Lücken zwischen Protokolldaten und Auftragssystemdatensätzen sowie das Fehlen einer einheitlichen Sicht über Serverprotokolle und Transaktionssysteme hinweg.
5. KI-Warenkorb-zu-Kauf-Rate
Was sie misst: Die Checkout-Abschlussrate speziell für Besucher, die über eine KI-Empfehlung kamen.
Kein handelsübliches Analysetool segmentiert dies heute zuverlässig. Sie müssen Ihr eigenes Tracking aufbauen, indem Sie KI-Empfehlungsdaten aus Ihren Serverprotokollen mit Warenkorb- und Checkout-Ereignissen in Ihrem Auftragssystem verbinden. Das gibt Ihnen eine Genauigkeit und Sicherheit, die vorgefertigte Dashboards derzeit nicht bieten können.
So verfolgen Sie sie:
- Kennzeichnen Sie KI-verwiesene Sitzungen in Ihren Serverprotokollen anhand von Referral-Header-Daten
- Ordnen Sie diese Sitzungen Warenkorberstellungs- und Checkout-Abschlussereignissen in Ihrem Auftragssystem zu
- Berechnen Sie das Warenkorb-zu-Kauf-Verhältnis für KI-verwiesene Sitzungen im Vergleich zu anderen Traffic-Quellen
Was gute Werte bedeuten: KI-verwiesene Sitzungen schließen den Checkout mit Raten ab, die mit Ihren stärksten Kanälen vergleichbar sind, bestätigt durch Ihre eigene Pipeline von Protokoll- zu Auftragsdaten.
Häufige Probleme: Schwierigkeiten, die Sitzungskontinuität zwischen Protokolldaten und Auftragsdatensätzen aufrechtzuerhalten, Preis- oder Verfügbarkeitsdiskrepanzen zwischen dem, was die KI zitiert, und dem, was tatsächlich im Warenkorb liegt, sowie der manuelle Aufwand, der erforderlich ist, um dieses Tracking aufzubauen und zu pflegen, bevor die Anbieter-Tools aufholen.
6. Umsatz durch KI
Was sie misst: Den Gesamtumsatz, der KI-gesteuerter Entdeckung zugeordnet werden kann, einschließlich sowohl direkter (Last-Click) als auch unterstützter (Multi-Touch) Attribution.
Dies ist die Kennzahl für das Endergebnis. Sie beantwortet die Frage, die jede Führungskraft stellt: “Was ist KI-Sichtbarkeit für uns tatsächlich in Euro wert?”
So verfolgen Sie sie:
- Bauen Sie eine Pipeline auf, die Ihre Serverprotokolle (KI-Bot-Abrufaktivität und KI-Empfehlungssitzungen) mit Ihrem Auftragsverwaltungs- oder Transaktionssystem verbindet
- Ordnen Sie in Protokollen identifizierte KI-verwiesene Sitzungen abgeschlossenen Käufen und deren Geldwerten in Ihren Auftragsdaten zu
- Segmentieren Sie den Umsatz nach KI-Quelle, wo möglich (verschiedene KI-Plattformen hinterlassen unterschiedliche Empfehlungssignaturen)
Was gute Werte bedeuten: Eine wachsende, überprüfbare Umsatzzahl, die direkt mit KI-verwiesenen Sitzungen verknüpft ist und mit Ihrem Auftragssystem abgeglichen wird, damit die Daten einer Prüfung standhalten. Der Umsatz pro KI-verwiesenem Besuch sollte wettbewerbsfähig mit anderen Kanälen sein.
Häufige Probleme: Die Infrastruktur, um Protokolldaten mit Transaktionsdatensätzen zu verbinden, existiert nicht von der Stange - Sie müssen sie aufbauen. Die Sitzungsübergabe zwischen Protokollidentifikation und Auftragsabschluss kann verlustbehaftet sein, und es gibt noch kein branchenweites Standard-Tooling. Dies ist eine Kennzahl, die Sie im Laufe der Zeit verfeinern werden, während Ihr Tracking reift.
7. Gesamtanzahl der Produkte mit multimodalem Content
Was sie misst: Den Prozentsatz Ihres Produktkatalogs, der über umfassenden multimodalen Content verfügt - Video, Bilder und Textbeschreibungen - optimiert für den KI-Konsum.
Diese Kennzahl geht über die technische Grundlage hinaus. KI-Plattformen bevorzugen zunehmend inhaltsreiche Produktseiten bei Empfehlungen, aber der Weg dorthin erfordert eine enge Abstimmung zwischen Ihrem Technikteam und Ihrem Content-Team. Produkte mit nur grundlegenden Textbeschreibungen verlieren gegen Wettbewerber, die in Videodemonstrationen, mehrere Bildperspektiven, Vergleichstabellen und strukturierte Spezifikationen investieren. Dies ist genauso eine Content-Strategie-Initiative wie eine technische - Ihre Content-Teams müssen Teil der Planung, Produktion und Priorisierung sein.
So verfolgen Sie sie:
- Überprüfen Sie Ihren Produktkatalog auf inhaltliche Vollständigkeit über alle Inhaltstypen hinweg: geschriebene Beschreibungen, Produktbilder, Videos und strukturierte Spezifikationen
- Erstellen Sie gemeinsam mit Ihrem Content-Team ein Bewertungsmodell, das die multimodale Bereitschaft jedes Produkts bewertet - dies gibt technischen und inhaltlichen Stakeholdern eine gemeinsame Sprache für die Priorisierung
- Verfolgen Sie den Abdeckungsprozentsatz über die Zeit und verknüpfen Sie Verbesserungsmeilensteine mit Content-Produktionskalendern
Was gute Werte bedeuten: Prioritäts-SKUs (Bestseller, höchste Marge) haben zuerst vollständigen multimodalen Content, mit einer Roadmap zur Erweiterung der Abdeckung über den aktiven Katalog. Content- und Technikteams sind sich einig, was “vollständig” für jeden Produkttyp bedeutet.
Häufige Probleme: Massenproduktimporte mit minimalen Beschreibungen, die nie angereichert werden, Content-Teams, die nicht in KI-Sichtbarkeitsziele eingebunden sind, kein gemeinsamer Workflow zwischen technischen Teams und Content-Produktion, fehlende Alt-Texte bei Produktbildern und keine Videoinhalte für Produkte, die von einer Demonstration profitieren.
Aufbau Ihres KI-Messframeworks
Diese sieben Kennzahlen sind nicht dazu gedacht, isoliert verfolgt zu werden. Sie bilden einen Trichter:
- Infrastruktur (Bot-Crawl-Rate) - Kann die KI auf Ihre Inhalte zugreifen?
- Sichtbarkeit (Abrufrate) - Zitiert die KI Ihre Inhalte?
- Traffic (Empfehlungsverkehr-Rate) - Klicken Nutzer von der KI durch?
- Aktion (Konversionsrate + Warenkorb-zu-Kauf-Rate) - Konvertieren Besucher?
- Umsatz (Umsatz durch KI) - Was ist die monetäre Auswirkung?
- Bereitschaft (Multimodaler Content) - Sind Sie auf das vorbereitet, was als Nächstes kommt?
Wenn Ihre Bot-Crawl-Rate niedrig ist, hilft die Optimierung der Konversionsrate nicht. Wenn Ihre Abrufrate stark ist, aber der Empfehlungsverkehr schwach, liegt das Problem wahrscheinlich darin, wie KI-Plattformen auf Sie zurückverlinken. Der Trichter zeigt Ihnen, worauf Sie sich konzentrieren sollten.
Beginnen Sie mit dem, was Sie heute messen können
Sie brauchen kein perfektes Attributionssystem, um zu beginnen. Starten Sie mit der Serverprotokollanalyse für Bot-Crawl-Raten und der Empfehlungsquellen-Segmentierung in Ihren bestehenden Analysetools. Allein diese beiden Kennzahlen verraten Ihnen, ob KI-Plattformen auf Ihre Inhalte zugreifen und Ihnen Traffic senden.
Wenn Ihre Messung reifer wird, fügen Sie Abrufrate-Monitoring, Konversionssegmentierung und Umsatzzuordnung hinzu. Die Marken, die jetzt mit der Messung beginnen, werden Monate an Basisdaten haben, wenn ihre Wettbewerber noch herausfinden, wo sie anfangen sollen.
Diese Kennzahlen sind schwer allein zu erfassen
Die Realität ist, dass die meisten dieser KPIs noch keine fertigen Tools haben. Den Aufbau der Protokoll-Pipelines, die Verbindung mit Auftragsdaten und die Pflege des Trackings erfordert echten Entwicklungsaufwand - und den meisten Marken fehlt die interne Kapazität, um dies von Grund auf aufzubauen.
Das WISLR-Team hat Systeme entwickelt, um diese Kennzahlen für Marken online zu bringen, damit Sie nicht bei Null anfangen müssen. Wenn Sie Hilfe bei der Implementierung dieses Messframeworks benötigen, besprechen wir gerne, was für Ihr Setup möglich ist.
Möchten Sie wissen, ob KI-Bots Ihre Website tatsächlich crawlen können? Unser AEO-Bereitschaftsleitfaden prüft Ihre technische Infrastruktur - JavaScript-Rendering, Schema-Markup, Ghost Pages und mehr - damit Sie das Fundament reparieren können, bevor Sie den Trichter optimieren.
Häufig gestellte Fragen
Welche Kennzahlen werden von Standard-Analysetools für KI-gesteuerten Traffic nicht erfasst?
Standard-Analysetools wie Google Analytics segmentieren KI-verwiesenen Traffic nicht zuverlässig von organischen oder direkten Besuchen. Konkret fehlen ihnen die KI-Bot-Crawl-Rate (die eine Serverprotokollanalyse für User Agents wie GPTBot, ClaudeBot und PerplexityBot erfordert), die KI-Abrufrate (die andere User-Agent-Signaturen verwendet als Trainings-Crawler) und KI-spezifische Konversions- und Warenkorb-zu-Kauf-Raten (die eine Verknüpfung von Serverprotokoll-Referral-Daten mit Auftragsverwaltungssystem-Datensätzen erfordern). Diese sieben KPIs - Bot-Crawl-Rate, Abrufrate, Referral-Traffic-Rate, Konversionsrate, Warenkorb-zu-Kauf-Rate, Umsatz durch KI und multimodale Content-Abdeckung - müssen aus Serverprotokollen und Transaktionsdaten aufgebaut werden, nicht aus vorgefertigten Dashboards.
Wie unterscheidet sich die KI-Abrufrate von der KI-Bot-Crawl-Rate?
Die KI-Bot-Crawl-Rate misst, wie viele Ihrer Seiten KI-Crawler erfolgreich für Trainingsdaten zugreifen. Dies ist die grundlegende Kennzahl dafür, ob Ihre Inhalte in das Wissen eines LLM eingehen. Die KI-Abrufrate misst, wie oft KI-Systeme Ihre Inhalte in Echtzeit abrufen, um Antworten während aktiver Nutzerkonversationen zu generieren. Beide verwenden unterschiedliche User-Agent-Signaturen in den Serverprotokollen: Crawl-Anfragen sammeln Trainingsdaten, während Abruf-Anfragen Inhalte in aktive Antworten einbinden. Eine hohe Crawl-Rate bei niedriger Abrufrate bedeutet, dass Ihre Inhalte zwar in den Trainingsdaten sind, aber nicht zitiert werden, wenn Nutzer relevante Fragen stellen.
Wie verfolgt man Umsatz aus KI-Referral-Traffic, wenn es kein fertiges Tool dafür gibt?
Sie bauen eine individuelle Pipeline auf, die drei Datenquellen verbindet: Serverprotokolle (zur Identifizierung KI-verwiesener Sitzungen über HTTP-Referral-Header von Plattformen wie chat.openai.com, perplexity.ai und gemini.google.com), Ihr Auftragsverwaltungssystem (um diese Sitzungen mit abgeschlossenen Käufen und Geldwerten abzugleichen) und Referral-Signatur-Segmentierung (zur Zuordnung des Umsatzes zu bestimmten KI-Plattformen). Diese Pipeline ersetzt die Attributionsrolle, die Tools wie Google Analytics für bezahlte und organische Kanäle spielen. Die Infrastruktur existiert nicht von der Stange. Es erfordert Entwicklungsarbeit, um Protokolldaten mit Transaktionsdatensätzen zu verbinden und die Sitzungskontinuität bis zum Checkout aufrechtzuerhalten.
In welcher Reihenfolge sollte ein KI-Kanal-Leistungsbericht aufgebaut werden?
Die sieben KPIs bilden einen Trichter, der in dieser Reihenfolge gemessen werden sollte: Infrastruktur (KI-Bot-Crawl-Rate), Sichtbarkeit (KI-Abrufrate), Traffic (KI-Referral-Traffic-Rate), Aktion (KI-Konversionsrate und Warenkorb-zu-Kauf-Rate), Umsatz (Umsatz durch KI) und Bereitschaft (multimodale Content-Abdeckung). Diese Reihenfolge ist wichtig, weil Probleme am oberen Ende des Trichters die nachgelagerten Kennzahlen irrelevant machen. Wenn Ihre Bot-Crawl-Rate niedrig ist, hilft die Optimierung der Konversionsrate nicht. Beginnen Sie mit der Serverprotokollanalyse für Bot-Crawl-Raten und der Referral-Quellen-Segmentierung, und ergänzen Sie dann nach und nach Abrufrate-Monitoring, Konversionssegmentierung und Umsatzzuordnung, während Ihre Messung reift.
Was unterscheidet KI-Referral-Traffic von organischem Suchverkehr in Serverprotokollen?
KI-Referral-Traffic stammt von bestimmten Plattform-Domains wie chat.openai.com, perplexity.ai und gemini.google.com und wird durch HTTP-Referral-Header in Ihren Serverprotokollen identifiziert - nicht durch traditionelle Suchmaschinen-Referral-Muster. Anders als organischer Suchverkehr wird KI-Referral-Traffic in Standard-Analysetools oft als “Direkt” oder “Sonstige” fehlkategorisiert, weil KI-Plattformen nicht immer konsistent Referrer-Daten übergeben. Der einzige zuverlässige Weg, KI-Referral-Traffic zu segmentieren, ist die Serverprotokollanalyse der Referral-Header, weshalb diese Kennzahl allein mit Verhaltensanalyse-Tools nicht genau gemessen werden kann.
Warum ist die multimodale Content-Abdeckung für die KI-Sichtbarkeit wichtig?
KI-Plattformen bevorzugen bei der Generierung von Empfehlungen zunehmend inhaltsreiche Produktseiten. Produkte mit nur einfachen Textbeschreibungen verlieren gegenüber Wettbewerbern, die Videodemonstrationen, mehrere Bildperspektiven, Vergleichstabellen und strukturierte Spezifikationen bieten. Die multimodale Content-Abdeckung misst den Prozentsatz Ihres Produktkatalogs, der über umfassendes Video-, Bild- und Text-Content verfügt, das für den KI-Konsum optimiert ist. Dies ist sowohl eine technische als auch eine Content-Strategie-Kennzahl. Sie erfordert die Abstimmung zwischen technischen Teams (für strukturierte Daten und Rendering) und Content-Teams (für Produktion und Priorisierung), wobei zuerst die meistverkauften und margenträchtigsten SKUs priorisiert werden sollten.