Hier ist ein ehrliches Problem mit den meisten Anleitungen zur KI-Sichtbarkeit: Sie zeigen dir wie du einmalig prüfst ob du vorkommst. Aber sie erklären nicht wie du Fortschritt misst, Trends erkennst, oder nachweist dass deine Maßnahmen wirken.
Das ist der Unterschied zwischen einem Schnelltest und einer Messmethodik. Dieser Artikel baut die Methodik.
Das Wichtigste zuerst: KI-Sichtbarkeit zu messen ist genuiner anders als klassische SEO-Messung. Es gibt keine Klickrate, keine Impressionszahl, kein Google Search Console für KI-Antworten. Was es gibt: eine wachsende Menge an Frameworks, Metriken und Tools – einige davon für KMU erschwinglich und praktisch, andere für Enterprise-Budgets gebaut. Ich zeige dir das komplette Bild.
Diese Zahl ist der Ausgangspunkt für alles was folgt. KI-Sichtbarkeit ist keine stabile Metrik wie ein Google-Ranking das sich einmal pro Tag aktualisiert. Sie ist volatil, kontextabhängig und plattformspezifisch. Das bedeutet nicht dass sie unmessbar ist – es bedeutet dass du sie anders messen musst.
Warum klassische SEO-Metriken für KI-Sichtbarkeit nicht reichen
Viele Unternehmen versuchen ihre KI-Sichtbarkeit über bestehende SEO-Dashboards zu verstehen. Das führt zu falschen Schlussfolgerungen.
Das Problem: Dein Sichtbarkeitsindex bei Sistrix, XOVI oder Semrush misst wie gut du in klassischen Suchmaschinen-Ergebnislisten rankst. Er sagt nichts darüber ob ChatGPT dich in einer Antwort erwähnt wenn jemand nach einem Anbieter in deiner Branche fragt.
Die Grundverschiebung: Klassische SEO misst Klicks und Rankings. KI-Sichtbarkeit misst Erwähnungen und Zitierungen. Ein Unternehmen kann unsichtbar bei Google sein und trotzdem in jeder zweiten ChatGPT-Antwort zu seiner Branche erscheinen – und umgekehrt. Beide Metriken sind wichtig, aber sie messen verschiedene Realitäten.
Konkrete Zahlen die den Unterschied illustrieren: Eine Seer Interactive Studie hat gezeigt dass bei Suchanfragen mit Google AI Overviews die organische CTR um 61 Prozent sinkt – von 1,76 auf 0,61 Prozent. Gleichzeitig erhalten Marken die in AI Overviews zitiert werden 35 Prozent mehr organische Klicks als solche ohne Nennung. Die Messung hat sich aufgespalten: Traffic-Metriken werden weniger aussagekräftig, Zitations-Metriken werden wichtiger.
Das KI-Sichtbarkeits-KPI-Framework – vier Ebenen
Ein vollständiges Messsystem für KI-Sichtbarkeit besteht aus vier aufeinander aufbauenden Ebenen. Jede Ebene beantwortet eine andere Frage.
Ebene 1: Präsenz – „Bin ich überhaupt im Spiel?“
Die Grundfrage. Bevor alle anderen Metriken Sinn ergeben, musst du wissen ob du grundsätzlich in KI-Antworten erscheinst.
KPI: Visibility Percentage
Visibility Percentage = (Anzahl Prompts mit Nennung ÷ Gesamtzahl Prompts) × 100
Beispiel: Du testest 20 Prompts in ChatGPT. In 5 davon erscheinst du. Deine Visibility Percentage bei ChatGPT ist 25 Prozent.
Realistische Benchmarks aus der Praxis:
| Ausgangslage | Typische Visibility Percentage |
|---|---|
| Erstes Measurement, keine GEO-Maßnahmen | 0–5% |
| Nach 3 Monaten aktiver GEO-Arbeit | 5–15% |
| Nach 6 Monaten, wettbewerbsarmer Markt | 20–40% |
| Nach 6 Monaten, starker Wettbewerb | 10–20% |
| Etabliertes lokales Unternehmen mit starker Präsenz | 30–60% |
Wichtig: Diese Benchmarks variieren erheblich nach Branche, Stadt und Wettbewerbsintensität. Ein Elektriker in einer Kleinstadt kann 60 Prozent erreichen. Ein Steuerberater in Frankfurt konkurriert gegen deutlich mehr gut aufgestellte Wettbewerber.
Ebene 2: Wettbewerb – „Wie stehe ich im Vergleich?“
Absolute Sichtbarkeit sagt wenig ohne Kontext. Wenn du in 20 Prozent der Prompts vorkommst und dein stärkster Wettbewerber in 60 Prozent – ist 20 Prozent schwach. Wenn du der Einzige in deiner Branche bist der vorkommt – ist 20 Prozent stark.
KPI: Share of Voice (SoV)
Share of Voice = (Eigene Nennungen ÷ Gesamte Nennungen aller Marken im Set) × 100
Beispiel: In 20 Prompts wird dein Unternehmen 8-mal genannt. Wettbewerber A wird 12-mal genannt, Wettbewerber B 5-mal. Gesamtnennungen: 25. Dein Share of Voice: 8 ÷ 25 × 100 = 32 Prozent.
Der Share of Voice ist die strategisch wichtigste Metrik weil er zeigt ob du die KI-Sichtbarkeit in deinem Markt dominierst oder verlierst – unabhängig von absoluten Zahlen.
Ebene 3: Qualität – „Wie werde ich dargestellt?“
Vorkommen ist nicht genug. Wichtig ist wie du vorkommst.
KPI 1: Citation Rate – in wie vielen Antworten wirst du als klickbare Quelle zitiert (mit Link), nicht nur erwähnt?
KPI 2: Position in der Antwort – bist du die erste Empfehlung, die zweite, oder irgendwo weiter hinten? Die erste Nennung in einer KI-Antwort erzeugt die höchste Aufmerksamkeit – ähnlich wie Position 1 bei Google.
KPI 3: Sentiment Score – wirst du positiv empfohlen, neutral erwähnt oder kritisch eingeordnet? Das lässt sich manuell mit einer einfachen +/0/– Notation dokumentieren.
KPI 4: Korrektheit – sind Adresse, Öffnungszeiten, Leistungen und andere Fakten die ChatGPT nennt aktuell und korrekt?
Ebene 4: Business-Impact – „Was bringt das wirklich?“
Die vierte Ebene verbindet KI-Sichtbarkeit mit dem was zählt: echte Besucher, echte Anfragen, echte Umsätze.
KPI: AI-Referral-Traffic – wie viele Besucher kommen tatsächlich von KI-Plattformen auf deine Website? Das ist heute schon in Google Analytics 4 messbar – und der Wert wächst monatlich.
KI-Traffic konvertiert dabei deutlich besser als klassischer organischer Traffic: Studien zeigen eine 4,4-fach höhere Conversion Rate im Vergleich zu Standard-SEO-Traffic. Wer KI-Traffic bekommt, bekommt kaufbereite Besucher.
Deine aktuelle Baseline in 60 Sekunden
Bevor du ein Messsystem aufbaust brauchst du eine Ausgangsmessung. Der kostenlose KI-Check auf ki-sichtbarkeit.net liefert dir sofort deinen aktuellen Sichtbarkeits-Status – als Startpunkt für alle weiteren Messungen.
Kostenlose Baseline-Messung →Der manuelle Messrahmen für KMU – ohne Tool, ohne Budget
Für die meisten lokalen Unternehmen in Deutschland ist ein monatlicher manueller Messrahmen die pragmatischste Lösung. Er kostet keine Tool-Gebühren, liefert echte Trend-Daten, und ist in 60 bis 90 Minuten monatlich durchführbar.
Schritt 1: Dein Prompt-Set definieren (einmalig, 20 Minuten)
Definiere 10 bis 15 Test-Prompts die du jeden Monat wiederholst. Das sind keine Keywords – das sind echte Kundenfragen. Strukturiere sie in drei Kategorien:
Kategorie A: Allgemeine Branchenanfragen (5 Prompts)
Diese Prompts nennen deinen Namen nicht. Sie zeigen ob du als generelle Empfehlung erscheinst.
- „Welche/n [Branche] in [Stadt] würdest du empfehlen?“
- „Gute [Branche] in [Stadt] – wen kennst du?“
- „[Branche] in [Stadt] mit guten Bewertungen“
Kategorie B: Leistungs-spezifische Anfragen (5 Prompts)
Diese Prompts fragen nach deinen wichtigsten Spezialisierungen.
- „Wer macht [deine Hauptleistung] in [Stadt] gut?“
- „[spezifische Leistung] [Stadt] Empfehlung“
- „Welche Firma macht [Leistung] in [Region] und hat Erfahrung mit [Spezialisierung]?“
Kategorie C: Entity-Prompts (3–5 Prompts)
Diese Prompts fragen direkt nach deinem Unternehmen und testen Korrektheit.
- „Was weißt du über [dein Unternehmensname]?“
- „Öffnungszeiten von [dein Unternehmensname] in [Stadt]“
- „Welche Leistungen bietet [dein Unternehmensname] an?“
Schritt 2: Deine Mess-Tabelle einrichten (einmalig, 10 Minuten)
Eine einfache Tabelle – Excel, Google Sheets, oder Papier – mit diesen Spalten:
| Datum | Prompt | ChatGPT | Gemini | Perplexity | Top-Wettbewerber | Notiz |
|---|---|---|---|---|---|---|
| 01.04.26 | „Elektriker Dresden“ | ❌ | ✅ Pos.2 | ⚠️ falsche Adresse | Müller Elektro | Adresse aktualisieren |
| 01.04.26 | „Badezimmer Elektriker Dresden“ | ✅ Pos.1 | ✅ Pos.1 | ✅ Pos.2 | Schmidt GmbH | Stark bei Spezialanfrage |
Legende: ✅ = genannt (mit Position wenn erkennbar), ❌ = nicht genannt, ⚠️ = genannt aber fehlerhaft
Schritt 3: Monatliche Messung (laufend, 60–90 Minuten)
Am gleichen Tag jeden Monat – zum Beispiel immer am ersten Montag – führst du alle Prompts durch alle drei KI-Systeme und dokumentierst die Ergebnisse. Starte immer in einem neuen Browser-Tab ohne angemeldeten Account für neutralere Ergebnisse.
Berechne dann für jeden Monat deine Visibility Percentage pro Plattform:
April: ChatGPT: 4/15 = 27% | Gemini: 9/15 = 60% | Perplexity: 6/15 = 40%
März: ChatGPT: 2/15 = 13% | Gemini: 7/15 = 47% | Perplexity: 4/15 = 27%
Trend: +14% bei ChatGPT, +13% bei Gemini, +13% bei Perplexity ✅
Diese Trendansicht ist das Herzstück des manuellen Messrahmens. Einzelmessungen sagen wenig – der Trend über 3 bis 6 Monate zeigt ob deine Maßnahmen wirken.
Schritt 4: Wettbewerbs-Benchmark ergänzen (quartalsweise, 30 Minuten)
Einmal pro Quartal führst du für deine 2 bis 3 stärksten Wettbewerber denselben Prompt-Test durch und berechnest deren Visibility Percentage. Das gibt dir ein Bild deines relativen Share of Voice und zeigt ob du aufholst oder zurückfällst.
KI-Traffic in Google Analytics 4 messen
Neben dem Prompt-basierten Sichtbarkeits-Tracking gibt es noch eine zweite Messdimension die viele vergessen: Den tatsächlichen Traffic der von KI-Plattformen auf deine Website kommt.
Das ist in GA4 bereits heute messbar – und es lohnt sich das einzurichten weil dieser Traffic-Anteil monatlich wächst.
Die KI-Traffic-Quellen in GA4
In GA4 unter Berichte → Akquisition → Traffic-Akquisition siehst du alle Referral-Quellen. Suche nach diesen KI-spezifischen Domains:
| KI-Plattform | GA4-Referral-Domain |
|---|---|
| ChatGPT | chat.openai.com |
| Perplexity | perplexity.ai |
| Google Gemini | gemini.google.com |
| Google AI Overviews | google.com (als organisch markiert – schwerer zu isolieren) |
| Microsoft Copilot | bing.com / copilot.microsoft.com |
| Claude (Anthropic) | claude.ai |
Ein benutzerdefiniertes KI-Traffic-Segment anlegen
Für regelmäßiges Tracking empfiehlt sich ein benutzerdefiniertes Segment in GA4 das alle KI-Quellen zusammenfasst:
Segment erstellen
In GA4: Berichte → Bibliothek → Segmente → Neues Segment erstellen → Sitzungsbasiert → Filter: „Sitzungsquelle enthält“ → Werte: chat.openai.com ODER perplexity.ai ODER gemini.google.com ODER claude.ai ODER copilot.microsoft.com → Segment speichern als „KI-Plattformen gesamt“.
Was du messen solltest
Vergleiche dieses Segment mit deinem organischen SEO-Traffic auf vier KPIs: Sitzungsdauer (KI-Traffic verbringt typischerweise länger auf der Seite – er kommt vorinformiert), Absprungrate (sollte niedriger sein), Conversion Rate (sollte deutlich höher sein – Ziel: 4,4× besser als organisch), und Seitenaufrufe pro Sitzung. Diese Vergleiche helfen dir den wirtschaftlichen Wert deiner KI-Sichtbarkeit zu quantifizieren.
Monatliches Reporting einrichten
Erstelle in GA4 einen benutzerdefinierten Report (unter Erkunden → Freies Format) der dieses Segment monatlich auswertet. Dokumentiere: Gesamte KI-Sitzungen, Anteil am Gesamttraffic, Top-Landingpages von KI-Traffic, und die Conversion Rate im Vergleich zu organischem Traffic. Dieser Report wird mit der Zeit eines der wertvollsten Dokumente in deinem Marketing-Reporting.
Das vollständige KPI-Dashboard – auf einen Blick
Hier ist die Zusammenfassung aller KPIs in einem einzigen Überblick – mit Messfrequenz und Messaufwand:
| KPI | Was er misst | Frequenz | Methode | Aufwand |
|---|---|---|---|---|
| Visibility Percentage | % der Prompts in denen du erscheinst | Monatlich | Manueller Prompt-Test | 60 Min./Monat |
| Share of Voice | Dein Anteil aller Markennennungen im Markt | Quartalsweise | Wettbewerbs-Prompt-Test | 30 Min./Quartal |
| Sentiment Score | Positive / neutrale / negative Darstellung | Monatlich | Manuelles Notieren beim Prompt-Test | +10 Min./Monat |
| Korrektheit | Stimmen Adresse, Öffnungszeiten, Leistungen? | Monatlich | Entity-Prompts im Test-Set | Inklusive oben |
| AI-Referral-Traffic | Besucher von KI-Plattformen | Monatlich | GA4-Segment | 5 Min./Monat |
| AI-Traffic Conversion Rate | Qualität des KI-Traffics vs. organisch | Monatlich | GA4-Segmentvergleich | 5 Min./Monat |
Gesamtaufwand für das vollständige manuelle System: ca. 80 Minuten pro Monat plus 30 Minuten pro Quartal. Das ist realistisch für ein KMU das KI-Sichtbarkeit ernsthaft verfolgen will ohne ein teures Tool zu kaufen.
Wann lohnt sich ein professionelles Tool?
Das manuelle System hat klare Grenzen: Es ist zeitaufwändig bei mehr als 3 Wettbewerbern, liefert keine automatischen Alerts bei Sichtbarkeitsänderungen, und kann nicht über 15 bis 20 Prompts skalieren ohne unverhältnismäßig viel Zeit zu kosten.
Ab wann ein professionelles Tool sinnvoll ist:
- Du willst mehr als 20 Prompts monatlich tracken
- Du willst automatische Alerts wenn sich deine Sichtbarkeit verändert
- Du bietest GEO-Services für Kunden an und brauchst strukturiertes Reporting
- Du willst KI-Sichtbarkeit über mehr als 3 Wettbewerber vergleichen
- KI-Traffic macht bereits mehr als 5 Prozent deines Gesamttraffics aus
Die relevantesten Tools für den DACH-Markt und ihre Einordnung haben wir im vollständigen KI-Sichtbarkeits-Check-Artikel detailliert beschrieben. Kurz zusammengefasst: Rankscale ab ~20 USD/Monat für granulare Konfiguration, Otterly ab ~29 USD/Monat für einfaches Monitoring, Peec AI ab ~89 EUR/Monat für Agentur-Reporting.
Die wichtigste Erkenntnis: Trend schlägt Snapshot
Zum Abschluss der wichtigste Grundsatz für jede KI-Sichtbarkeits-Messung:
Weil KI-Antworten so volatil sind – weniger als 1 Prozent Übereinstimmung bei identischen Prompts laut SparkToro – ist eine einzelne Messung wenig aussagekräftig. Was zählt ist der Trend über mehrere Messungen.
Das bedeutet: Fang heute an zu messen – auch wenn der erste Wert niedrig ist. Definiere dein Prompt-Set. Dokumentiere. Wiederhole monatlich. Nach drei Monaten siehst du ob sich etwas verändert. Nach sechs Monaten hast du echte Trend-Daten die zeigen ob deine Maßnahmen wirken.
Der Einstieg ist kostenlos: Der KI-Sichtbarkeits-Check von WinLocal gibt dir in 60 Sekunden deine Ausgangsmessung – deine Baseline. Von dort aus baust du den monatlichen Messrhythmus.
Starte mit deiner Baseline-Messung
Der kostenlose KI-Check auf ki-sichtbarkeit.net liefert deinen aktuellen Sichtbarkeits-Status bei ChatGPT, Gemini und Perplexity – als Ausgangspunkt für dein monatliches Tracking.
Kostenlose Baseline-Messung → Mehr zum KI Booster →Häufige Fragen: KI-Sichtbarkeit messen
Was ist die Visibility Percentage und wie berechne ich sie?
Die Visibility Percentage ist die wichtigste KPI für KI-Sichtbarkeit. Formel: Anzahl der Prompts in denen deine Marke auftaucht ÷ Gesamtzahl der ausgeführten Prompts × 100. Beispiel: Du testest 20 Prompts, in 4 davon erscheinst du – deine Visibility Percentage ist 20%. Realistische Benchmarks: 0–5% beim Start, 15–30% nach 6 Monaten GEO-Arbeit je nach Branche und Wettbewerbsintensität.
Welche KPIs gibt es für KI-Sichtbarkeit?
Die fünf wichtigsten KPIs: Visibility Percentage (in wie vielen Prozent der Prompts erscheinst du?), Share of Voice (wie oft wirst du im Vergleich zu Wettbewerbern genannt?), Citation Rate (in wie vielen Antworten wirst du als klickbare Quelle zitiert?), Sentiment Score (wirst du positiv empfohlen, neutral erwähnt oder kritisch eingeordnet?), und AI-Referral-Traffic (wie viele Besucher kommen tatsächlich von KI-Plattformen auf deine Website?).
Wie messe ich KI-Sichtbarkeit ohne teures Tool?
Mit einem manuellen Messrahmen: Definiere 10 bis 15 branchenspezifische Prompts, teste sie monatlich in ChatGPT, Gemini und Perplexity, und dokumentiere ob du erscheinst, an welcher Position, und welche Wettbewerber auftauchen. Berechne deine Visibility Percentage pro Plattform. Das kostet 60 bis 90 Minuten monatlich und liefert echte Trend-Daten ohne Tool-Kosten.
Wie tracke ich KI-Traffic in Google Analytics?
In GA4 unter Akquisition → Traffic-Quellen findest du KI-Referral-Traffic von chat.openai.com, perplexity.ai, gemini.google.com und anderen KI-Plattformen. Erstelle ein benutzerdefiniertes Segment das diese Quellen zusammenfasst und vergleiche Conversion Rate, Sitzungsdauer und Absprungrate mit deinem organischen SEO-Traffic. KI-Traffic konvertiert typischerweise 4,4× besser.
Warum variieren KI-Sichtbarkeits-Messungen so stark?
KI-Antworten sind hochgradig inkonsistent. Laut einer SparkToro-Studie von Rand Fishkin liefern ChatGPT und Google AI bei identischen Prompts in weniger als 1 von 100 Fällen dieselbe Markenliste. Das bedeutet: Einzelne Messungen sind wenig aussagekräftig. Was zählt sind Trends über mehrere Messungen und mehrere Monate. Deshalb ist ein Prompt-Set das monatlich wiederholt wird aussagekräftiger als ein einmaliger umfassender Test.
