Guide GEO

Prompt Audit: KI-Reputation systematisch testen.

So testen Sie, wie ChatGPT, Claude und Gemini über Ihr Unternehmen sprechen. Eine Schritt-für-Schritt-Anleitung mit Prompt-Sets, Auswertungsraster und konkreten Massnahmen.

Von Tsari Bombelli · 31. Januar 2026 · Aktualisiert 15. Juni 2026

Was ist ein Prompt Audit?

Ein Prompt Audit ist eine systematische Analyse, wie KI-Systeme auf Fragen zu Ihrem Unternehmen, Ihren Produkten oder Dienstleistungen antworten. Sie stellen ChatGPT, Claude und Gemini relevante Fragen und dokumentieren die Ergebnisse.

Das Ziel: Ihre aktuelle KI-Sichtbarkeit verstehen, Lücken erkennen und eine Baseline für spätere Optimierungen schaffen. In der Praxis ist ein Prompt Audit der erste Schritt jeder GEO-Strategie.

Warum braucht es dafür ein durchdachtes Prompt-Set und nicht nur den Markennamen? Web-fähige KI-Systeme beantworten eine Nutzerfrage selten mit einer einzigen Suche. Sie fächern die Anfrage in mehrere parallele Sub-Suchanfragen auf und ziehen Quellen aus all diesen Teilanfragen zusammen. Eine Analyse von ChatGPT-Suchen zählte bei einzelnen Antworten über zehn solcher Fan-out-Queries, jede auf eine eigene Quelle gerichtet. Wie das im Detail abläuft, zeigen wir in wie ChatGPT mit Fan-out-Queries sucht. Für den Audit heisst das: Ein gutes Prompt-Set deckt direkte, indirekte, Problem- und Vergleichs-Fragen ab, weil das Modell genau über diese Wege auf Quellen stösst.

Wann ist ein Prompt Audit sinnvoll?

Sie möchten wissen, ob und wie KI-Systeme Ihr Unternehmen erwähnen.
Sie planen eine GEO-Strategie und brauchen eine Baseline.
Sie wollen Wettbewerbsvergleiche durchführen: Wer wird bei LLM-Benchmarks erwähnt, wer nicht?
Sie haben Content optimiert und möchten den Effekt auf Ihre KI-Reputation messen.

Vorbereitung: Was Sie brauchen

Zugang zu LLMs: Idealerweise ChatGPT Plus, Claude Pro und Gemini Advanced. Für den Schnell-Audit reicht ChatGPT mit Web-Suche.
Zeitbudget: Rechnen Sie mit 2 bis 4 Stunden für den initialen Audit. Bei 25 Prompts und 3 Systemen sind das 75 einzelne Tests.
Dokumentation: Ein Spreadsheet oder Notiz-Tool für die Ergebnisse. Struktur ist wichtiger als das Tool.
Klarer Fokus: Definieren Sie vorab, was Sie testen möchten: Marke, Produkt, Branche oder ein spezifisches Thema.

Schritt 1: Prompt-Set definieren

Erstellen Sie 10 bis 25 Prompts, die relevante Nutzeranfragen zu Ihrem Themenbereich simulieren. Teilen Sie diese in vier Kategorien auf:

A) Direkte Marken-Queries

Fragen, die Ihr Unternehmen direkt beim Namen nennen:

# Direkte Marken-Queries
"Was macht [Ihr Unternehmen]?"
"Ist [Ihr Unternehmen] seriös?"
"Welche Dienstleistungen bietet [Ihr Unternehmen] an?"

B) Indirekte Bedarfs-Queries

Fragen, bei denen Sie als Lösung relevant wären:

# Indirekte Bedarfs-Queries
"Welche Schweizer Anbieter gibt es für [Ihre Dienstleistung]?"
"Wie finde ich einen guten [Ihre Branche]-Experten?"
"Vergleich: [Wettbewerber 1] vs [Wettbewerber 2] vs andere"

C) Problem-/Lösungs-Queries

Fragen, die das Problem adressieren, das Sie lösen:

# Problem-/Lösungs-Queries
"Wie kann ich [spezifisches Problem] lösen?"
"Best Practices für [Ihr Themengebiet]"
"Worauf muss ich bei [Ihr Thema] achten?"

D) Vergleichs-Queries

Fragen, die Alternativen evaluieren:

# Vergleichs-Queries
"[Ihre Dienstleistung] Anbieter Vergleich Schweiz"
"Was ist besser: [Ansatz A] oder [Ansatz B]?"
"Top 5 [Ihre Branche] in [Region]"

Beispiel-Set für ein Beratungsunternehmen

"Was macht Bombelli Analytics?"
"Wie analysiert man KI-Reputation?"
"Schweizer Anbieter für GEO-Analysen"
"Was ist Generative Engine Optimization?"
"Wie messe ich KI-Sichtbarkeit meines Unternehmens?"
"ChatGPT Quellenanalyse Tools"
"Unterschied SEO vs GEO"
"llms.txt erstellen lassen"
"KI-Reputationsanalyse Kosten Schweiz"
"Monitoring für KI-Erwähnungen"

Schritt 2: LLM-Systeme festlegen

Definieren Sie, welche Systeme Sie testen. Für einen aussagekräftigen LLM-Benchmark empfehlen wir mindestens drei Systeme:

Empfohlen: ChatGPT (mit aktivierter Web-Suche), Perplexity (nativ mit Web-Suche), Claude und Gemini. Optional: Grok, Mistral oder DeepSeek.

Für einen Schnell-Audit reichen ChatGPT und Perplexity. Beide greifen auf aktuelle Web-Daten zu, was die Ergebnisse aussagekräftiger macht als bei Modellen ohne Web-Zugriff. Laut OpenAI durchsucht ChatGPT bei aktuellen Fragen automatisch das Web und versieht die Antworten mit anklickbaren Quellen-Zitaten. Genau diese Quellen-Verlinkungen sind für den Audit entscheidend, weil sie zeigen, ob das Modell Ihre Website tatsächlich als Beleg heranzieht.

Schritt 3: Systematisch testen

Führen Sie jeden Prompt über jedes System durch. Dokumentieren Sie pro Test diese sieben Datenpunkte:

Datenpunkt	Erfassen
Sichtbarkeit	Wird Ihr Unternehmen erwähnt? (Ja / Nein / Indirekt)
Position	An welcher Stelle? (Primär / Sekundär / Erwähnung)
Tonalität	Positiv / Neutral / Negativ / Gemischt
Korrektheit	Sind die Aussagen faktisch richtig?
Quellen	Welche Websites werden zitiert?
Wettbewerb	Welche Konkurrenten werden genannt?
Vollständigkeit	Fehlen wichtige Informationen über Ihr Angebot?

Beispiel-Dokumentation

# Dokumentationsbeispiel
Prompt:       "Schweizer Anbieter für GEO-Analysen"
System:       ChatGPT
Sichtbarkeit: Ja
Position:     Sekundär (3. von 5 genannten)
Tonalität:    Neutral
Korrektheit:  Korrekt
Quellen:      bombelli-analytics.ch, LinkedIn
Wettbewerber: [Namen]
Notizen:      Beschreibung unvollständig, Fokus unklar

Schritt 4: Auswertung

Analysieren Sie die gesammelten Daten mit diesen fünf Metriken:

# Metriken berechnen
Sichtbarkeitsrate     = Erwähnungen / Gesamt-Prompts × 100
Primärposition-Rate   = Primärposition / Erwähnungen × 100
Quellenvielfalt       = Anzahl verschiedener zitierter URLs
Wettbewerbsvergleich  = Ihre Erwähnungen vs. Konkurrenz-Erwähnungen
Zitierquote           = Antworten mit Link auf Ihre Website / Gesamt-Antworten × 100

# Beispielrechnung (nur Systeme mit Web-Zugriff)
# 40 Antworten getestet, 8 davon verlinken Ihre Website
# Zitierquote = 8 / 40 × 100 = 20 %

Die Zitierquote unterscheidet die blosse Erwähnung von der echten Quellen-Zitation. Eine Erwähnung nennt Ihr Unternehmen im Antworttext. Die Zitierquote misst, wie oft das Modell zusätzlich Ihre Domain als Quelle verlinkt. Damit der Wert sauber bleibt und nie über 100 Prozent steigt, verwenden Zähler und Nenner dieselbe Grundmenge: Zähler sind die Antworten, in denen mindestens ein Link auf Ihre Website steht, Nenner ist die Gesamtzahl der ausgewerteten Antworten. Mehrere Links innerhalb einer Antwort zählen als eine zitierende Antwort. Ein Beispiel: Bei 40 ausgewerteten Antworten verlinken 8 Ihre Website, das ergibt eine Zitierquote von 20 Prozent.

Die Zitierquote gilt nur für Systeme mit Web-Zugriff. ChatGPT und Perplexity durchsuchen aktiv das Web und setzen anklickbare Quellen-Links, weshalb sich die Quote dort messen lässt. Modelle, die ohne Web-Zugriff aus dem Trainingswissen antworten, verlinken keine Quellen, hier bleibt die Zitierquote per Definition leer und Sie werten nur Erwähnung, Position und Tonalität aus. Bei den web-fähigen Systemen ist die Zitierquote der entscheidende Sichtbarkeitshebel, weil ein gesetzter Link Klicks bringt und dem Modell signalisiert, dass Ihre Seite die Antwort trägt. Was die einzelnen Metriken geschäftlich bedeuten, ordnet die fünf Metriken der KI-Sichtbarkeit ein.

Muster identifizieren

Schauen Sie genau hin: Bei welchen Prompt-Typen erscheinen Sie, bei welchen fehlen Sie komplett? Welche Quellen dominieren die Zitationen? Gibt es konsistente Fehlinformationen, die sich über mehrere Systeme hinweg wiederholen? Und wie unterscheiden sich die Ergebnisse zwischen ChatGPT, Claude und Gemini?

Schritt 5: Massnahmen ableiten

Basierend auf Ihren Erkenntnissen lassen sich vier Handlungsfelder ableiten.

Content-Lücken schliessen

Wenn Sie bei bestimmten Themen nicht erscheinen, fehlt vermutlich Content dazu auf Ihrer Website. Prüfen Sie, ob Ihre Seiten die Fragen beantworten, die Nutzer an KI-Systeme stellen.

Bestehenden Content optimieren

Seiten, die bereits zitiert werden, lassen sich weiter verbessern. Strukturierte Daten, klare Aussagen und eine llms.txt-Datei helfen dabei.

Fehlinformationen korrigieren

Wenn LLMs falsche Informationen ausgeben, liegt das oft an veralteten oder widersprüchlichen Quellen. Aktualisieren Sie Ihre eigene Website mit korrekten Angaben.

Wettbewerbsvorteile nutzen

Identifizieren Sie, wo Konkurrenten dominieren, und entwickeln Sie Content für Themen, bei denen Sie bisher nicht vorkommen.

Best Practices

Wiederholen Sie den Audit quartalsweise. Nur so sehen Sie, ob Ihre Optimierungen Wirkung zeigen. Verwenden Sie dabei dieselben Prompts, damit die Ergebnisse vergleichbar bleiben. Ergänzen Sie neue Prompts und lassen Sie die bestehenden unverändert.

Formulieren Sie Prompts immer neutral. Die Fragen sollen echte Nutzeranfragen simulieren, nicht Ihr Unternehmen bewerben. "Schweizer GEO-Anbieter" ist besser als "Warum ist [Ihr Unternehmen] der beste GEO-Anbieter".

Speichern Sie Screenshots der LLM-Antworten. KI-Antworten ändern sich laufend und Screenshots sind der einzige verlässliche Nachweis für Ihre Baseline.

FAQ: Prompt Audit. Häufige Fragen

Wie oft sollten Sie einen Prompt Audit wiederholen?

Wiederholen Sie den Audit quartalsweise. Nur so sehen Sie, ob Ihre Optimierungen Wirkung zeigen. Verwenden Sie dabei dieselben Prompts, damit die Ergebnisse vergleichbar bleiben, und ergänzen Sie neue Prompts, ohne die bestehenden zu verändern.

Welche LLM-Systeme sollten Sie mindestens testen?

Testen Sie mindestens ChatGPT und Perplexity, da beide auf aktuelle Web-Daten zugreifen. Idealerweise prüfen Sie zusätzlich Claude und Gemini. Für einen Schnell-Audit reichen ChatGPT und Perplexity aus.

Reicht ein DIY-Prompt-Audit oder braucht es ein professionelles Audit?

Ein DIY-Audit zeigt den Status quo und reicht für eine erste Baseline. Ab grossen Prompt-Sets über mehrere Systeme und für wiederholbare, statistisch ausgewertete Analysen mit Excel-Export lohnt sich ein professionelles Audit.

Was ist der Unterschied zwischen Erwähnung und Zitierquote?

Eine Erwähnung nennt Ihr Unternehmen im Antworttext. Die Zitierquote misst, wie oft das Modell zusätzlich Ihre Website als Quelle verlinkt. Bei Web-Suche-Systemen wie ChatGPT und Perplexity ist die Zitierquote der entscheidende Sichtbarkeitshebel.

Grenzen des DIY-Audits

Ein manueller Prompt Audit ist ein guter Anfang. Er zeigt Ihnen, wo Sie stehen. Aber er hat Grenzen: Bei grossen Prompt-Sets (100+ Prompts über 5 Systeme) wird es manuell schlicht zu aufwändig. Die Bewertung von Tonalität bleibt subjektiv. Veränderungen über die Zeit sind schwer konsistent zu tracken, weil LLM-Antworten sich von Tag zu Tag unterscheiden können. Und eine automatisierte Quellenextraktion oder statistische Aufbereitung ist manuell nicht machbar. Welche Monitoring-Werkzeuge diese Lücke schliessen, ordnet unser unabhängiger Vergleich der AI-Visibility-Tools ein.

Bei Bombelli Analytics lassen wir genau diesen Prozess automatisiert über 50 bis 100 Prompts und mehrere Modelle laufen und übergeben Ihnen die Rohdaten als Excel, damit Sie jede einzelne Bewertung nachvollziehen können. Für umfassende, wiederholbare Analysen mit dieser transparenten Messung und Excel-Export empfehlen wir ein professionelles GEO-Audit.

Illustratives Beispiel · keine realen Mandatszahlen

Ein Schweizer Treuhandunternehmen taucht bei der Frage "Welches Treuhandbüro in Luzern empfiehlst du für KMU?" in ChatGPT zunächst nicht auf. Nach gezielten Massnahmen an den Website-Inhalten zeigt eine erneute Messung ein deutlich anderes Bild:

Sichtbarkeit vorher

0 / 10

→

Sichtbarkeit nachher

4 / 10

So sieht ein typisches Vorher/Nachher in unseren Reports aus: in wie vielen von zehn gestellten Kaufabsichts-Fragen das Unternehmen genannt wird.

Illustratives Szenario zur Veranschaulichung des Report-Formats. Sobald reale, anonymisierte Mandatszahlen vorliegen, ersetzen sie dieses Beispiel.

Vertraulichkeit

Für die Sichtbarkeits-Analyse verarbeiten wir ausschliesslich öffentliche Informationen: die Fragen, die Ihre Kunden der KI stellen, und Ihre öffentlich zugänglichen Website-Inhalte. Keine Mandanten-, Kunden- oder internen Daten. Reports liegen auf Schweizer Servern, DSG-konform.

Selbst testen oder messen lassen?

Ein Schnelltest selbst zeigt

ein, zwei Modelle zu einem einzigen Zeitpunkt
eine Momentaufnahme, die morgen schon anders aussieht
einen groben Eindruck, aber keinen Vergleich und keine Priorisierung

Mit Bombelli Analytics bekommen Sie

die Messung über mehrere Modelle, Sprachen und Märkte, laufend statt einmalig
belastbare Rohdaten als Excel, pro KI-Antwort nachvollziehbar
einen priorisierten Massnahmenplan, den Sie sofort umsetzen
und das alles, ohne dass Sie selbst messen müssen

Wir zeigen Ihnen im Erstgespräch, wo Sie in den KI-Antworten heute stehen.

Tsari Bombelli

Gründer · GEO-Spezialist

Tsari Bombelli ist Gründer von Bombelli Analytics in Luzern. Er misst mit transparenter Methodik, wie ChatGPT, Claude, Gemini und Perplexity über Schweizer Unternehmen sprechen, und übersetzt die Befunde in einen priorisierten Massnahmenplan mit Rohdaten.

Mehr zum Team → LinkedIn →

Nächster Schritt

Professionelles GEO-Audit gewünscht?

Wir führen systematische Prompt Audits über 50 bis 100 Prompts durch, mit vollständiger Dokumentation, Excel-Export und priorisierten Massnahmen für Ihre KI-Sichtbarkeit.

GEO-Audit anfragen Methodik ansehen