
llms.txt erklärt: Der Standard für KI-Crawler und LLMs
llms.txt ist ein maschinenlesbarer Standard, der KI-Systemen strukturierte Informationen über Ihre Website bereitstellt. Aufbau, Best Practices und praktische Implementierung für bessere KI-Sichtbarkeit bei ChatGPT, Claude, Gemini und Perplexity.
Zusammenfassung
llms.txt beantwortet eine einfache Frage: Wie teilen Websites KI-Systemen mit, worauf sie optimiert sind? Die Datei folgt einem klaren Markdown-Format und liegt im Root-Verzeichnis. So verstehen ChatGPT, Claude und Perplexity Ihre Website besser und zitieren Ihre Inhalte häufiger. Dieser Guide zeigt den Aufbau, häufige Fehler und was in der Praxis funktioniert.
Was ist llms.txt?
llms.txt ist eine Textdatei im Markdown-Format, die im Root-Verzeichnis einer Website liegt (unter example.com/llms.txt). Sie enthält strukturierte Informationen, die speziell für Large Language Models und KI-Crawler gedacht sind. Der Standard wurde am 3. September 2024 von Jeremy Howard (Answer.AI) vorgeschlagen.
Die Datei folgt einem festen Aufbau: Erforderlich ist nur eine H1-Überschrift mit dem Projekt- oder Website-Namen. Darunter folgen optional eine kurze Zusammenfassung als Blockquote (>) und H2-Sektionen mit Link-Listen zu den wichtigsten Inhalten, jeweils mit kurzer Beschreibung. Ergänzend gibt es eine ausführliche Voll-Variante, die llms-full.txt heisst und die gesamte Dokumentation als ein Markdown-Dokument bündelt. Anthropic stellt diese Voll-Variante für die eigene Entwickler-Dokumentation bereit.
Aufbau einer llms.txt-Datei
Der Aufbau folgt der offiziellen llms.txt-Spezifikation. Eine typische llms.txt-Datei sieht so aus:
# Bombelli Analytics
> KI-Reputationsanalyse und Generative Engine Optimization (GEO)
## Über uns
Wir analysieren, wie KI-Systeme wie ChatGPT, Claude, Gemini und Perplexity
Unternehmen in ihren Antworten darstellen. Mit transparenten Daten,
Excel-Export und priorisierten Handlungsempfehlungen.
## Services
- [GEO-Audit](https://bombelli-analytics.ch/services): Einmalige Analyse
- [Monitoring](https://bombelli-analytics.ch/services): Monatlicher Re-Test
- [Methodik](https://bombelli-analytics.ch/methodik): Unser Ansatz
## Resources
- [Blog](https://bombelli-analytics.ch/blog): Analysen & Einordnung
- [Glossar](https://bombelli-analytics.ch/glossar): Begriffe erklärt
- [FAQ](https://bombelli-analytics.ch/faq): Häufige Fragen
Diese Struktur ist intuitiv: Ein Titel mit #, eine Zusammenfassung mit >, dann Sektionen mit ## und darunter Links mit Beschreibungen. KI-Systeme können diesen Aufbau automatisch parsen und verstehen sofort, was Ihre Website tut und welche Inhalte am wichtigsten sind.
Warum ist llms.txt wichtig für GEO?
Wenn KI-Systeme Ihre Website besuchen, müssen sie entscheiden, welche Inhalte relevant sind und wie sie diese interpretieren. Eine llms.txt-Datei hilft dabei auf drei Arten:
- Fokussierung: Sie zeigen dem System ohne langes Crawling, welche Seiten am wichtigsten sind
- Kontext: Sie liefern Zusammenfassungen, die das Verständnis verbessern und das Risiko von Missinterpretationen senken
- Struktur: Sie machen komplexe Websites navigierbar für KI-Crawler und sparen dem System Rechenressourcen
Eine llms.txt fasst in wenigen Zeilen zusammen, was Ihre Website anbietet und welche Seiten am wichtigsten sind. Genau diese Klarheit hilft einem KI-System bei der Einordnung.
Das Ergebnis: Wenn ChatGPT oder Claude eine Frage zu Ihrem Themengebiet beantworten, haben sie eine höhere Chance, Ihre Inhalte korrekt zu verstehen und als Quelle zu nutzen. Gerade im B2B kann KI-Sichtbarkeit den Unterschied machen, weil Kaufentscheidungen dort recherche-getrieben sind und die korrekte Darstellung in KI-Antworten früh in den Auswahlprozess einfliesst.
Welche KI-Systeme nutzen llms.txt?
Hier lohnt sich Ehrlichkeit: Eine Datei bereitstellen heisst nicht, dass die grossen KI-Crawler sie auch abholen. Statt einer pauschalen Ja-Liste zeigt die folgende Tabelle den tatsächlich beobachteten Evidenzstand:
| System / Crawler | Holt die Datei ab? | Einordnung |
|---|---|---|
| OpenAI (GPTBot) | Vereinzelt in Server-Logs beobachtet | Einziges Crawler-Signal mit gemischter Evidenz |
| Anthropic (ClaudeBot) | Kein verlässlicher Nachweis in Server-Logs | Anthropic nutzt eine eigene llms.txt für die Doku, holt fremde aber kaum |
| Perplexity | Kein klarer Nachweis in Server-Logs | Quellenauswahl läuft über normales Crawling und Indexierung |
| Google (Gemini, AI Overviews) | Offiziell nicht unterstützt | Google crawlt die Datei nach eigener Aussage nicht |
Anthropic stellt für die eigene Entwickler-Dokumentation eine llms.txt und eine ausführliche llms-full.txt bereit. Google unterstützt den Standard für die Suche dagegen offiziell nicht: Gary Illyes von Google Search Central sagte am 24. Juli 2025, Google unterstütze llms.txt offiziell nicht und plane das auch nicht. Wie verlässlich die Datei in der Praxis abgeholt wird, lässt sich nur empirisch beantworten: Ob die grossen KI-Crawler die Datei tatsächlich abholen, zeigen Server-Logs aus unserer eigenen Auswertung.
Best Practices für llms.txt
Damit Ihre llms.txt-Datei optimal funktioniert, beachten Sie folgende Punkte:
1. Klarheit vor Vollständigkeit
Listen Sie einige wenige, klar priorisierte Seiten auf. Zu viele Links verwässern den Fokus und machen es schwerer für KI-Systeme, Ihre Prioritäten zu erkennen. Eine kurze, fokussierte llms.txt wird nach unserer Einschätzung zuverlässiger verarbeitet als eine lange Linkliste.
2. Aussagekräftige Beschreibungen
Schreiben Sie für jede verlinkte Seite eine kurze Beschreibung (1-2 Sätze), die erklärt, was dort zu finden ist. Vermeiden Sie Marketing-Floskeln und bleiben Sie sachlich. "GEO-Audit für B2B-Unternehmen: Analyse Ihrer KI-Sichtbarkeit bei ChatGPT, Claude und Perplexity" ist besser als "Revolutionäre Lösung für KI-Sichtbarkeit".
3. Aktualität
Halten Sie die Datei aktuell. Wenn sich Ihre wichtigsten Inhalte ändern oder Sie neue Services starten, passen Sie die llms.txt entsprechend an. Veraltete Informationen können KI-Systemen schaden, da sie widersprüchliche Signale empfangen.
4. Markdown-Formatierung
Nutzen Sie Markdown-Überschriften (##), Listen (-) und Links ([Text](URL)) für klare Strukturierung. KI-Systeme können Markdown gut parsen und interpretieren es konsistent. Vermeiden Sie komplexe HTML oder proprietäre Formate.
Häufige Fehler vermeiden
Diese Fehler sollten Sie bei der Erstellung vermeiden:
- Zu generisch: "Unsere Dienstleistungen" ist weniger hilfreich als "GEO-Audit: Einmalige KI-Reputationsanalyse für 1000+ Seiten"
- Zu werblich: Nennen Sie prüfbare Fakten wie Preise, Seitenzahlen und Zielgruppe und verzichten Sie auf Superlative
- Veraltete Links: Prüfen Sie regelmässig, dass alle Links funktionieren und auf aktuelle Inhalte zeigen
- Inkonsistente Struktur: Halten Sie sich an das Markdown-Schema: keine Mischung aus Markdown und HTML
- Zu viele Inhalte: Halten Sie die Datei schlank. Eine kurze, klar priorisierte llms.txt wird zuverlässiger verarbeitet als eine lange
llms.txt und robots.txt: Der Unterschied
Während robots.txt Crawlern sagt, was sie nicht tun sollen (z.B. bestimmte Bereiche nicht indexieren), sagt llms.txt KI-Systemen, was sie priorisieren sollen. Die beiden Dateien ergänzen sich:
- robots.txt: Technische Zugriffssteuerung für alle Crawler
- llms.txt: Inhaltliche Orientierungshilfe speziell für KI-Systeme
Sie können beide gleichzeitig nutzen, ohne dass es zu Konflikten kommt. robots.txt kann Bereiche blockieren (z.B. Login-Seiten), während llms.txt gleichzeitig die Best-Landing-Pages listet.
Schweizer Perspektive: llms.txt und der Datenschutz (DSG)
Eine llms.txt liegt im Root-Verzeichnis und ist öffentlich abrufbar: Jeder kann ihre-domain.ch/llms.txt im Browser aufrufen. Die Datei versteckt nichts und verarbeitet keine Personendaten. Sie verweist nur auf Inhalte, die Sie ohnehin öffentlich kommunizieren wollen. Bei korrekter Nutzung berührt sie das Schweizer Datenschutzgesetz (DSG/revDSG) deshalb nicht.
Die praktische Handlungsempfehlung folgt direkt aus dieser öffentlichen Abrufbarkeit: Nehmen Sie keine internen Pfade, keine Kundendaten und keine nicht-öffentlichen Informationen in die llms.txt auf. Was dort steht, ist für jeden offen lesbar. Behandeln Sie die Datei wie eine öffentliche Visitenkarte Ihrer Website. Das passt zu unserem Ansatz bei Bombelli Analytics: transparente, nachvollziehbare Daten und ein klarer Schweizer DSG-Fokus.
Nächste Schritte: Implementierung
Sie möchten llms.txt implementieren? Hier ist der typische Prozess:
- Verstehen: Sie wissen jetzt, was llms.txt ist und warum es wichtig ist für bessere KI-Sichtbarkeit
- Erstellen: Nutzen Sie praktische Tools und Generatoren für Ihre llms.txt
- Hochladen: Folgen Sie unserem Guide zum Hochladen und Prüfen
- Testen: Nutzen Sie KI-Systeme (ChatGPT, Claude) um zu prüfen, ob sie Ihre Datei auslesen
- Messen: Ein Prompt Audit zeigt den Effekt messbar auf KI-Sichtbarkeit. Wie Sie den Effekt messen, fassen wir im Mess-Überblick mit fünf Metriken zusammen
- Optimieren: Ein professionelles GEO-Audit zeigt alle Optimierungsmöglichkeiten im Kontext Ihrer Gesamtstrategie
Weitere Informationen finden Sie auch in unserem Methodologie-Artikel zu Generative Engine Optimization und unserem detaillierten LLMO-Guide.
Häufige Fragen zu llms.txt
Was ist llms.txt?
llms.txt ist eine Textdatei im Markdown-Format, die im Root-Verzeichnis einer Website liegt. Sie enthält den Namen der Website als H1, eine kurze Zusammenfassung als Blockquote und darunter H2-Sektionen mit priorisierten Links und Beschreibungen. Der Standard wurde am 3. September 2024 von Jeremy Howard (Answer.AI) vorgeschlagen.
Warum ist llms.txt wichtig für GEO?
Eine llms.txt fasst in wenigen Zeilen zusammen, was Ihre Website anbietet und welche Seiten am wichtigsten sind. Genau diese Klarheit hilft einem KI-System bei der Einordnung Ihrer Inhalte. Gerade im B2B, wo Kaufentscheidungen recherche-getrieben sind, kann die korrekte Darstellung in KI-Antworten den Unterschied machen.
Welche KI-Systeme nutzen llms.txt?
Einige Systeme können llms.txt auslesen, die tatsächliche Abholung durch die grossen Crawler ist aber begrenzt. Google unterstützt den Standard für die Suche offiziell nicht (Gary Illyes, Google Search Central, 24. Juli 2025). Ob die grossen KI-Crawler die Datei tatsächlich abholen, zeigt unsere Server-Log-Auswertung.
- ein, zwei Modelle zu einem einzigen Zeitpunkt
- eine Momentaufnahme, die morgen schon anders aussieht
- einen groben Eindruck, aber keinen Vergleich und keine Priorisierung
- die Messung über mehrere Modelle, Sprachen und Märkte, laufend statt einmalig
- belastbare Rohdaten als Excel, pro KI-Antwort nachvollziehbar
- einen priorisierten Massnahmenplan, den Sie sofort umsetzen
- und das alles, ohne dass Sie selbst messen müssen
Wie sichtbar ist Ihre Marke in KI-Antworten?
Ein GEO-Audit zeigt Ihnen, wie ChatGPT, Claude und andere KI-Systeme über Ihr Unternehmen sprechen: mit transparenten Daten und konkreten Massnahmen für bessere KI-Sichtbarkeit.