Willkommen

# Markdown vs. HTML: Wie sinnvoll ist es für GEO und KI-Sichtbarkeit?

> URL: https://4eck-media.de/blog/markdown-vs-html-geo-ki-sichtbarkeit/  
> Language: de  
> Description: Wir haben in den vergangenen elf Tagen 9.822 Anfragen von 37 verschiedenen KI-Bots auf 4eck-media.de geloggt. Das Auffällige daran: 83 Prozent dieser Bots haben die Markdown-Versi…

---

Wir haben in den vergangenen elf Tagen 9.822 Anfragen von 37 verschiedenen KI-Bots auf 4eck-media.de geloggt. Das Auffällige daran: 83 Prozent dieser Bots haben die Markdown-Version unserer Seiten abgerufen, gerade einmal 12 Prozent das klassische HTML. Wer im Jahr 2026 ernsthaft über GEO redet und immer noch nur HTML ausliefert, lässt aus unserer Sicht einen großen Hebel ungenutzt. Wir zeigen in diesem Beitrag, warum das so ist, warum Google davon nichts hören will, was Cloudflare gerade ausrollt und wie ihr Markdown selbst sinnvoll auf eurer Seite bereitstellt.

    
        
            
                                                    Drei Fakten zum Mitnehmen
                            
                            
                    
                        
- 83 Prozent der erfolgreichen KI-Bot-Anfragen auf 4eck-media.de werden bereits als Markdown ausgeliefert, bei ChatGPT-User sind es sogar 99,1 Prozent. (Quelle: eigene Logfiles, 5. bis 16. Mai 2026, 9.822 Bot-Hits)
- Rund 80 Prozent weniger Token verbraucht eine Markdown-Seite gegenüber dem HTML-Original, mit entsprechender Einsparung bei Bandbreite und Crawl-Last. (Quelle: Cloudflare, Februar 2026)
- 20 Prozent aller Websites weltweit laufen über Cloudflare, 81,5 Prozent im Reverse-Proxy-Markt. Genau dort wird Markdown for Agents seit Februar 2026 ausgerollt. (Quelle: W3Techs, Januar 2026)

                                            
                                    
                    
    

## Worum geht es bei Markdown eigentlich, kurz erklärt

GEO steht für Generative Engine Optimization. Gemeint ist die Optimierung von Websites für KI-Suchsysteme wie ChatGPT, Claude, Perplexity oder die AI Overviews bei Google. Die Frage dahinter: Wie kommt mein Content sauber in die Antwort, die ein Sprachmodell einem Nutzer ausspielt?

Markdown ist ein simples Textformat. Stellt euch vor, ihr schreibt einen Brief in Word und wollt etwas fett setzen, eine Überschrift einfügen oder eine Liste anlegen. Normalerweise klickt ihr dafür auf kleine Icons. In Markdown nutzt ihr stattdessen ein paar kleine Symbole direkt im Fließtext:

```
# Meine Überschrift     →  wird zu einer großen Überschrift
**wichtig**             →  wird zu fettem Text
```

Das ist alles. Reiner Text mit ein paar Sonderzeichen. Ein Mensch kann das direkt lesen, ein Computer kann es eindeutig interpretieren. Zum Vergleich: Wenn ein Browser eine Website aufruft, bekommt er HTML zurück. Das sieht typischerweise so aus:

```
<div class="container-fluid bg-white shadow-lg p-4">
  <header role="banner" data-track="hero">
    <h1 class="title-xl mb-3">Willkommen</h1>
  </header>
  <nav><ul class="menu"><li><a href="...">Home</a></li>...
```

Ein Browser ist genau für diesen Wust gebaut. Er macht aus dem Markup Buttons, Menüs, Cookie-Banner, Fonts und Farben. Ein KI-Agent wie ChatGPT, Claude oder Perplexity hat es deutlich schwerer. Er will wissen, was im Artikel tatsächlich drinsteht. Die Navigation interessiert ihn dabei nicht, die 14 Tracking-Scripts auch nicht. In einer typischen HTML-Seite sind grob 80 Prozent visuelle Verpackung und etwa 20 Prozent Inhalt. Markdown liefert die 20 Prozent direkt.

## Was unsere AI Bot Logfiles auf 4eck-media.de zeigen

Wir tracken seit einer Weile 160 bekannte KI-Bots und User Agents auf unserer Website. Im Auswertungszeitraum vom 5. bis 16. Mai 2026 sah die Verteilung so aus:

| Bot | Anfragen | Markdown-Anteil |
| --- | --- | --- |
| meta-externalagent (Meta AI) | 3.481 | 97,9 % |
| chatgpt-user (ChatGPT Live Browsing) | 1.404 | 99,1 % |
| amazonbot | 599 | 92,7 % |
| gptbot (OpenAI Training) | 630 | 91,7 % |
| claudebot (Anthropic) | 466 | 98,5 % |
| bytespider (ByteDance/TikTok) | 273 | 82,8 % |
| oai-searchbot | 113 | 42,5 % |
| ccbot (Common Crawl) | 25 | 84,0 % |
| duckassistbot | 20 | 85,0 % |

Über alle erfolgreichen Auslieferungen hinweg gingen 83,3 Prozent als Markdown raus, 12,5 Prozent als HTML, der Rest verteilt sich auf Plain Text, JSON und ein paar XML-Feeds. Anders gesagt: Die LLM-Bots da draußen sagen mit ihren Headern selbst sehr deutlich, was sie wollen. Sie wollen Markdown. Sobald sie es bekommen können, nehmen sie es.

Genauso aufschlussreich ist die Gegenseite. Diese Bots haben in unseren Logs in elf Tagen nicht einen einzigen Markdown-Request geschickt: PetalBot (Huawei), Applebot, FacebookExternalHit, GoogleOther und der AgentReadinessScanner. Sie laden weiter HTML. Wer Bots bedienen will, muss also beides parallel beherrschen.

Und der Trend zeigt klar in eine Richtung. Am 5. Mai lagen wir bei **67 Prozent Markdown-Anteil pro Tag**. In der zweiten Maiwoche pendelte die Quote zwischen 86 und 94 Prozent. Am 16. Mai waren wir **bei 97 Prozent**. Die Bots lernen schnell, dass Seiten Markdown können, und stellen ihre Anfragen entsprechend um.

## Nebeneffekt: Bot-Logging zahlt sich doppelt aus

Das saubere Loggen aller KI-Bot-Zugriffe bringt zwei Erkenntnisse, die mit der eigentlichen Markdown-Frage nichts zu tun haben, aber den Aufwand des Trackings allein schon rechtfertigen.

### Vergessene URLs aus alten Trainingsdaten zurückgewinnen

KI-Bots steuern regelmäßig URLs auf 4eck-media.de an, die wir seit Jahren nicht mehr aktiv verlinken. Sie tauchen weder im Menü auf, noch in der Sitemap, noch in internen Links. Trotzdem fragen die Bots sie an, vermutlich weil die URLs in irgendeinem Trainingsdaten-Index stehen, der bei einer früheren Modellerstellung verwendet wurde.

Im Logfile zeigen sich diese Versuche als 404er, manchmal auch als 500er. Genau hier liegt der praktische Hebel: Wir sehen Wunsch-Adressen, die wir sonst gar nicht auf dem Schirm hätten, und können dafür saubere 301-Weiterleitungen auf passende aktuelle Seiten einrichten. Damit fangen wir Traffic ab, den klassische SEO-Tools wie Search Console oder Sitemap-Audits gar nicht aufdecken würden, weil die Quelle dieser Anfragen außerhalb des offenen Webs liegt, also tief im Trainings-Snapshot eines LLMs. Das ist eine Art Reverse Engineering alter Indizes, die ohne Bot-Logging schlicht unsichtbar bliebe.

    
        
            
                
                    

![Bot Hits zeigen neben Content-Type auch Status-Fehler an](https://4eck-media.de/https://4eck-media.de/wp-content/uploads/2026/05/bot-hits-404.avif "Bot Hits zeigen neben Content-Type auch Status-Fehler an")
                
            
        
    

### Performance-Probleme aus der Bot-Perspektive aufdecken

Der zweite Effekt betrifft die Server-Geschwindigkeit. Wenn ein Bot wie GPTBot oder ChatGPT-User eine Seite anfragt und in einem schmalen Zeitfenster keine vollständige Antwort bekommt, bricht er ab. Im Logfile landet das als HTTP 499 (Client Closed Request) oder als 504 (Gateway Timeout). Die ungeladenen Inhalte gelangen damit weder in den Trainings- noch in den Retrieval-Pool. Eure Marke fehlt in der späteren KI-Antwort, obwohl sie inhaltlich relevant gewesen wäre.

In der GEO-Community kursiert die Faustregel von 500 bis 700 Millisekunden als Abbruchschwelle. Diese Zahl ist nicht offiziell von OpenAI oder Anthropic dokumentiert, sie ergibt sich aus Praxisbeobachtungen. Plausibel ist sie trotzdem, weil sie genau in dem Übergangsbereich liegt, in dem auch klassische Web-Performance-Metriken wie Time to First Byte oder die Core Web Vitals den Unterschied zwischen guter und schlechter User Experience markieren. Als Daumenregel fürs KI-Crawler-Setup ist sie deshalb eine brauchbare Orientierung. Wir referenzieren diesen Schwellwert ebenso in unserem [4eck GEO-Framework für KI-Sichtbarkeit und KI-Empfehlungen](https://4eck-media.de/https://4eck-media.de/blog/geo-framework-ki-sichtbarkeit-empfehlungen/).

Konkret heißt das für eure Site: Wer 499er oder 504er von KI-Bots häufiger im Log sieht, hat ein Performance-Thema, das sich aus der klassischen Webanalyse heraus oft gar nicht zeigt, weil Menschen tendenziell länger warten als Bots. Caching, Datenbankoptimierung und ein schlanker Markdown-Output (siehe weiter unten) wirken hier alle drei in dieselbe Richtung.

## Google sagt: Nicht nötig. Cloudflare sagt: Pflicht.

Google hat im April seinen offiziellen [Guide zur Optimierung für generative KI-Features](https://4eck-media.de/https://developers.google.com/search/docs/fundamentals/ai-optimization-guide) veröffentlicht. Im Abschnitt „Mythbusting“ steht wörtlich, dass man kein llms.txt, kein spezielles Markup und keinen extra Markdown-Output braucht. Google sagt sinngemäß: Bleibt bei HTML, wir verstehen das schon.

Eine kleine Pointe am Rande: Auf den Doku-Seiten von Google selbst, exakt auf dieser Seite mit der Empfehlung gegen Markdown, sitzt direkt neben der Überschrift ein „Seite als Markdown kopieren“-Button. Google liefert die eigene Dokumentation also gerne als Markdown aus. Für die Inhalte aller anderen sei das aber überflüssig. Bemerkenswert.

    
        
            
                
                    

![Markdown-Option bei Google](https://4eck-media.de/https://4eck-media.de/wp-content/uploads/2026/05/markdown-google.avif "Markdown-Option bei Google")
                
            
        
    

### Warum Cloudflare hier das Schwergewicht ist

Über das Cloudflare-Netzwerk laufen rund 22,7 Prozent aller Websites weltweit (Stand 16. Mai 2026,[Quelle W3Techs](https://4eck-media.de/https://w3techs.com/technologies/details/cn-cloudflare)). Bei Reverse-Proxy-Diensten hält das Unternehmen einen Anteil von 83 Prozent. Tendenz weiter steigend. Der nächstgrößere Anbieter, Amazon CloudFront, kommt auf 1 bis 2 Prozent. Wenn ein Infrastruktur-Anbieter dieser Größenordnung eine technische Position bezieht, betrifft das einen substanziellen Teil des öffentlichen Webs.

Mit dem Feature [Markdown for Agents](https://4eck-media.de/https://blog.cloudflare.com/markdown-for-agents/) liefert Cloudflare seit Februar 2026 jede HTML-Seite auf Wunsch direkt in Markdown aus. Auf der eigenen Doku hat das Unternehmen zusätzlich ein Hinweisbanner ganz oben eingebaut, das Bots in Großbuchstaben anschreit: *STOP! If you are an AI agent or LLM, read this before continuing. This is the HTML version of a Cloudflare documentation page. Always request the Markdown version instead. HTML wastes context.*

Im selben Banner verweist Cloudflare explizit auf die llms.txt-Dateien für die eigene Doku. Das ist genau das, was Google in seinem Mythbusting-Abschnitt als überflüssig deklariert.

### Zwei Schwergewichte, zwei gegensätzliche Aussagen. Wem soll man glauben?

Unsere Position ist eindeutig: Cloudflare hat den ehrlicheren Standpunkt. Google hat ein strategisches Eigeninteresse daran, dass Webseitenbetreiber nichts tun, was die Distribution von Inhalten an andere KI-Systeme erleichtert. Jede Markdown-Datei, die ChatGPT oder Claude effizient verarbeiten können, ist Content, der ohne Google-Click-Through bei einem Wettbewerber landet. Aus Googles Sicht ist es rational, das als „nicht nötig“ zu framen.

Unsere eigenen Daten widerlegen das Framing ziemlich klar. 97 Prozent Markdown-Quote in den letzten Tagen ist keine Statistik, die für die These „Markdown bringt nichts“ spricht.

Wir haben neben Markdown auch noch MCP-Server und llms.txt bei uns aktiviert und Content Signal Directiven in die robots.txt aufgenommen zu *ai-train, search* und *ai-input*, die [Cloudflare empfiehlt](https://4eck-media.de/https://contentsignals.org/). Einziger Nebeneffekt ist, dass uns PageSpeed Insights jetzt bei SEO nur 92 statt 100 gibt, weil er diese Direktiven noch nicht berücksichtigt.

    
        
            
                
                    

![AI Ready Plugin für WordPress - entwickelt von der Agentur 4eck Media](https://4eck-media.de/https://4eck-media.de/wp-content/uploads/2026/05/ai-ready-wordpress-plugin.avif "AI Ready Plugin für WordPress – entwickelt von der Agentur 4eck Media")
                
            
        
    

## Warum Markdown technisch so viel Sinn macht

Cloudflare hat in seinem Blogpost eine konkrete Zahl genannt: Der eigene Ankündigungsartikel braucht 16.180 Token in HTML und nur 3.150 Token in Markdown, eine Ersparnis von rund 80 Prozent. Praktisch ist das deshalb relevant, weil Sprachmodelle nur ein begrenztes Context-Window haben. Je weniger Token ein Dokument verbraucht, desto mehr passt insgesamt in den Kontext und desto sauberer wird die Antwort. Ein HTML-Dokument schleppt jede Menge Ballast mit, der für die Bedeutung des Inhalts irrelevant ist: Navigations-Markup, Cookie-Banner, Script-Tags, Tracking-Pixel, verschachtelte Wrapper-Divs, generische Klassen.

In Markdown fällt das alles weg. Was übrig bleibt, ist Inhalt plus Struktur. Genau das, was ein LLM zur Beantwortung einer Nutzerfrage braucht.

## Markdown ist die Muttersprache der Modelle

Eine oft übersehene Eigenschaft: Sprachmodelle wie GPT, Claude und Gemini produzieren intern selbst Markdown. Wenn ChatGPT in einer Antwort eine fette Hervorhebung, eine Aufzählung oder einen Code-Block zeigt, kommt aus dem Modell originär Markdown-Syntax, die der Chat-Client dann optisch rendert. Wer einem Modell Markdown-Input liefert, spricht es in seiner eigenen Arbeitssprache an. Das hat zwei Effekte: Das Modell spart sich die interne Übersetzung von HTML in eine Repräsentation, die es ohnehin wieder Richtung Markdown bewegt. Und Formatierungen gehen seltener verloren oder werden seltener falsch interpretiert.

## Markdown lässt sich sauber zitieren

KI-Antwortsysteme zitieren eure Inhalte fast immer in Ausschnitten. Ein Absatz hier, eine Bullet-List dort, vielleicht zwei Sätze aus einem längeren Text. In Markdown bleibt jeder Ausschnitt für sich verständlich. Ein Absatz ist ein Absatz, ein Link ist ein Link, eine Aufzählung bleibt eine Aufzählung. In HTML zerreißt jeder Schnitt durch verschachtelte Tags, schließende Elemente fehlen, und das Modell muss raten oder reparieren.  
Aus GEO-Sicht ist das vielleicht das stärkste Argument für Markdown. Saubere Zitierfähigkeit erhöht die Wahrscheinlichkeit, dass eure Inhalte überhaupt vollständig wiedergegeben werden, mit korrekt erhaltenen Links zurück zu eurer Seite. Verstümmelte Schnipsel landen häufiger im Filter der Modelle und tauchen in der finalen Antwort gar nicht mehr auf. Sichtbarkeit in Antwortmaschinen entscheidet sich genau an diesem Punkt.

## Crawl-Budget und Bandbreite

Die Token-Ersparnis übersetzt sich nahezu direkt in Bandbreite. Eine durchschnittliche HTML-Seite im Web wiegt laut [HTTP Archive Web Almanac](https://4eck-media.de/https://almanac.httparchive.org/en/2025/page-weight#page-weight-over-time) inzwischen mehrere hundert Kilobyte, Tendenz steigend. Die Markdown-Variante derselben Seite landet typischerweise bei 5 bis 20 Kilobyte. Das entlastet euren Server, spart Traffic-Kosten und reduziert die Last, die KI-Crawler auf eurer Infrastruktur verursachen.

Im klassischen SEO sprechen wir bei Google vom Crawl-Budget, also davon, wie viele Seiten der Googlebot pro Zeitraum auf eurer Site holt. Bei KI-Crawlern verhält es sich vergleichbar, nur deutlich aggressiver. Allein in unseren Logs hat meta-externalagent in elf Tagen 3.481 Anfragen gestellt, gptbot weitere 728, chatgpt-user 1.404. Wenn diese Bots Markdown nehmen können, ziehen sie pro Anfrage rund 80 Prozent weniger Daten. Je mehr KI-Bots an eurer Tür klopfen, desto mehr summiert sich dieser Effekt.

Daraus folgen drei messbare Vorteile für eure Sichtbarkeit:

- KI-Systeme können mehr eurer Inhalte in einem Rutsch verarbeiten, weil ein Markdown-Dokument schlanker ist.
- Die Antwortqualität auf Basis eurer Inhalte steigt, weil das Modell weniger Müll filtern muss.
- Euer Hosting bleibt schlanker, weil die Crawler weniger Last erzeugen. Wer öfter und sauberer zitiert wird, gewinnt an Reichweite in Antwortmaschinen, ohne dafür mehr Servertraffic bezahlen zu müssen.

## So setzt ihr Markdown auf eurer WordPress-Site um

Wir haben die Markdown-Ausgabe auf 4eck-media.de selbst implementiert und nicht über Cloudflare gelöst. Der Grund ist einfach: Wir wollten die volle Kontrolle über das Ergebnis und keinen Service zwischen unseren Inhalten und den Bots. Wer Cloudflare ohnehin nutzt, kann sich das Feature mit einem Toggle dazuschalten. Wer die Sache selbst in die Hand nehmen will, hier der Bauplan.

### Der Mechanismus: HTTP Content Negotiation

Jeder Bot, der eine Seite anfragt, schickt einen Accept-Header. Darin steht, welche Formate er verarbeiten kann. Ein klassischer Browser sagt zum Beispiel Accept: text/html. Ein moderner LLM-Bot wie ChatGPT sagt Accept: text/markdown, text/html. Eure Aufgabe ist es, diesen Header zu lesen und je nach Wunsch entweder HTML oder Markdown auszuliefern.

### Schritt 1: Hook in WordPress setzen

Folgendes Snippet gehört in das Functions-File eures Themes oder noch besser in ein eigenes Mini-Plugin:

```
add_action('template_redirect', function () {
    if (!is_singular()) {
        return;
    }

    $accept = $_SERVER['HTTP_ACCEPT'] ?? '';
    if (!str_contains($accept, 'text/markdown')) {
        return;
    }

    $post = get_queried_object();
    if (!$post instanceof WP_Post) {
        return;
    }

    header('Content-Type: text/markdown; charset=utf-8');
    header('Vary: Accept');
    header('X-Content-Format: markdown');

    echo render_post_as_markdown($post);
    exit;
});
```

Das ist die Eingangstür. Sobald ein Bot mit text/markdown im Accept-Header eine Single-Page anfragt (Blogartikel, Landingpage, Custom Post Type), springt euer Code an und liefert Markdown statt HTML. get_queried_object() ist im template_redirect-Hook der robustere Weg an den aktuellen Post zu kommen, weil die globale $post-Variable an dieser Stelle noch nicht zuverlässig gesetzt ist.

### Schritt 2: HTML zu Markdown konvertieren

Für die eigentliche Umwandlung empfehlen wir die Library league/html-to-markdown. Per Composer installiert:

```
composer require league/html-to-markdown
```

Die Konvertierungsfunktion sieht dann so aus:

```
use League\HTMLToMarkdown\HtmlConverter;

function render_post_as_markdown(WP_Post $post): string {
    $converter = new HtmlConverter([
        'strip_tags'    => true,
        'remove_nodes'  => 'script style nav footer aside',
        'header_style'  => 'atx',
    ]);

    $title    = wp_strip_all_tags($post->post_title);
    $url      = get_permalink($post);
    $updated  = get_the_modified_date('c', $post);
    $content  = apply_filters('the_content', $post->post_content);
    $markdown = $converter->convert($content);

    // Title als JSON-String escapen, das ist auch gueltiges YAML
    $frontmatter  = "---\n";
    $frontmatter .= 'title: ' . json_encode($title, JSON_UNESCAPED_UNICODE) . "\n";
    $frontmatter .= "url: {$url}\n";
    $frontmatter .= "updated: {$updated}\n";
    $frontmatter .= "---\n\n";

    return $frontmatter . "# {$title}\n\n" . $markdown;
}
```

Das Front-Matter oben (der Block zwischen den Strichen) ist optional, aber sehr empfehlenswert. Bots können daraus Metadaten ablesen, ohne den Body parsen zu müssen. Den Title schicken wir per json_encode durch, damit Anführungszeichen, Doppelpunkte oder Sonderzeichen den YAML-Parser nicht aus dem Tritt bringen.

### Schritt 3: Caching nicht vergessen

WordPress-Seiten mit Page-Cache (WP Rocket, LiteSpeed, Varnish) müssen den Vary: Accept-Header respektieren. Sonst liefert euer Cache an alle Bots dieselbe Version aus, egal welcher Accept-Header reinkommt. Bei den meisten Caching-Plugins lässt sich das in den Einstellungen aktivieren. Im Zweifel direkt mit dem Hoster sprechen.

### Schritt 4 (optional): Eine .md-URL parallel anbieten

Manche Trainings-Crawler ignorieren den Accept-Header oder verschicken ihn unsauber. Wer auch die mitnehmen will, kann eine zweite URL anbieten, also */blog/mein-beitrag/* zusätzlich erreichbar als */blog/mein-beitrag/index.md*. Sauber geht das in WordPress über *add_rewrite_rule*mit einem eigenen Query-Var:

```
add_filter('query_vars', function ($vars) {
    $vars[] = 'as_markdown';
    return $vars;
});

add_action('init', function () {
    add_rewrite_rule(
        '^(.+?)/index\.md/?$',
        'index.php?name=$matches[1]&as_markdown=1',
        'top'
    );
});
```

Im Hook aus Schritt 1 muss dann nur noch zusätzlich auf den Query-Parameter geprüft werden:

```
$wants_markdown =
       str_contains($_SERVER['HTTP_ACCEPT'] ?? '', 'text/markdown')
    || (int) get_query_var('as_markdown') === 1;
```

Nach dem Hinzufügen der Rewrite-Regel müsst ihr einmal in den WordPress-Einstellungen die Permalinks speichern, damit WordPress die Regel übernimmt.  
In unseren Logs holen sich die relevanten KI-Bots ihren Inhalt fast vollständig über den Accept-Header. Schritt 4 ist deshalb ein Plus, kein Muss.

### Schritt 5: Optional eine llms.txt veröffentlichen

Eine llms.txt im Root eurer Domain (vergleichbar mit einer robots.txt) listet die wichtigsten Inhalte eurer Seite in einer Form auf, die LLMs gut konsumieren können. Cloudflare empfiehlt es offen, Google sagt es sei überflüssig. Unsere Empfehlung: machen, der Aufwand ist gering, der Schaden ist null, der mögliche Nutzen dafür real.

### Was ist mit Risiken?

Eine berechtigte Frage taucht oft auf: Wenn ich Markdown ausliefere, mache ich es Bots dann nicht zu einfach, meinen Content zu klauen?

Wer eure Seite scrapen will, scrapt sie eh. Das geht mit HTML genauso gut, nur etwas teurer. Markdown verhindert keinen Diebstahl, es macht ihn nur effizienter. Was ihr stattdessen tun könnt:

- Erstens: Über den Content-Signal-Header im Response klar machen, was ihr erlaubt und was nicht. Cloudflare nutzt dafür das Content Signals Framework. Bots, die sich daran halten, respektieren eure Vorgaben.
- Zweitens: Mit robots.txt bestimmte Bots ausschließen. Das gilt für HTML genauso wie für Markdown.
- Drittens: Daran erinnern, dass Sichtbarkeit das eigentliche Ziel ist. Wer in Antwortmaschinen nicht stattfindet, hat ein größeres Problem als jemand, dessen Inhalte dort sauber zitiert werden.

## Sollte ich Markdown für meine Website einsetzen?

Unsere Daten zeigen es eindeutig: KI-Bots wollen Markdown, sie fragen aktiv danach, und ihr Anteil steigt Woche für Woche. Wer seine Inhalte parallel als Markdown ausliefert, gibt Bots genau das Format, das sie effizient verarbeiten können. Das Ergebnis sind sauberere Zitate, weniger Last auf der eigenen Infrastruktur und eine bessere Verhandlungsposition für die nächste Welle agentischer Tools. Ob daraus auch mehr Sichtbarkeit in ChatGPT, Perplexity, Claude und Meta AI resultiert, bleibt abzuwarten. Ich nehme es an, aber kann dafür noch keine eindeutigen Belege liefern. Ich weiß nur, dass wir wöchentlich neue Kundenanfragen erhalten aus Regionen im gesamten DACH-Raum, die uns noch im letzten Jahr niemals erreicht hätten.

Googles offizielle Empfehlung, das alles zu ignorieren, ist aus unserer Sicht strategisch motiviert. Sie sagt mehr über Googles eigene Wettbewerbssituation aus als über die Realität auf der Bot-Seite. Wer die Stellschraube nutzen will, sollte sich davon nicht abhalten lassen.

Die Umsetzung ist überschaubar. Ein Plugin, eine Library, ein paar Stunden Entwicklungszeit. Bei Cloudflare-Kunden reicht ein Toggle. Wer es selbst implementiert, hat die Kontrolle und kann die Markdown-Ausgabe genau so formen, wie sie für die eigenen Inhalte am sinnvollsten ist.

Markdown ist aus unserer Sicht die kommende Standardsprache zwischen Websites und KI-Systemen. Wer früh dabei ist, profitiert länger. Wer wartet, bis Google es offiziell bestätigt, zahlt mit den Kosten der verpassten Chancen.

    
        
                        
                                    

## Häufige Fragen zu Markdown auf Websites

                                
                                                                        
                                
                                    Brauche ich Markdown wirklich, wenn Google selbst sagt, es sei nicht nötig?
                                    
                                                                            
                                
                                
                                    

Googles Empfehlung gilt für Googles eigene KI-Features wie AI Overviews und AI Mode. Für alle anderen Antwortmaschinen (ChatGPT, Claude, Perplexity, Meta AI) zeigen unsere Daten ein klares anderes Bild. Diese Systeme fordern aktiv Markdown an, sobald die Site es bereitstellt. Wer dort sichtbar sein will, sollte den Hebel nicht ungenutzt lassen.

                                    
                                                                            
                                
                            
                                                    
                                
                                    Wie aufwändig ist die Umsetzung in WordPress?
                                    
                                                                            
                                
                                
                                    

Realistisch ein halber bis ein ganzer Entwicklertag, abhängig vom Setup. Das Plugin selbst ist überschaubar (siehe Code-Beispiele weiter oben), der Aufwand steckt in der Caching-Konfiguration und im Testen mit unterschiedlichen Bot-User-Agents. Wer komplett aus eigener Kraft starten will, kommt mit den hier gezeigten Snippets sehr weit.

                                    
                                                                            
                                
                            
                                                    
                                
                                    Was kostet Markdown for Agents bei Cloudflare?
                                    
                                                                            
                                
                                
                                    

Aktuell nichts. Cloudflare bietet das Feature in der Beta-Phase kostenlos für Pro-, Business- und Enterprise-Tarife sowie für SSL-for-SaaS-Kunden an. Auf dem kostenlosen Free-Tarif ist es nicht verfügbar.

                                    
                                                                            
                                
                            
                                                    
                                
                                    Sollte ich llms.txt zusätzlich anlegen?
                                    
                                                                            
                                
                                
                                    

Wenn es ohne großen Aufwand machbar ist: ja. Eine llms.txt im Root listet eure wichtigsten Inhalte strukturiert für LLMs auf. Cloudflare empfiehlt es offen, Google rät davon ab. Da der Aufwand minimal ist und kein Schaden entsteht, sehen wir keinen Grund, darauf zu verzichten.

                                    
                                                                            
                                
                            
                                                    
                                
                                    Schadet Markdown meinem klassischen SEO bei Google?
                                    
                                                                            
                                
                                
                                    

Nein. Der Markdown-Output wird ausschließlich dann ausgespielt, wenn ein Bot explizit per Accept-Header danach fragt. Googlebot bekommt weiter HTML, eure Nutzer bekommen weiter HTML. Es entstehen also keine Duplicate-Content-Probleme und kein Konflikt mit bestehenden SEO-Signalen.

                                    
                                                                            
                                
                            
                                                    
                                
                                    Wie messe ich, ob die Umstellung etwas bringt?
                                    
                                                                            
                                
                                
                                    

Drei Messgrößen sind sinnvoll. Erstens: Bot-Logs auswerten (wie in diesem Artikel gezeigt), um den Markdown-Anteil pro Bot über die Zeit zu beobachten. Zweitens: Erwähnungen eurer Marke und URLs in den großen KI-Suchsystemen tracken, manuell oder mit Tools wie Otterly, Peec AI oder Profound. Drittens: Referral-Traffic von KI-Quellen in der Webanalyse betrachten, denn ChatGPT, Perplexity und Co. setzen klickbare Quellen-Links.

                                    
                                                                            
                                
                            
                                                    
                                
                                    Funktioniert das auch mit anderen CMS oder Static-Site-Generatoren?
                                    
                                                                            
                                
                                
                                    

Ja. Das Prinzip Content Negotiation per Accept-Header ist CMS-unabhängig. In Next.js oder Astro lässt es sich über Middleware lösen, in Laravel über einen Middleware-Handler, bei statischen Seiten über Edge-Functions oder eben Cloudflares Markdown for Agents. Wer mehr Details zu einem bestimmten Stack braucht, schreibt uns gern.

                                    
                                                                            
                                
                            
                                                            
            
        
    

**Quellen**:

- [Google Search Central, AI Optimization Guide](https://4eck-media.de/https://developers.google.com/search/docs/fundamentals/ai-optimization-guide)
- [Cloudflare Blog, Introducing Markdown for Agents](https://4eck-media.de/https://blog.cloudflare.com/markdown-for-agents/)
- [Cloudflare Docs, Markdown for Agents Reference](https://4eck-media.de/https://developers.cloudflare.com/fundamentals/reference/markdown-for-agents/)
- [Content Signals Framework](https://4eck-media.de/https://contentsignals.org/)
- [league/html-to-markdown auf GitHub](https://4eck-media.de/https://github.com/thephpleague/html-to-markdown)
- [W3Techs, Cloudflare Marktanteil](https://4eck-media.de/https://w3techs.com/technologies/details/cn-cloudflare)
- [HTTP Archive Web Almanac, Page Weight](https://4eck-media.de/https://almanac.httparchive.org/en/2025/page-weight)

**Über die Daten:** 9.822 Bot-Hits aus unserem eigenen Logging-System auf 4eck-media.de, Zeitraum 5. bis 16. Mai 2026, 37 aktive Bots aus 160 getrackten User Agents.

    
        
            
                                                    Willst du deine Website AI-ready machen?
                            
                            
                    
                        

Wir haben das gesamte Setup auf 4eck-media.de selbst gebaut: Markdown-Auslieferung über Content Negotiation, ein Bot-Logging für 160 KI-User-Agents, Performance-Tuning auf Bot-Verhalten und die passende 301-Strategie für vergessene URLs aus Trainingsdaten. Wenn ihr ähnliches für eure Site umsetzen wollt und im eigenen Team gerade weder die Zeit noch die Tiefe dafür habt, kommen wir gern ins Spiel.

Womit wir konkret helfen:

- Implementierung der Markdown-Auslieferung in WordPress oder anderen CMS, inklusive Caching, Vary-Header und Performance-Check
- Aufsetzen eines KI-Bot-Loggings mit verständlichem Reporting der wichtigsten 100+ Bots
- Auswertung eurer Logs auf 404er, 500er und 499/504-Auffälligkeiten plus passende Weiterleitungs-Strategie
- Performance-Tuning aus Bot-Perspektive (Time to First Byte, Caching-Layer, Datenbankoptimierung)
- GEO-Audit eurer aktuellen Sichtbarkeit in ChatGPT, Claude, Perplexity und Meta AI
- Beratung zu llms.txt, MCP-Server, Content Signals und sinnvoller Bot-Steuerung

Nimm noch heute Kontakt mit uns auf!

                                                    
                                                                    [Jetzt Kontakt aufnehmen](https://4eck-media.de/https://4eck-media.de/kontakt/)