Technical SEO

Sitemap.xml im Technical SEO: Aufbau und Best Practices

Eine Sitemap.xml ist eine strukturierte XML-Datei, die Suchmaschinen-Crawlern (wie dem Googlebot) eine vollständige Liste aller indexierbaren URLs einer Website bereitstellt. Sie dient als digitaler Wegweiser für Suchmaschinen. Besonders bei grossen Websites, neuen Seiten oder komplexen Navigationsstrukturen stellt eine XML-Sitemap sicher, dass keine wichtigen Inhalte beim Crawling übersehen werden.

Die Sitemap ist neben der robots.txt eines der beiden zentralen Steuerungsinstrumente des Technical SEOs für die Crawler-Kommunikation. Während die robots.txt Bereiche sperrt, empfiehlt die Sitemap aktiv die wichtigsten URLs zum Crawlen.

Aufbau und Syntax eines XML-Sitemaps-Eintrags

Eine standardkonforme XML-Sitemap folgt einem strengen XML-Schema. Ein einzelner URL-Eintrag sieht wie folgt aus:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://allerate.com/unternehmen/</loc>
    <lastmod>2026-06-20T09:12:15Z</lastmod>
  </url>
</urlset>

Die XML-Tags im Detail:

  • <loc> (Location - Zwingend): Die absolute, kanonische (canonical) URL der Seite. Sie muss exakt mit der tatsächlichen URL übereinstimmen (inklusive Protokoll https und Trailing Slash).
  • <lastmod> (Last Modified - Optional, aber empfohlen): Das Datum der letzten Änderung im ISO-8601-Format. Dies teilt dem Bot mit, ob sich der Inhalt seit dem letzten Crawl geändert hat, was wertvolle Crawling-Ressourcen (Crawl Budget) spart.

Crawlen, Indexieren und die Rolle der Sitemap

Ein häufiges Missverständnis: Eine Sitemap erzwingt keine Indexierung. Die folgende Tabelle ordnet die Begriffe ein:

BegriffBedeutungSteuerung durch Sitemap?
CrawlenBot ruft die URL abempfiehlt URLs aktiv
IndexierenSeite landet im Suchindexnein, nur Qualität/noindex
RankingPosition im Ergebnisnein

Die Sitemap wirkt also ausschliesslich in der ersten Phase – dem Auffinden und Crawlen. Ob eine gecrawlte Seite anschliessend indexiert und wie sie gerankt wird, entscheiden Inhaltsqualität, Canonical-Tags und das Fehlen von noindex-Anweisungen.


Best Practices für XML-Sitemaps

1. Nur indexierbare URLs aufnehmen

Hinterlegen Sie in der Sitemap ausschliesslich Seiten, die Sie auch wirklich in den Suchergebnissen sehen möchten. Es dürfen sich dort keine URLs befinden mit:

  • HTTP-Fehlercodes (404, 500).
  • Weiterleitungen (301, 302).
  • Kanonischen Verweisen auf andere Seiten (non-canonicals).
  • Sperren durch das Meta-Tag noindex.

2. Sitemap-Indexdateien nutzen bei grossen Projekten

Stösst eine Website an das Limit von 50’000 URLs, wird eine Hauptdatei (sitemap-index.xml) angelegt, die auf mehrere Child-Sitemaps verweist:

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://allerate.com/sitemap-pages.xml</loc>
  </sitemap>
  <sitemap>
    <loc>https://allerate.com/sitemap-glossar.xml</loc>
  </sitemap>
</sitemapindex>

3. Automatisierung im Build-Prozess

Niemand sollte Sitemaps manuell pflegen. Moderne Static-Site-Generatoren wie Astro 6 bieten Integrationsmodule (wie @astrojs/sitemap), die bei jedem Build-Vorgang (npm run build) vollautomatisch alle gültigen Routen scannen und die Sitemap-Dateien aktuell generieren.

4. Einreichung und Bekanntmachung

Damit Google die Sitemap findet, sollten Sie:

  • Den Pfad der Sitemap in der robots.txt hinterlegen.
  • Die Sitemap einmalig in der Google Search Console einreichen.

Praxisbeispiel: Eine fehlerhafte Sitemap bereinigen

Ein Online-Shop reicht eine Sitemap mit 12’000 URLs ein, sieht in der Search Console aber nur 6’000 indexierte Seiten und viele Warnungen.

  • Vorher: Die Sitemap enthält 404-Seiten ausgelaufener Produkte, per noindex markierte Filter-URLs und Weiterleitungen auf die kanonische Variante. Google verschwendet Crawl-Budget auf wertlose URLs.
  • Nachher: Ein automatisierter Build-Schritt nimmt nur Seiten mit Statuscode 200 und ohne noindex auf. Die Sitemap schrumpft auf 5’800 saubere URLs; die Search-Console-Warnungen verschwinden, und das Crawl-Budget fliesst in relevante Seiten.

Die Lehre: Eine Sitemap ist nur so gut wie ihre Pflege. Eine automatisch generierte Sitemap (siehe Punkt 3) verhindert solche Fehler von vornherein, weil sie bei jedem Build den tatsächlichen Seitenbestand abbildet.

[!TIP] Eine fehlerhafte XML-Sitemap (z. B. mit defekten Links) verschwendet das Crawl-Budget Ihrer Website. Validieren Sie die Sitemap Ihrer Domain mit dem Tool robots.txt & Sitemap Checker auf balou.tools.

Häufig gestellte Fragen (FAQ)

Wie gross darf eine Sitemap.xml maximal sein?

Eine einzelne Sitemap-Datei darf maximal 50 MB gross sein (unkomprimiert) und höchstens 50'000 URLs enthalten. Werden diese Grenzen überschritten, müssen die URLs auf mehrere Sitemaps aufgeteilt und über eine Sitemap-Indexdatei zusammengefasst werden.

Berücksichtigt Google die Angaben zu Priorität (priority) und Änderungsfrequenz (changefreq)?

Nein, Google ignoriert diese beiden Felder in der XML-Sitemap heute weitgehend, da sie in der Vergangenheit oft missbräuchlich konfiguriert wurden. Google verlässt sich primär auf die tatsächliche Inhaltsänderung und das ``-Datum.

Garantiert ein Eintrag in der Sitemap die Indexierung einer Seite?

Nein. Die Sitemap ist eine Empfehlung an Google, welche URLs gecrawlt werden sollten – keine Garantie für die Aufnahme in den Index. Ob eine Seite indexiert wird, hängt von ihrer Qualität, der Eindeutigkeit des Inhalts und fehlenden noindex-Anweisungen ab. Die Sitemap beschleunigt lediglich das Auffinden.

Brauchen kleine Websites überhaupt eine Sitemap.xml?

Bei sehr kleinen, gut intern verlinkten Websites findet Google in der Regel alle Seiten auch ohne Sitemap. Dennoch ist eine Sitemap empfehlenswert: Sie liefert über das ``-Datum Aktualitätssignale, erleichtert das Monitoring in der Search Console und kostet bei automatischer Generierung keinerlei Pflegeaufwand.