Wer sich in­ten­si­ver um die Plat­zie­rung seines Web­pro­jekts in den Er­geb­nis­sei­ten der Such­ma­schi­nen kümmert, weiß genau, wie viele un­ter­schied­li­che Faktoren den Kampf um die vorderen Plätze be­ein­flus­sen. So umfasst die Liste von Faktoren mit Einfluss auf das Ranking bei Google bei­spiels­wei­se über 200 Kriterien, deren Relevanz teilweise offiziell durch das Un­ter­neh­men bestätigt wurde, teilweise aber auch lediglich von Experten vermutet wird. Nicht von ungefähr zählt die Disziplin der Such­ma­schi­nen­op­ti­mie­rung seit Jahren zum Stan­dard­re­per­toire eines jeden Web­mas­ters, der will, dass seine Website sichtbar und er­reich­bar ist. Während dabei Faktoren wie relevante Keywords, hoch­wer­ti­ge Inhalte oder eine hohe Mo­bil­freund­lich­keit in aller Munde sind, wird der Wert einer guten XML-Sitemap häufig un­ter­schätzt.

Was ist eine XML-Sitemap?

Eine XML-Sitemap (sitemap.xml) ist eine Textdatei im XML-Format (Extensible Markup Language), die eine Auf­lis­tung aller Un­ter­sei­ten einer Website in Link-Form enthält. Als solche kann sie in der Google Search Console oder den Bing Webmaster Tools hoch­ge­la­den werden, um den Such­ma­schi­nen-Crawlern alle ver­füg­ba­ren bzw. re­le­van­ten Seiten mit­zu­tei­len und so den In­de­xie­rungs­pro­zess zu be­schleu­ni­gen und zu op­ti­mie­ren. XML-Sitemaps müssen die Vorgaben des Sitemaps-Pro­to­kolls erfüllen, das 2006 von Google, Yahoo und Microsoft als Standard be­schlos­sen wurde – mit dem Ziel, die Qualität aus­ge­lie­fer­ter Such­re­sul­ta­te lang­fris­tig zu ver­bes­sern. Daher sind u. a. die Codierung in UTF-8 und die bereits auf­ge­grif­fe­ne Aus­zeich­nungs­spra­che XML ebenso vor­ge­schrie­ben wie die Ver­wen­dung von Entität-Codes für bestimmte Zeichen (wie z. B. „&gt“ anstelle von „>“).

Hinweis

XML-Sitemaps sind von den Sitemaps zu un­ter­schei­den, die viele CMS au­to­ma­tisch im Frontend aus­spie­len. Hierbei handelt es sich um das In­halts­ver­zeich­nis der Website, das den Besuchern die Na­vi­ga­ti­on er­leich­tern soll. XML-Sitemaps sind hingegen stan­dard­mä­ßig für die Nutzer nicht sichtbar, auch wenn es generell möglich ist, diese über ihre URL aufrufbar zu machen.

Die Vorteile einer XML-Sitemap

Auch wenn es keine Garantie dafür gibt, dass die In­de­xie­rung bei Google und Co. durch XML-Sitemaps in jedem Fall optimiert wird – die struk­tu­rier­ten Link-Ver­zeich­nis­se erhöhen in jedem Fall die Chancen. Ins­be­son­de­re bei Seiten mit dy­na­mi­schen Inhalten, die stetigen Ver­än­de­run­gen aus­ge­setzt sind, kann sich das craw­ler­freund­li­che In­halts­ver­zeich­nis auszahlen. Gleiches gilt für größere Web­pro­jek­te, die zwar eine hohe Anzahl an Un­ter­sei­ten, jedoch (noch) keine große Backlink-Struktur aufweisen. Solche Seiten werden ten­den­zi­ell zu selten auf Än­de­run­gen überprüft oder laufen gar unter dem Radar der Such­ma­schi­nen. Dank sitemap.xml rücken Sie sie schneller in den Fokus der In­de­xie­rungs-Bots.

Ein weiterer Vorteil: In XML-Sitemaps können nicht nur URLs von Un­ter­sei­ten, sondern auch von Me­di­en­da­tei­en wie Videos oder Bildern auf­ge­führt werden. Für diese gibt es sogar Extra-Tags, die dem Crawler verraten, um welchen In­halts­typ es sich handelt (<image>, <video>). Darüber hinaus lassen sich Attribute verwenden, die den Content näher be­schrei­ben oder die Dauer angeben, damit die Such­ma­schi­nen diesen optimal erfassen können. Auch für News­por­ta­le gibt es eine spezielle Ab­wand­lung der XML-Sitemap, die eine op­ti­mier­te In­de­xie­rung von Artikeln dank spe­zi­fi­scher Attribute wie Genre, Pu­bli­ka­ti­ons­da­tum oder Title ver­spricht.

Tipp

Der Aufwand, der mit der manuellen Er­stel­lung einer XML-Sitemap verbunden ist, müsste ei­gent­lich als Nachteil eines solchen Struk­tur­ver­zeich­nis­ses für die eigene Website gewertet werden. Dank XML-Sitemap-Ge­ne­ra­to­ren wie dem Online-Generator von XML-Sitemaps.com besteht al­ler­dings keinerlei Not­wen­dig­keit, die prak­ti­schen XML-Seiten auf eigene Faust zu ge­ne­rie­ren. Darüber hinaus gibt es für die meisten Content-Ma­nage­ment-Systeme Plug-ins, die das Erstellen von XML-Sitemaps au­to­ma­ti­sie­ren.

Aufbau einer XML-Sitemap: Das sind die wich­tigs­ten Kom­po­nen­ten

Die For­ma­tie­rung einer XML-Sitemap funk­tio­niert – wie bei jedem Dokument in der Aus­zeich­nungs­spra­che Ex­ten­si­ble Markup Language – über XML-Tags. Dabei zählen nach dem aktuellen Standard „Sitemaps 0.9“ drei Tags als Pflicht­an­ga­ben, um von einer XML-Sitemap sprechen zu können:

sitemap.xml: Pflicht-Tags
<urlset>, </urlset> Jede Sitemap-XML-Datei muss mit einem öffnenden <urlset>-Tag beginnen und mit einem schlie­ßen­den </urlset>-Tag enden. Das Tag hat ei­ner­seits die Funktion, die Datei zu­sam­men­zu­fas­sen und verweist an­de­rer­seits auf den aktuellen Pro­to­koll­stan­dard.
<url>, </url> Das öffnende und das schlie­ßen­de <url>-Tag sind den einzelnen URL-Einträgen über­ge­ord­net und kenn­zeich­nen damit Anfang und Ende einer auf­ge­führ­ten Un­ter­sei­te.
<loc>, </loc> Mit dem <loc>-Tag werden die einzelnen Seiten des Web­pro­jekts bzw. deren URLs ge­kenn­zeich­net. Die URL muss dabei immer mit dem Protokoll beginnen (z. B. „http“) und mit einem ab­schlie­ßen­den Schräg­strich enden (insofern vom Webserver benötigt). Zudem ist eine maximale Länge von 2.048 Zeichen definiert.

Abseits dieser ob­li­ga­to­ri­schen XML-Attribute stehen mit den Sitemap-Tags <priority>, <lastmod> und <ch­an­ge­freq> noch drei weitere Tags zur Verfügung, mit deren Hilfe sich die einzelnen URL-Einträge spe­zi­fi­zie­ren lassen. Inwieweit diese op­tio­na­len Tags al­ler­dings auch un­ter­stützt werden, hängt von der je­wei­li­gen Such­ma­schi­ne ab. Der Google-Crawler greift bei der In­de­xie­rung bei­spiels­wei­se in erster Linie auf <lastmod>-Aus­zeich­nun­gen zurück, während er die beiden anderen Attribute wei­test­ge­hend ignoriert bzw. nur minimal in den Crawling-Prozess ein­flie­ßen lässt.

sitemap.xml: Optionale Tags
<lastmod>, </lastmod> Via <lastmod>-Tag kann das Datum (W3C-Format) der letzten Änderung einer Seite angegeben werden. Das Tag ist dabei un­ab­hän­gig vom „if modified since“-Header, den der Webserver im Rahmen einer HTTP-304-Antwort zu­rück­ge­ben kann.
<ch­an­ge­freq>, </ch­an­ge­freq> Das <ch­an­ge­freq>-Tag liefert dem Crawler eine all­ge­mei­ne In­for­ma­ti­on darüber, wie oft eine Seite vor­aus­sicht­lich ak­tua­li­siert wird (stündlich, täglich, monatlich etc.). Dokumente, die sich bei jedem Zugriff verändern, werden durch den Wert „always“ ge­kenn­zeich­net, ar­chi­vier­te URLs durch „never“.
<priority>, </priority> Mit diesem Tag lässt sich die Priorität einer URL innerhalb des gesamten Web­pro­jekts auf einer Skala von 0,0 bis 1,0 aus­drü­cken (Stan­dard­prio­ri­tät: 0,5). So lassen sich Crawler auf Seiten auf­merk­sam machen, deren In­de­xie­rung besonders wichtig ist.

Da eine XML-Sitemap-Datei maximal 50.000 URLs enthalten und nicht größer als 50 MB sein darf, kann die URL-Sammlung größerer Web­pro­jek­te auch auf mehrere Dokumente verteilt werden. In diesem Fall sollte jedes Sitemap-Dokument aber in einer zu­sätz­li­chen In­dex­da­tei auf­ge­führt werden, deren Aufbau sich prin­zi­pi­ell nicht von dem der Sitemap-Dateien un­ter­schei­det: Es gilt lediglich, die Tags <site­map­in­dex> und <sitemap> anstelle der Tags <urlset> und <url> zu verwenden.

Hinweis

Es ist möglich, Sitemap-Dateien zu kom­pri­mie­ren (bei­spiels­wei­se mit gzip) – al­ler­dings nur, um den Band­brei­ten­be­darf zu ver­rin­gern. Die maximale Größe einer XML-Sitemap lässt sich auf diese Weise nicht erhöhen, da die Be­gren­zung immer für die entpackte Version der Datei gilt.

XML-Sitemap-Beispiel

Der Aufbau einer XML-Sitemap lässt sich am ein­fachs­ten durch ein konkretes Beispiel nach­voll­zie­hen:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://one-test.website/</loc>
        <lastmod>2018-01-01</lastmod>
        <changefreq>monthly</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>http://one-test.website/page1/</loc>
        <lastmod>2018-03-05</lastmod>
        <changefreq>weekly</changefreq>
        <priority>0.5</priority>
    </url>
    <url>
        <loc>http://one-test.website/page2/</loc>
        <lastmod>2018-03-08</lastmod>
        <changefreq>weekly</changefreq>
        <priority>0.3</priority>
    </url>
</urlset>

Die Beispiel-XML-Sitemap führt in diesem Fall zum einen die Haupt-URL one-test.website, zum anderen die URLs zweier Un­ter­sei­ten (page1 und page2) auf. Such­ma­schi­nen-Crawler können dem Dokument entnehmen, dass die Haupt­sei­te vom Webmaster mit der höchsten Priorität versehen wurde und etwa monatlich Ver­än­de­run­gen erfährt. Die letzte Anpassung wurde am 1.1.2018 vor­ge­nom­men. Die Seite page1 hat den Standard-Prio­ri­täts­wert (0,5), wird im Gegensatz zur Haupt­sei­te aber schät­zungs­wei­se wö­chent­lich angepasst, wobei die letzte Mo­di­fi­zie­rung am 5.3.2018 statt­ge­fun­den hat. Sofern der Crawler mit dem Sitemap-Priority-Attribut arbeitet, weiß er, dass er page2 bei der In­de­xie­rung am wenigsten Auf­merk­sam­keit widmen muss (<priority>-Wert: 0,3). Die Un­ter­sei­te wird aber ebenfalls wö­chent­lich mo­di­fi­ziert (zuletzt am 8.3.2018).

XML-Sitemap erstellen und ein­rei­chen – so funk­tio­niert’s

An­ge­sichts des riesigen Aufwands, der mit einer manuellen Er­stel­lung von XML-Sitemaps verbunden wäre, ist der Griff zu Plug-ins oder On­line­tools in jedem Fall die richtige Ent­schei­dung – sofern man diese korrekt verwendet. Zwar können auch ohne spe­zi­fi­sche Kon­fi­gu­ra­tio­nen passable XML-Sitemaps erzeugt werden, doch erst durch die passenden, in­di­vi­du­el­len Ein­stel­lun­gen erhalten die ge­ne­rier­ten Struk­tur­ver­zeich­nis­se auch die ge­wünsch­te Form. Ex­em­pla­risch stellen wir die Mög­lich­kei­ten vor, die der Online-Generator von XML-Sitemaps.com sowie das WordPress-Plug-in Google XML Sitemaps bei der Er­stel­lung und Ein­bin­dung von XML-Sitemaps bieten.

So ge­ne­rie­ren Sie XML-Sitemaps mit dem Online-Generator von XML-Sitemaps.com

Der Online-Generator von XML-Sitemaps.com bietet Nutzern seit 2005 eine bequeme Lösung zur Kreation eigener XML-Sitemaps. Für Web­pro­jek­te mit bis zu 500 Un­ter­sei­ten ist der Web­ser­vice kostenlos – Sitemaps für größere Projekte können nach Abschluss eines kos­ten­pflich­ti­gen Pro-Abon­ne­ments ebenfalls erstellt werden. Die Vor­ge­hens­wei­se ist dabei denkbar einfach: Nachdem Sie die Web­an­wen­dung auf­ge­ru­fen haben, fügen Sie die URL Ihrer Website in die dafür vor­ge­se­he­ne Adress­zei­le ein:

Über die Schalt­flä­che „More options“ legen Sie im Anschluss fest, ob bzw. inwieweit die Einträge der Sitemap via <lastmod>-, <priority>- oder <ch­an­ge­freq>-Attribut spe­zi­fi­ziert werden sollen. Erstere können Sie entweder an- oder aus­schal­ten, für letzteres stellen Sie die ge­wünsch­te Ak­tua­li­sie­rungs­fre­quenz (stündlich, täglich, wö­chent­lich etc.) ein, wenn Sie von dieser Aus­zeich­nungs­op­ti­on Gebrauch machen wollen. An­dern­falls behalten Sie einfach die Stan­dard­ein­stel­lung „Do not specify“ (dt. „nicht angeben“).

Mit einem Klick auf „START“ starten Sie den Ge­ne­rie­rungs­pro­zess, dessen Dauer von der Größe Ihres Web­pro­jekts abhängt. Ist der Vorgang beendet, können Sie sich das Ergebnis unter „VIEW SITEMAP DETAILS“ -> „VIEW FULL XML SITEMAP“ anzeigen lassen.

Über den Download-Button können Sie die erzeugte XML-Sitemap-Datei nun her­un­ter­la­den und an­schlie­ßend in das Root-Ver­zeich­nis Ihrer Website hochladen. Um nun bei­spiels­wei­se den Google-Crawler über die Datei zu un­ter­rich­ten, reichen Sie die Datei einfach in der Google Search Console ein (setzt ein Google und den Eintrag der Website als Property voraus). Al­ter­na­tiv können Sie an einer be­lie­bi­gen Stelle in der robots.txt-Datei den Pfad angeben, an dem die Sitemap zu finden ist:

Sitemap: http://one-test.website/sitemap.xml

Google XML Sitemaps: So erstellen Sie XML-Sitemaps mit dem WordPress-Plug-in

Seit über einem Jahrzehnt macht das von Arne Brachhold ent­wi­ckel­te WordPress-Plug-in Google XML Sitemaps die Kreation von XML-Sitemaps für das eigene Projekt zum Kin­der­spiel. Um das beliebte Plug-in (über 2 Millionen aktive In­stal­la­tio­nen weltweit) für Ihre WordPress-Website zu nutzen, in­stal­lie­ren Sie es zunächst über das Plug-in-Center des Content-Ma­nage­ment-Systems. Wählen Sie hierfür den Menüpunkt „Plugins“ und an­schlie­ßend „In­stal­lie­ren“ aus und geben Sie „Google XML Sitemaps“ in das Suchfeld ein. Durch einen Klick auf „Jetzt in­stal­lie­ren“ starten Sie den In­stal­la­ti­ons­pro­zess der Er­wei­te­rung, die gleich an erster Stelle der prä­sen­tier­ten Resultate er­schei­nen sollte:

Sie können Google XML Sitemaps auch manuell her­un­ter­la­den und in das Plug-in-Ver­zeich­nis Ihrer WordPress-In­stal­la­ti­on legen. Ak­ti­vie­ren Sie die Er­wei­te­rung im Anschluss, können Sie diese direkt in WordPress über den Punkt „XML-Sitemap“ im Menü „Ein­stel­lun­gen“ aufrufen. Im Vergleich zu XML-Sitemaps.com steht dabei eine deutlich größere Zahl an Kon­fi­gu­ra­ti­ons­mög­lich­kei­ten in den folgenden sieben Bereichen zur Verfügung:

  • All­ge­mei­ne Ein­stel­lun­gen: Hier legen Sie die grund­sätz­li­chen Ein­stel­lun­gen fest und bestimmen bei­spiels­wei­se, ob Google und Bing au­to­ma­tisch über Än­de­run­gen in­for­miert werden sollen oder ob die Sitemap au­to­ma­tisch kom­pri­miert werden soll.
  • Ad­di­tio­nal Pages: Unter dieser Rubrik können Sie Dateien oder URLs hin­zu­fü­gen, die nicht zum WordPress-Projekt gehören, aber über die gleiche Domain laufen.
  • Priorität der Beiträge: An­pas­sun­gen in diesem Menü sind ins­be­son­de­re für Blogs und News-Portale von Interesse. Wenn Sie in der Sitemap mit dem <priority>-Tag arbeiten, de­fi­nie­ren Sie an dieser Stelle, ob und wie das Plug-in die Priorität eines Beitrags kal­ku­lie­ren soll.
  • Inhalt der Sitemap: In diesem Menü wählen Sie die Ka­te­go­rien von Seiten aus, die in der XML-Sitemap enthalten sein sollen (z. B. Start­sei­te, statische Seiten, Ar­chiv­sei­ten etc.).
  • Excluded Items: Wenn Sie Ka­te­go­rien oder einzelne Posts von der In­de­xie­rung aus­schlie­ßen wollen, können Sie dies an dieser Stelle tun.
  • Change Fre­quen­ci­es: Google XML Sitemaps bietet die Mög­lich­keit, Vor­ein­stel­lun­gen für das <ch­an­ge­freq>-Tag zu machen. Die Ak­tua­li­sie­rungs­fre­quenz lässt sich sogar separat für die ver­schie­de­nen Sei­ten­ty­pen festlegen.
  • Prio­ri­tä­ten: Hierunter treffen Sie die gleichen Ein­stel­lun­gen für das <priority>-Attribut.

Haben Sie das XML-Sitemap-Setup nach Ihren Vor­stel­lun­gen gestaltet, speichern Sie die Än­de­run­gen über die ent­spre­chen­de Schalt­flä­che. Indem Sie nach dem Spei­cher­vor­gang auf den Link „your sitemap“ klicken, über­mit­teln Sie Ihre XML-Sitemap an die aus­ge­wähl­ten Such­ma­schi­nen-Crawler.

Zum Hauptmenü