Schema.org ist ein Ge­mein­schafts­pro­jekt der Such­ma­schi­nen­an­bie­ter Google, Microsoft, Yahoo und Yandex. Ziel der In­itia­ti­ve ist eine Ver­ein­heit­li­chung se­man­ti­scher An­no­ta­tio­nen zur Aus­zeich­nung von Web­sei­ten­in­hal­ten. Auf der gleich­na­mi­gen In­ter­net­prä­senz stellen die In­itia­to­ren Web­sei­ten­be­trei­bern das Schema.org-Mark-up zur Verfügung, ein um­fang­rei­ches Vokabular, mit dem im HTML-Code Zu­satz­in­for­ma­tio­nen ein­ge­tra­gen werden können, die ein ma­schi­nel­les Auslesen von se­man­ti­schen Zu­sam­men­hän­gen erlauben. Man spricht in diesem Fall von struk­tu­rier­ten Daten, der Grundlage des Semantic Webs. Die Aus­zeich­nung nach Schema.org un­ter­stützt die Formate RDFa, Microdata und JSON-LD.

Drei Gründe für Schema.org

Für Web­sei­ten­be­trei­ber werden struk­tu­rier­te Daten immer wichtiger. Im Gegensatz zu mensch­li­chen Besuchern benötigen Programme wie Web­craw­ler ein ent­spre­chen­des Mark-up, um se­man­ti­sche Zu­sam­men­hän­ge auf einer Webseite zu ver­ar­bei­ten. Struk­tu­rier­te Daten spielen somit eine ent­schei­den­de Rolle bei der In­de­xie­rung. Doch auch Web­sei­ten­be­trei­ber pro­fi­tie­ren von se­man­ti­schen An­no­ta­tio­nen. Werden Inhalte ein­heit­lich aus­ge­zeich­net, sind Such­ma­schi­nen in der Lage, gezielt In­for­ma­tio­nen zu ex­tra­hie­ren und diese für eigene Dar­stel­lungs­for­men auf den Such­ergeb­nis­sei­ten (SERPs) zu nutzen. Relevant sind hierbei vor allem so­ge­nann­te Rich Snippets. Bei diesen handelt es sich um In­for­ma­ti­ons­ele­men­te, die das ei­gent­li­che Such­ergeb­nis erweitern und so für deutlich mehr Auf­merk­sam­keit sorgen. Um die benötigte Ein­heit­lich­keit bei der se­man­ti­schen An­no­ta­ti­on trotz un­ter­schied­li­cher Da­ten­for­ma­te zu ge­währ­leis­ten, bietet Schema.org stan­dar­di­sier­te Schemata, so­ge­nann­te „types“ (Typen), die jeweils mit einem spe­zi­fi­schen Set an „pro­per­ties“ (Ei­gen­schaf­ten) versehen werden können. Für Web­sei­ten­be­trei­ber bringt das Schema.org-Mark-up drei we­sent­li­che Vorteile:

  • Stan­dar­di­sie­rung: Das Schema.org-Mark-up basiert auf einer Absprache der welt­größ­ten Such­ma­schi­nen­an­bie­ter. Werden Inhalte nach Schema.org annotiert, wählen Web­sei­ten­be­trei­ber ein Mark-up, das de facto als Standard gilt.
  • Kom­pa­ti­bi­li­tät: Ein­heit­li­che Schemata und die Un­ter­stüt­zung der gän­gigs­ten Da­ten­for­ma­te – RDFa, Microdata und JSON-LD – sorgen für maximale Kom­pa­ti­bi­li­tät der se­man­ti­schen An­no­ta­ti­on. Web­sei­ten­be­trei­ber, die Inhalte gemäß Schema.org aus­zeich­nen, bereiten diese für alle gängigen Web­cli­ents auf.
  • Va­li­die­rung: Ein ein­heit­li­cher Standard bietet den Vorteil einer schnellen, un­kom­pli­zier­ten Feh­ler­ana­ly­se. Aus­zeich­nun­gen, die gemäß Schema.org mit Microdata, RDFa und JSON-LD vor­ge­nom­men wurden, lassen sich mit dem kos­ten­lo­sen Struc­tu­red Data Testing Tool von Google va­li­die­ren.

Ty­pen­hier­ar­chie nach Schema.org

Das Schema.org-Mark-up ist ein System aus Typen und Ei­gen­schaf­ten. Während sich Typen in­halt­li­chen Elementen zuordnen lassen, um diese als ein klar de­fi­nier­tes Item zu kenn­zeich­nen, werden Ei­gen­schaf­ten genutzt, um den zuvor de­fi­nier­ten Typ mit gewissen Werten zu versehen. Das Projekt Schema.org bietet dazu ein hier­ar­chisch struk­tu­rier­tes Set an Typen. Zudem ist fest­ge­legt, welche Ei­gen­schaf­ten sich welchem Typ zuordnen lassen.

Das Spektrum an Typen, denen ein Item zu­ge­ord­net werden kann, reicht von sehr weit­ge­fass­ten De­fi­ni­tio­nen wie „Thing“ bis hin zu spe­zi­fi­sche­ren Typen wie „Movie“. Dabei hat jeder Typ – abgesehen von der un­spe­zi­fi­schen Kategorie „Thing“ – ein oder mehrere Eltern-Typen:

  • Thing > Crea­ti­ve­Work > Movie

Während „Thing“ ein un­spe­zi­fi­sches Item kenn­zeich­net, handelt es sich beim Typ „Crea­ti­ve­Work“ um ein spe­zi­fi­sches Ding, nämlich um ein kreatives Werk – zum Beispiel ein Buch, eine Fo­to­gra­fie oder einen Film. Der Typ „Movie“ ist somit eine Sub­ka­te­go­rie des Typs „Crea­ti­ve­Work“, der wiederum eine Sub­ka­te­go­rie von „Thing“ ist. Relevant ist diese Hier­ar­chie, da spe­zi­fi­schen Typen die Ei­gen­schaf­ten ihrer El­tern­ty­pen inhärent sind. Ein als „Movie“ aus­ge­zeich­ne­te Item lässt sich mit den spe­zi­fi­schen Ei­gen­schaf­ten eines Films versehen: Filme haben Dar­stel­ler, Re­gis­seu­re, Trailer usw.

Auf den „Movie“-Typ treffen aber auch die Ei­gen­schaf­ten des El­tern­typs „Crea­ti­ve­Work“ zu: Wie alle Werke haben Filme einen Autor, ein Genre oder Be­wer­tun­gen. Zudem erbt der Typ „Movie“ die Ei­gen­schaf­ten des El­tern­typs „Thing“: Name, Be­schrei­bung, URL und Bild. Alle Ei­gen­schaf­ten lassen sich je nach Item mit jeweils in­di­vi­du­el­len Werten versehen.

Die auf Schema.org de­fi­nier­ten Typen und Ei­gen­schaf­ten kommen bei RDFa, Microdata und JSON-LD glei­cher­ma­ßen zum Einsatz. Die Ein­bin­dung des Mark-ups in die Webseite un­ter­schei­det sich je nach Da­ten­for­mat jedoch erheblich.

Die Wahl des Da­ten­for­mats

Ist die Ent­schei­dung für ein Mark-up nach Schema.org gefallen, bleibt die Wahl des Da­ten­for­mats. Eine de­tail­lier­te Be­schrei­bung der An­no­ta­ti­on mit RDFa, Microdata und JSON-LD auf Grundlage der stan­dar­di­sier­ten Typen und Ei­gen­schaf­ten des Schema.org-Mark-ups bieten die folgenden wei­ter­füh­ren­den Artikeln:

Zum Hauptmenü