Was ist Schema.org?

Schema.org ist ein Gemeinschaftsprojekt der Suchmaschinenanbieter Google, Microsoft, Yahoo und Yandex. Ziel der Initiative ist eine Vereinheitlichung semantischer Annotationen zur Auszeichnung von Webseiteninhalten. Auf der gleichnamigen Internetpräsenz stellen die Initiatoren Webseitenbetreibern das Schema.org-Mark-up zur Verfügung, ein umfangreiches Vokabular, mit dem im HTML-Code Zusatzinformationen eingetragen werden können, die ein maschinelles Auslesen von semantischen Zusammenhängen erlauben. Man spricht in diesem Fall von strukturierten Daten, der Grundlage des Semantic Webs. Die Auszeichnung nach Schema.org unterstützt die Formate RDFa, Microdata und JSON-LD.

Drei Gründe für Schema.org

Für Webseitenbetreiber werden strukturierte Daten immer wichtiger. Im Gegensatz zu menschlichen Besuchern benötigen Programme wie Webcrawler ein entsprechendes Mark-up, um semantische Zusammenhänge auf einer Webseite zu verarbeiten. Strukturierte Daten spielen somit eine entscheidende Rolle bei der Indexierung. Doch auch Webseitenbetreiber profitieren von semantischen Annotationen. Werden Inhalte einheitlich ausgezeichnet, sind Suchmaschinen in der Lage, gezielt Informationen zu extrahieren und diese für eigene Darstellungsformen auf den Suchergebnisseiten (SERPs) zu nutzen. Relevant sind hierbei vor allem sogenannte Rich Snippets. Bei diesen handelt es sich um Informationselemente, die das eigentliche Suchergebnis erweitern und so für deutlich mehr Aufmerksamkeit sorgen. Um die benötigte Einheitlichkeit bei der semantischen Annotation trotz unterschiedlicher Datenformate zu gewährleisten, bietet Schema.org standardisierte Schemata, sogenannte „types“ (Typen), die jeweils mit einem spezifischen Set an „properties“ (Eigenschaften) versehen werden können. Für Webseitenbetreiber bringt das Schema.org-Mark-up drei wesentliche Vorteile:

  • Standardisierung: Das Schema.org-Mark-up basiert auf einer Absprache der weltgrößten Suchmaschinenanbieter. Werden Inhalte nach Schema.org annotiert, wählen Webseitenbetreiber ein Mark-up, das de facto als Standard gilt.
  • Kompatibilität: Einheitliche Schemata und die Unterstützung der gängigsten Datenformate – RDFa, Microdata und JSON-LD – sorgen für maximale Kompatibilität der semantischen Annotation. Webseitenbetreiber, die Inhalte gemäß Schema.org auszeichnen, bereiten diese für alle gängigen Webclients auf.
  • Validierung: Ein einheitlicher Standard bietet den Vorteil einer schnellen, unkomplizierten Fehleranalyse. Auszeichnungen, die gemäß Schema.org mit Microdata, RDFa und JSON-LD vorgenommen wurden, lassen sich mit dem kostenlosen Structured Data Testing Tool von Google validieren.

Typenhierarchie nach Schema.org

Das Schema.org-Mark-up ist ein System aus Typen und Eigenschaften. Während sich Typen inhaltlichen Elementen zuordnen lassen, um diese als ein klar definiertes Item zu kennzeichnen, werden Eigenschaften genutzt, um den zuvor definierten Typ mit gewissen Werten zu versehen. Das Projekt Schema.org bietet dazu ein hierarchisch strukturiertes Set an Typen. Zudem ist festgelegt, welche Eigenschaften sich welchem Typ zuordnen lassen.

Das Spektrum an Typen, denen ein Item zugeordnet werden kann, reicht von sehr weitgefassten Definitionen wie „Thing“ bis hin zu spezifischeren Typen wie „Movie“. Dabei hat jeder Typ – abgesehen von der unspezifischen Kategorie „Thing“ – ein oder mehrere Eltern-Typen:

  • Thing > CreativeWork > Movie

Während „Thing“ ein unspezifisches Item kennzeichnet, handelt es sich beim Typ „CreativeWork“ um ein spezifisches Ding, nämlich um ein kreatives Werk – zum Beispiel ein Buch, eine Fotografie oder einen Film. Der Typ „Movie“ ist somit eine Subkategorie des Typs „CreativeWork“, der wiederum eine Subkategorie von „Thing“ ist. Relevant ist diese Hierarchie, da spezifischen Typen die Eigenschaften ihrer Elterntypen inhärent sind. Ein als „Movie“ ausgezeichnete Item lässt sich mit den spezifischen Eigenschaften eines Films versehen: Filme haben Darsteller, Regisseure, Trailer usw.

Auf den „Movie“-Typ treffen aber auch die Eigenschaften des Elterntyps „CreativeWork“ zu: Wie alle Werke haben Filme einen Autor, ein Genre oder Bewertungen. Zudem erbt der Typ „Movie“ die Eigenschaften des Elterntyps „Thing“: Name, Beschreibung, URL und Bild. Alle Eigenschaften lassen sich je nach Item mit jeweils individuellen Werten versehen.

Die auf Schema.org definierten Typen und Eigenschaften kommen bei RDFa, Microdata und JSON-LD gleichermaßen zum Einsatz. Die Einbindung des Mark-ups in die Webseite unterscheidet sich je nach Datenformat jedoch erheblich.

Die Wahl des Datenformats

Ist die Entscheidung für ein Mark-up nach Schema.org gefallen, bleibt die Wahl des Datenformats. Eine detaillierte Beschreibung der Annotation mit RDFa, Microdata und JSON-LD auf Grundlage der standardisierten Typen und Eigenschaften des Schema.org-Mark-ups bieten die folgenden weiterführenden Artikeln: