Tipp

Der Begriff "Metadaten" bezieht sich auf In­for­ma­tio­nen, welche die ei­gent­li­chen Daten ergänzen. Oftmals liefern Metadaten nähere Details über den Kontext des Inhalts oder geben An­wei­sun­gen zum Umgang mit Daten.

Die Aus­wer­tung von Metadaten durch künst­li­che In­tel­li­genz liefert Vor­her­sa­gen über das Verhalten von Menschen. Per­spek­ti­visch ergibt sich daraus eine ernst­zu­neh­men­de Bedrohung für die Pri­vat­sphä­re der Bürger. Dabei sind Metadaten für sich genommen nichts Schlimmes. Worum es sich bei Metadaten tat­säch­lich handelt, erklären wir in diesem Artikel.

Domain kaufen
Re­gis­trie­ren Sie Ihre perfekte Domain
  • Inklusive 1 SSL-Wildcard-Zer­ti­fi­kat pro Vertrag
  • Inklusive Domain Lock
  • Inklusive Domain Connect für einfache DNS-Ein­rich­tung

Worin liegt der Un­ter­schied zwischen Metadaten und Daten?

Um sich den Begriff Metadaten besser vertraut zu machen, stellen Sie sich ein einfaches Beispiel vor: Sie ver­schi­cken einen Brief auf dem Postweg. Dann ent­spricht das im Brief­um­schlag ent­hal­te­ne Schrift­stück den ei­gent­li­chen, primären Daten. Diese sind privat und vor dem Zugriff durch Dritte ge­setz­lich besonders geschützt — es greift das Brief­ge­heim­nis.

Der Brief­um­schlag enthält die Metadaten des Briefes. Es handelt sich um zu­sätz­li­che Daten, welche die primären Daten begleiten:

  • Anschrift und Absender
  • Brief­mar­ke, Post­stem­pel
  • ggf. weitere Mar­kie­run­gen wie Strich­codes

Wie Sie sehen, handelt es sich insgesamt um Daten, welche den Versand des Briefes erst er­mög­li­chen. Die Metadaten des Briefes sind auf der Au­ßen­sei­te für jeden frei einsehbar. Damit sind sie durch das Brief­ge­heim­nis nicht besonders geschützt, wobei das Post­ge­heim­nis auch für sie gilt.

Worin beruht nun die Gefahr, welche von Metadaten ausgeht? Für sich genommen ist es nicht pro­ble­ma­tisch, wenn einzelne Metadaten lesbar sind. Hat bei­spiels­wei­se ein Dritter Wissen über einen einzelnen Brief­um­schlag erlangt, ist dies in der Regel kein Anlass zur Sorge. Jedoch verhält sich dies in der Summe, bei massiver Spei­che­rung und Aus­wer­tung anders. Dann zeichnen sich Muster ab, die viel über das Verhalten eines Menschen verraten: Wer hat wann mit wem kom­mu­ni­ziert? Man kann so Netzwerke und Kom­mu­ni­ka­ti­ons­ket­ten erkennen.

Die Un­ter­schei­dung zwischen Daten und Metadaten ist fließend. Die Ein­ord­nung hängt vom Kontext und der je­wei­li­gen Per­spek­ti­ve ab. Dazu ein weiteres Beispiel. Ein Buch enthält primäre Daten, wie den Titel des Buches und dessen Inhalt. Weiterhin liegen für die Ver­öf­fent­li­chung eines Buches eine Reihe von Metadaten vor:

  • Autor
  • Verlag
  • Datum und Ort der Ver­öf­fent­li­chung
  • Auflage
  • ISBN

Stellen wir uns vor, Metadaten vieler Ver­öf­fent­li­chun­gen werden in einer Datenbank gesammelt. In Bezug auf eine solche Datenbank wären die Ver­öf­fent­li­chungs­in­for­ma­tio­nen primäre Daten. Dazu käme für jede Ver­öf­fent­li­chung ein neuer Satz Metadaten. Bei­spiels­wei­se könnte in der Datenbank für jede Ver­öf­fent­li­chung hin­ter­legt sein, wann und von welchem Benutzer ein Eintrag hin­zu­ge­fügt wurde.

Welche Arten von Metadaten gibt es und wie werden diese verwendet?

Metadaten fallen in allen Bereichen der Da­ten­spei­che­rung und -ver­ar­bei­tung an. Die Ver­wen­dung von Metadaten lässt sich nicht ab­schlie­ßend be­schrei­ben. Wir nennen hier drei große Ein­satz­ge­bie­te:

  1. Kontext für In­for­ma­tio­nen geben.

Häufig be­schrei­ben Metadaten den Prozess, der zur Erzeugung von In­for­ma­tio­nen geführt hat. Denken Sie bei­spiels­wei­se an die geo­gra­phi­schen Ko­or­di­na­ten, mit denen digitale Fotos versehen werden. Der Kontext lässt sich — wenn einmal verloren — ggf. nicht re­kon­stru­ie­ren und wird deshalb ge­spei­chert.

  1. In­for­ma­tio­nen abrufbar halten, die ansonsten aufwendig errechnet werden müssten.

Denken Sie bei diesem Punkt an die Spiel­dau­er eines Videos. Diese wird als Zeit­an­ga­be in der Video-Datei ein­ge­bet­tet. Ohne die Spiel­dau­er ab­zu­spei­chern, müsste diese errechnet werden. Ein gangbarer Ansatz wäre, die Anzahl der Ein­zel­bil­der zu zählen und durch die Bildrate zu teilen – ein ver­hält­nis­mä­ßig hoher Aufwand.

  1. In­for­ma­tio­nen un­ter­ein­an­der ver­knüp­fen, leichter auf­find­bar und durch­such­bar machen.

Hierbei geht es vor allem darum, von Menschen lesbare In­for­ma­tio­nen mit ma­schi­nen­les­ba­ren Daten zu un­ter­füt­tern. Ziel ist, über au­to­ma­ti­sier­te Verfahren Zu­sam­men­hän­ge zwischen In­for­ma­tio­nen her­zu­stel­len. Zum Einsatz kommen ins­be­son­de­re struk­tu­rier­te Daten, welche un­ter­ein­an­der verknüpft ein „Semantic Web“ bilden.

Metadaten, welche digitale Bilder be­schrei­ben

Mit Di­gi­tal­ka­me­ras und Smart­phones ge­schos­se­ne Bilder enthalten eine Vielzahl von Metadaten. Dabei handelt es sich zum einen um tech­ni­sche Daten, wie Bild­di­men­sio­nen, ver­wen­de­te Kamera, Brenn­wei­te, etc. Diese sind im EXIF-Standard fest­ge­legt und werden von der Kamera au­to­ma­tisch angelegt. Ferner definiert der IPTC-Standard Metadaten, welche den Inhalt des Fotos be­schrei­ben und vom Nutzer ein­ge­tra­gen werden.

Standard Bild-Metadaten Erzeugung
EXIF Bild­in­for­ma­tio­nen, wie Di­men­sio­nen, Farbraum, Farb­ka­nä­le, etc.; fo­to­gra­fi­sche In­for­ma­tio­nen, wie Be­lich­tungs­zeit, Blende, ISO, etc. au­to­ma­tisch bei der Aufnahme
IPTC Stich­wör­ter, Ur­he­ber­rech­te, Orts- und Zeit­an­ga­ben, in­halt­li­che Be­schrei­bun­gen, etc. händisch durch den Nutzer

Beim Teilen digitaler Bilder gilt Vorsicht zu wahren: Die Foto-Metadaten können unter Umständen private In­for­ma­tio­nen des Urhebers verraten. Viele Apps und soziale Netzwerke be­rei­ni­gen Bilder beim Hochladen daher au­to­ma­tisch. Darauf sollte man sich jedoch nicht verlassen. In kri­ti­schen Fällen benutzt man besser ein spe­zi­el­les Tool, um die Bild­in­for­ma­tio­nen zu löschen.

Metadaten, welche in digitalen Videos ein­ge­bet­tet sind

Eine Vi­deo­da­tei besteht für ge­wöhn­lich aus einem Container, welcher ver­schie­de­ne Daten enthält. Primäre Daten eines Videos sind die kodierten Video- und Au­dio­in­hal­te. Daneben liegen weitere Metadaten vor:

  • Spiel­dau­er des Videos
  • Datenrate und Bild­di­men­sio­nen
  • Angaben zu ein­ge­setz­tem Audio- und Video-Codec
  • Un­ter­ti­tel, ggf. in ver­schie­de­nen Sprachen

Metadaten, welche Dateien zu­ge­ord­net sind

Eine Datei in einem digitalen System umfasst zwei primäre Daten: den Inhalt der Datei und ihren Namen. Ferner ist jeder Datei eine Reihe an Metadaten zu­ge­ord­net. Die Datei-Metadaten werden vom Be­triebs­sys­tem verwaltet und sind auch unter dem Begriff „Datei-Attribute“ bekannt. Hier eine Übersicht ge­bräuch­li­cher Datei-Metadaten:

Datei-Metadaten Be­schrei­bung
Zeit­stem­pel Jeweils für Er­stel­lung, Mo­di­fi­ka­ti­on und letzte Öffnung
Spei­cher­ort Pfad der Datei im Da­tei­sys­tem
Besitztum Besitzer und Gruppe
Da­tei­rech­te Lesen, schreiben, ausführen; jeweils für Besitzer, Gruppe, andere

Neben den Datei-At­tri­bu­ten umfassen manche Da­tei­ty­pen spe­zi­fi­sche Metadaten. Diese werden vom je­wei­li­gen An­wen­dungs­pro­gramm verwaltet. Auch bei diesen Metadaten besteht bei der Wei­ter­ga­be das Risiko, ver­trau­li­che In­for­ma­tio­nen preis­zu­ge­ben.

Metadaten, welche beim Versand von E-Mails anfallen

Eine E-Mail umfasst — analog zum klas­si­schen Postbrief — zwei haupt­säch­li­che Be­stand­tei­le:

Dabei enthält der Body die ei­gent­li­che Nachricht, welche dem Schrift­stück im Brief­um­schlag ent­spricht. Der Header enthält analog zum Brief­um­schlag die Adressen von Absender und Empfänger. Wie beim Brief­um­schlag, lassen sich manche In­for­ma­tio­nen des Headers leicht fälschen. Für den Empfänger scheint es dann, als käme eine E-Mail von einem anderen Absender. Ein Trick, der gerne im Zuge von Spoofing-Attacken ein­ge­setzt wird.

Der E-Mail-Header enthält für ge­wöhn­lich noch eine Menge weiterer Metadaten. Unter Anderem zählen dazu:

  • ver­schie­de­ne Zeit­stem­pel
  • Angaben zur For­ma­tie­rung und Kodierung der Nachricht
  • Stationen, welche die E-Mail bei der Über­mitt­lung durch­lau­fen hat
  • Bewertung der E-Mail durch Spam­fil­ter
  • Angabe, ob die E-Mail von einem Vi­ren­scan­ner geprüft wurde

Die Metadaten des E-Mail-Headers werden von Ser­ver­soft­ware und An­wen­dungs­pro­gram­men ge­schrie­ben und gelesen. Die dabei an­fal­len­den In­for­ma­tio­nen verraten viel über eine E-Mail und den Weg, den diese durch das Internet genommen hat. Unter Anderem lassen sich Aussagen über die Echtheit und Ver­trau­lich­keit einer E-Mail treffen. Ferner kann der Header den Hostnamen des eigenen Geräts enthalten und den Ort verraten, von dem eine E-Mail versandt wurde.

Metadaten, welche beim Besuch einer Website anfallen

Aus tech­ni­scher Sicht handelt es sich beim Besuch einer Website um den Abruf eines HTML-Dokuments. Der Browser des Benutzers ruft das Dokument unter der an­ge­ge­be­nen Adresse von einem Server ab. Dabei kommt das HTTP- bzw. HTTPS-Protokoll zum Einsatz.

Neben dem ei­gent­li­chen HTML-Dokument, welches im Browser angezeigt wird, werden als HTTP-Header bekannte Metadaten über­tra­gen. Die HTTP-Header sind ver­gleich­bar mit den Feldern des E-Mail-Headers. Sie enthalten Angaben zur Kodierung, Über­tra­gung, Ver­schlüs­se­lung und Kom­pri­mie­rung der HTTP-Ver­bin­dung.

Ferner werden beim Transfer Metadaten erzeugt, welche auf dem Server anfallen. Dazu gehören Log­da­tei­en, in denen Zugriffe auf den Server pro­to­kol­liert werden, und die man für Logfile-Analysen benötigt. Für jeden Zugriff wird eine weitere Zeile in die Logdatei ge­schrie­ben. Daneben löst der Browser für ge­wöhn­lich weitere Abfragen an DNS-Server aus. Auch dabei werden Metadaten erzeugt und ggf. vom Server-Betreiber ge­spei­chert und aus­ge­wer­tet.

Ver­wir­ren­der­wei­se existiert neben dem bereits erwähnten HTTP-Header noch der HTML-Head. Während ersterer sich auf die Ver­bin­dung bezieht, enthält letzterer Metadaten, welche den Inhalt des Dokuments be­schrei­ben. Hier eine ex­em­pla­ri­sche Übersicht einer HTTP-Server-Antwort. Bei den ein­lei­ten­den Zeilen handelt es sich um den HTTP-Header. Es folgt der HTML-Quelltext mit HTML-Head und HTML-Body Elementen:

HTTP/1.1 200 OK
Date: Mon, 01 Feb 2021 12:13:34 GMT
Content-Type: text/html; charset=UTF-8
Content-Length: 148
Last-Modified: Wed, 08 Jan 2003 23:11:55 GMT
Server: Apache/1.3.3.7 (Unix) (Red-Hat/Linux)
Accept-Ranges: bytes
Connection: close
<html>
    <head>
        <title>Eine Beispiel-Seite</title>
    </head>
    <body>
        <p>Der menschenlesbare Text steht im Body des Dokuments</p>
    </body>
</html>

Bedeutung von Website-Metadaten für Online-Marketing und Such­ma­schi­nen­op­ti­mie­rung

In diesem Abschnitt kon­zen­trie­ren wir uns auf Metadaten, welche in ein HTML-Dokument ein­ge­bet­tet werden. Die bereits erwähnten HTTP-Metadaten, sowie ser­ver­sei­tig erzeugte Metadaten wie Log­da­tei­en, lassen wir außen vor. Für ge­wöhn­lich werden HTML-Metadaten im Head des HTML-Dokuments ein­ge­bun­den.

Viele der im HTML-Header ein­ge­setz­ten Elemente dienen direkt der Such­ma­schi­nen­op­ti­mie­rung. Such­ma­schi­nen-Bots durch­su­chen den Inhalt eines HTML-Dokuments. Der im HTML-Body vor­han­de­ne men­schen­les­ba­rer Teil wird ex­tra­hiert und indiziert. Daneben gibt es spezielle Metadaten, welche aus­schließ­lich für Bots gedacht sind. Wir un­ter­schei­den im Folgenden zwischen „klas­si­schen” und „modernen” Varianten.

Website-Metadaten mit klas­si­schen HTML-Head-Elementen abbilden

Zu den klas­si­schen HTML-Head-Elementen gehören neben dem Titel eine Handvoll kri­ti­scher Meta-Tags. Der Titel ist in ver­schie­de­ner Form auch für den Benutzer sichtbar. Er wird etwa in Le­se­zei­chen oder in der Kopfzeile des Browser-Tabs angezeigt. Die weiteren klas­si­schen '<meta>'-Tags dienen aus­schließ­lich zur Such­ma­schi­nen­op­ti­mie­rung. Hier eine Übersicht der wich­tigs­ten klas­si­schen HTML-Head-Elemente:

Tag Be­schrei­bung Wich­tig­keit
<title> Titel des Dokuments, wird in Er­geb­nis­sen einer Suche angezeigt kritisch
<meta name="de­scrip­ti­on"> Be­schrei­bung des Dokuments, wird in Er­geb­nis­sen einer Suche angezeigt kritisch
<meta name="keywords"> Schlüs­sel­wör­ter des Dokuments, werden nicht in Er­geb­nis­sen einer Suche angezeigt gering
<meta name="robots"> An­wei­sun­gen an Such­ma­schi­nen-Bots zur Ver­ar­bei­tung des Dokuments kritisch

Website-Metadaten mit modernen HTML-Head-Elementen abbilden

Neben den klas­si­schen HTML-Head-Elementen kommt heut­zu­ta­ge eine Vielzahl weiterer Elemente zum Einsatz, um Metadaten auf einer Website ein­zu­bin­den. Such­ma­schi­nen­be­trei­ber und große Tech­no­lo­gie-Konzerne de­fi­nie­ren laufend neue Metadaten. Dabei bieten sich die Elemente '<meta>' und '<link>'  an, da diese aus­bau­fä­hig sind. Hier eine Übersicht häufig zum Einsatz kommender moderner Website-Metadaten:

Tag Be­schrei­bung Wich­tig­keit
<link rel="canonical"> Ka­no­ni­scher Link zur Ver­mei­dung von Duplicate Content kritisch, falls Duplicate Content vorhanden
<link rel="alternate" hreflang="de"> Al­ter­na­ti­ve Sprach­ver­sio­nen desselben Dokuments per hreflang angeben optional
<meta property="og:> OpenGraph für die Pu­bli­ka­ti­on in den sozialen Medien optional

Beim '<meta>'-Element wird über das 'name'-Attribut die spe­zi­fi­sche Art der Metadaten fest­ge­legt. Beim '<link>'-Element kommt in ähnlicher Weise das 'rel'-Attribut zum Einsatz. Je nach ein­ge­setz­tem Metadaten-Standard finden sich für das '<meta>'-Element zwei al­ter­na­ti­ve Schreib­wei­sen. Wir fassen diese hier zusammen:

Schreib­wei­se Metadaten-Standard
<meta name=""> HTML5
<meta property=""> RDFa
<meta itemprop=""> HTML Microdata

Website-Metadaten mit dem Open Graph de­fi­nie­ren

Bei Open Graph handelt es sich um ein von Google ent­wi­ckel­tes Protokoll zur An­rei­che­rung eines Web-Dokuments mit Metadaten. Die Open-Graph-Angaben liefern In­for­ma­tio­nen, welche beim Teilen des Dokuments in sozialen Netz­wer­ken als Übersicht ein­ge­blen­det werden. So lassen sich op­ti­mier­te Bilder, Titel und Be­schrei­bungs­tex­te festlegen. Dies macht Sinn, da je nach Plattform spe­zi­fi­sche Be­schrän­kun­gen in Bezug auf Länge von Texten, Di­men­sio­nen von Bildern, und der­glei­chen gelten. Das Protokoll wird ausgiebig von Facebook und Twitter ein­ge­setzt. Hier eine Übersicht der es­sen­zi­el­len Open-Graph-Metadaten:

Open-Graph-Metadaten Erklärung
<meta property="og:title"> Titel des Objekts
<meta property="og:type"> Die Art des Objekts, z. B. Bild, Web­do­ku­ment, Video, etc.
<meta property="og:image"> Ein Bild, welches das Objekt re­prä­sen­tiert
<meta property="og:url"> Die ka­no­ni­sche URL des Objekts
Tipp

Sollten Sie beim Teilen Ihrer Web-Inhalte auf Facebook Fehler vorfinden, hängt das Problem oft mit feh­ler­haf­ten Open-Graph-Angaben zusammen. In diesem Fall hilft manchmal ein einfacher Trick: loggen Sie sich in Ihren Facebook-Account ein und nutzen Sie den Sharing Debugger. Damit weisen Sie Facebook an, die Open-Graph-In­for­ma­tio­nen erneut aus­zu­le­sen.

Website-Metadaten mit Rich Cards de­fi­nie­ren

Neben Open Graph kommt mit den Rich Cards ein weiterer von Google ent­wi­ckel­ter Metadaten-Standard zum Einsatz. Die Rich Cards reichern ein Web-Dokument mit struk­tu­rier­ten Metadaten an. So lässt sich bei­spiels­wei­se die Website eines Re­stau­rants um Angaben zu geo­gra­phi­scher Lage, Preisen, Öff­nungs­zei­ten u. ä. ergänzen. Die Rich Card Angaben können im HTML-Head oder im HTML-Body platziert werden.

Technisch leiten sich die Rich Cards vom Metadaten-Standard Schema.org ab. Zur Aus­zeich­nung der Metadaten kommen ver­schie­de­ne Formate zum Einsatz. Neben den älteren Standards RDFa und Microdata bietet sich heut­zu­ta­ge vor allem JSON-LD an. Der Einsatz von JSON-LD wird offiziell von Google empfohlen.

Managed Hosting für WordPress
Erstellen Sie Ihre Website mit AI, wir über­neh­men den Rest
  • Keine Vor­kennt­nis­se nötig dank be­nut­zer­freund­li­cher AI-Tools
  • Voll­stän­dig anpassbar mit Themes und Plugins
  • Einfache Updates und minimaler Admin-Aufwand
Zum Hauptmenü