Canonical Tag
Das oder der "Canonical Tag" ist ein HTML-Element, das im Header einer Website eingesetzt wird und per rel="canonical" auf eine kanonische URL verweist.
Mit „kanonisch“ ist in diesem Fall die Original-URL gemeint. Suchmaschinen hilft das Canonical Tag dabei, URLs sinnvoll zu indexieren. Webmaster und SEOs verhindern mit Hilfe des Canonical Tags Duplicate Content. Der eingefügte Link wird auch Canonical Link genannt. Die HTML-Elemente bezeichnen SEOs häufig schlicht als „Canonicals“.
Hintergrund zum Canonical Tag
Google unterstützt seit 2009 das rel=canonical-Element. Damit war Google nicht allein, sondern auch Microsoft und Yahoo einigten sich auf die Unterstützung dieses HTML-Tags. Seither haben Webmaster die Möglichkeit, Duplikate mit einem Verweis im Quellcode für Suchmaschinen zu markieren. Sie können daraufhin nur die Original-Ressource indexieren und die „Kopie“ vernachlässigen.
Einerseits wurde für Webmaster durch die Einführung des Canonicals bzw. der Nutzung dieses Tags die Vermeidung von Duplicate Content vereinfacht. Zum anderen haben auch Google & Co davon profitiert. Denn die Arbeit der Crawler und Bots verschlingt große finanzielle und zeitliche Ressourcen. Mit Hilfe der sinnvoll gesetzten Tags können sich Suchmaschinen viel Crawl-Budget und somit Geld sparen.
Die Idee hinter dem Tag ist einfach: Gibt es von zwei Webseiten Duplikate, wird mit dem Tag festgelegt, welche davon als „Original“ und welche als „Kopie“ markiert wird. Auf die Original-Ressource wird per Canonical Link verwiesen. In der Regel halten sich die Suchmaschinen an diesen Hinweis. Dies bedeutet aber nicht, dass die verweisende Webseite aus dem Index ausgeschlossen wird.
So wird das Canonical Tag eingebunden
Implementierung auf einer HTML-Website:
Das Canonical Tag wird im Header des HTML-Dokuments vor dem abschließenden </head> eingefügt. Ein Beispiel:
Die Seite https://www.seite.de/dieeine/ weist die gleichen Inhalte auf wie https://www.seite.de/dieandere/. Um nun Duplicate Content zu vermeiden wird auf /diandere/ folgender Canonical-Link eingefügt:
<link rel=“canonical“ href=“https://www.seite.de/dieine/“/>
Unabhängig davon, ob auf der gesamten Website relative oder absolute URLs verwenden werden, rät Google zur Verwendung absoluter URLs .
Einbindung in einem PDF-Dokument:
Auch bei PDF-Dateien oder anderen ähnlichen Ressourcen kann ein Canonical gesetzt werden. In diesem Fall erfolgt die Implementierung ebenfalls in den Header. Allerdings handelt es sich dabei um einen Hinweis des Servers im „http Header“, der das Canonical Tag beim Aufruf der Ressource durch einen Client ausspielt. Das Tag sieht dann meist so aus:
Link: <http://www.seite.de/dieine.pdf>; rel=“canonical“
Hinweis: Viele CMS wie WordPress bieten Plugins an, mit welchen automatisiert Canonicals gesetzt werden. Ein direkter Eingriff in den Quellcode ist dann nicht mehr nötig.
Anwendungsmöglichkeiten für das Tag
- Paginierung: Mit Hilfe der Attribute rel=“next“ und rel=“prev“ können Betreiber*innen von Webseiten mehrere Unterseiten einer Kategorie paginieren. Das bedeutet, dass die Seiten für Google und andere Suchmaschinen als logische Folge markiert werden. In diesem Fall wird empfohlen, jede paginierte Seite per Canonical auf sich selbst verweisen zu lassen.
- hreflang: Das hreflang-Tag dient dazu, Suchmaschinen zu zeigen, dass eine übersetzte Version für eine bestimmte Sprache oder ein Land vorliegt. Mit dieser Hilfe können Suchmaschinen einfacher die passende Seitenvariante für eine Zielregion/-sprache identifizieren und anzeigen. Mit Hilfe des Canonicals verweist die mit hreflang markierte Seite auf sich selbst.
- AMP: Accelerated Mobile Pages können durch die gleichzeitige Verwendung von „herkömmlichen“ Webseiten für Duplicate Content sorgen. Um das zu vermeiden, wird auf einer AMP ein Canonical gesetzt, der auf die Desktop-Version verweist. Gibt es keine Desktop-Version und die mobile Website besteht nur als Accelerated Mobile Page, verweist der Canonical auf die AMP selbst, zum Beispiel so: <link rel=“canonical“ href=“https://www.seite.de/amp-version.html“> .
- Verhinderung von Duplicate Content bei Content-Syndizierung: Werden Inhalte einer Website wie zum Beispiel Pressemeldungen dupliziert und auf verschiedenen Websites veröffentlicht, kann per Canonical auf die Original-Ressource verwiesen werden.
Häufige Fehler
So simpel die Funktionsweise des Tags, so vielfältig können die mit seinem Einsatz verbundenen Fehler sein.
- Verwendung des Canonicals im <body>: Wird das Tag dort eingesetzt, hat es keine Wirkung und wird von Google ignoriert.
- Canonical verweist bei Paginierung auf die erste Seite: In diesem Fall werden alle paginierten Seiten ignoriert und Google mitgeteilt, dass die paginierten Seiten Duplikate sind, was aber nicht stimmt.
- Es werden relative URLs verwendet: Der Canonical funktioniert nur zuverlässig mit absoluten URLs. Die Suchmaschine weiß sonst nicht, auf welche Domain sich die Kanonisierung bezieht.
- Der Canonical Link verweist auf eine Kategorie-Seite, die einen 404-Fehler ausgibt: Canonicals sollten ausschließlich auf erreichbare URLs verweisen.
- Im Tag wird ein anderes Protokoll angegeben als das Protokoll der kanonischen Seite: Dieser Fehler tritt zum Beispiel dann auf, wenn das Tag auf eine URL mit http anstelle von https verweist.
Canonical Tag oder Noindex?
Mit dem Canonical Tag lassen sich Duplicate Content Probleme beheben. Ähnliches gilt für das Noindex Tag. Während mit einem Canonical jedoch angegeben wird, dass eine Original-Seite mit dem gleichen Inhalt existiert und Suchmaschinen die „Kopie“ weiterhin indexieren können, gibt das Noindex Tag die Anweisung, die besuchte Seite nicht in den Index aufzunehmen.
Der Nutzen des Canonicals
Die 2009 eingeführten Tags helfen vor allem dabei, Probleme mit doppelten Inhalten zu beheben. Diese können gerade bei Online Shops oder CMS wie WordPress schnell entstehen. Viele Shop-Systeme arbeiten zum Beispiel bei der Filterung von Ergebnissen mit IDs, die von Suchmaschinen indexiert werden können. Die Folge sind manchmal mehrere Dutzend oder gar hunderte URLs, die nahezu die gleichen Inhalte liefern. Mit nur einem Tag können all diese URLs auf eine Original-Ressource zurückgeführt werden.
Doppelte Inhalte können ebenfalls auftreten, wenn Produkte in Shops in verschiedenen Kategorien gelistet werden. So ist es zum Beispiel möglich, dass eine grüne Jacke sowohl im Verzeichnis /winterjacken als auch im Verzeichnis /herrenjacken geführt wird. In diesem Fall müssen Shop-Betreibende sich entscheiden, welche URL mit welchem Überverzeichnis letztlich die kanonische sein soll. Allerdings nutzen viele Shop-Systeme eine einfachere Lösung, indem sie die Produkt-URLs direkt an den Root der Domain hängen, ohne dazwischen Unterverzeichnisse aufzuführen.
Grundsätzlich kann mit einer Canonical URL auch der Linkjuice innerhalb einer Seite optimiert werden. Wird ein Link auf die Seite mit dem doppelten Inhalt geführt, überträgt er die Link-Kraft auf die kanonische Seite. Auf diese Weise können bessere Rankings für die entsprechende „Original-Seite“ erzielt werden.
Dieser Vorteil wurde einige Zeit im Rahmen von BlackHat-SEO-Techniken eingesetzt. Doch Google erkennt diese Manipulationsversuche in der Regel sehr schnell und straft entsprechende URLs mit Ranking-Verlusten ab.