Htaccess
Bei der htaccess-Datei handelt es sich um eine Textdatei, die Anweisungen für einen Server enthält.
Sie wird vor dem Seitenaufruf verarbeitet, ohne dass der Server neu gestartet werden muss. Die htaccess wird meist für Weiterleitungen einer Domain oder URL verwendet. Sie spielt deshalb eine wichtige Rolle bei Suchmaschinenoptimierung, zum Beispiel bei der Vermeidung von Duplicate Content. Eingesetzt wird die htaccess überwiegend bei Apache Servern, die zu den meistgenutzten Servern gehören.
Aufbau der htaccess
Der Inhalt einer htaccess-Datei lässt sich mit einem einfachen Texteditor erstellen, bearbeiten und ändern. Sie wird mit dem Namen „.htaccess.txt“ abgespeichert und auf dem Server abgelegt. Der Aufbau der Datei ist immer ähnlich. Damit der Apache Server die Daten auch korrekt interpretieren kann, muss das Dokument immer diesen Namen tragen.
- RewriteEngine On
Mit diesem Befehl wird das Modul mod_rewrite des Apache Servers gestartet. Es führt dazu, dass URLs umgeschrieben und somit weitergeleitet werden. - RewriteBase /
Diese Angabe definiert das Verzeichnis, auf welches sich das Umschreiben oder Umleiten bezieht. In der Regel wird hier immer das Root-Verzeichnis der Domain eingesetzt. - RewriteRule
Der dritte Bestandteil der .htaccess enthält die Regel, nach der eine URL oder Domain weitergeleitet werden soll. Hier stehen verschiedene Möglichkeiten offen. Zugleich wird die Art des Redirects präzisiert.
Der komplette Eintrag in der .htaccess-Datei kann dann so aussehen:
RewriteEngine On
RewriteBase /
RewriteRule meineseite.html deineseite.html [R=301]
Hier wird meinseseite.html auf deineseite.html umgeleitet. Ist das Root-Verzeichnis der Domain zum Beispiel abc.de, handelt es sich in diesem Fall um einen 301-Redirect von abc.de/meineseite.html auf abc.de/deineseite.html.
Anwendungsszenarien für die .htaccess
Die .htaccess kann für verschiedene Zwecke eingesetzt werden.
- URLs umschreiben
Viele CMS verwenden dynamisch generierte URLs mit zahlreichen Parametern anstelle von sprechenden, statischen URLs. Mit Hilfe der htaccess kann die URL nun umgeschrieben werden. Mit Hilfe der .htaccess-Datei lassen sich dabei nicht nur komplette Verzeichnisse umschreiben, sondern auch einzelne Elemente der URL ersetzen. Möglich ist ebenso, dass beim Umschreiben andere Elemente der Website in die URL eingefügt werden. - 301-Weiterleitung (Moved Permanently)
Der 301-Redirect ist die vermutlich am häufigsten eingesetzte Variante der htaccess. Eine solche Weiterleitung vielseitig eingesetzt werden. Bei einem Domain-Umzug leitet der Server damit automatisch auf die neue Domain um. Bei einer Änderung der URL-Struktur werden alte URLs auf neue umgeleitet. Ebenso kann der 301-Redirect verwendet werden, um von einem Web-Protokoll auf das andere zu verweisen, zum Beispiel im Rahmen einer SSL-Verschlüsselung von http auf https.
Grundsätzlich hilft der 301-Redirect über die htaccess-Datei dabei, Duplicate Content zu vermeiden. Die Weiterleitungen werden von Google gecacht und leiten Linkjuice von der alten auf die neue URL weiter.
Ein Befehl in der htaccess-Datei, die Webmaster dann auf den Server hochladen, kann so aussehen:
RewriteRule ^eineseite.html$/andereseite.html [R=301,L]
Hier wird eineseite.html auf andereseite.html weitergeleitet.
Soll eine Webseite von der Version ohne www. auf die Version mit www. und https umgeleitet werden, sieht ein Eintrag so aus:
RewriteEngine On
RewriteCond %{HTTP_HOST} ^eineseite.de$
RewriteRule ^(.*) https:// www.eineseite.de /$1 [L,R=301]
Grundsätzlich bietet sich die .htaccess für jede Form der 3xx-Weiterleitung an, wie die temporären Redirects mit den Statuscodes 302 und 307.
Die Bedeutung der .htaccess für SEO
Die htaccess-Datei ist für das URL-Rewriting und Redirects enorm wichtig. Diese kleine Textdatei kann nämlich beeinflussen, welche URL ein Server bei der Anfrage durch einen Client, also einen Browser, ausgibt. Die wichtigste Funktion der Datei dient damit der Vermeidung von Duplicate Content. Doppelte Inhalte, die durch zwei indexierte Protokolle, indexierte alte und neue URLs mit gleichem Content oder identische Verzeichnisse, gleiche Inhalte auf unterschiedlichen Domains entstehen, können zu Ranking-Nachteilen bei Google führen.
Dabei werden keine URLs abgewertet, aber die Suchmaschine kann sich nicht zwischen den relevanten Inhalten einer Website entscheiden. So kann es zum Beispiel geschehen, dass zwei identischen Seiten-Versionen im Google-Index zu finden sind, aber keine Version gute Rankings erzielt. In diesem Fall wird auch von „Ranking-Kannibalismus“ gesprochen.
Auch wenn es sich bei der htaccess nur um wenige Zeilen einer Textdatei handelt, haben diese große Wirkung. Deshalb sollten die Dateien vor dem Upload auf den Server genau geprüft werden. Darüber hinaus empfiehlt es sich, vorhandene Weiterleitungen regelmäßíg zu kontrollieren.
Vorsicht ist außerdem geboten, wenn Canonical Tags oder Noindex Tags auf der Webseite verwendet werden. In diesem Fall kann eine Weiterleitung zu Fehlern führen. Ein häufiger Fehler ist zum Beispiel eine Seite mit einem Noindex Tag auf eine andere Seite per 301-Redirect weiterzuleiten. In diesem Fall wird nämlich nicht nur der Pagerank übertragen, sondern auch die Anweisung an den Google Crawler, die URL nicht zu indexieren.