URL
Der Begriff URL ist ein Akronym der Bezeichnung "Uniform Resource Locator".
Damit wird eine Adresse bezeichnet, die einen Pfad zu einer bestimmten Datei auf einem Server angibt. Auf diese Quelle kann über ein Netzwerkprotokoll wie http, https oder ftp zugegriffen werden. Der Sinn einer URL besteht somit laut Definition, dass eine Ressource mit Hilfe eines speziellen Netzwerkprotokolls genau angesteuert und abgerufen werden kann. Heute wird im Alltagsgebrauch meist von Internet-Adresse oder Web-Adresse gesprochen, wenn eigentlich die URL gemeint ist. In der Regel beziehen sich URLs demnach auf Websites. URLs werden mit Hilfe von Web-Browsern abgerufen.
Entstehung der URL
Jede Website ist bis heute über eine IP-Adresse gezielt abrufbar. Doch in der Praxis wäre es sehr umständlich, wenn User jedes Mal für den Besuch einer Internet-Seite eine Kombination aus vielen Zahlen eingeben müsste. Als sich das Internet in den 1990er-Jahren entwickelte, suchte der Forscher Tim Berners-Lee nach einem Standard, der es ermöglichen sollte, über das Internet auf Dokumente zuzugreifen.
Schließlich wurde 1994 mit dem RFC 1738 ein Standard entwickelt und veröffentlicht. Er bezieht sich zunächst auf den „Univeral Resource Identifier“. Noch im gleichen Jahr wurde schließlich mit dem „Uniform Resource Locator“ eine Unterform standardisiert. Somit war die Internet-Adresse, wie die meisten User sie heute kennen, geschaffen worden.
Der Aufbau einer URL
Eine URL besteht in der einfachsten Beschreibung aus drei Teilen: Protokoll (https://, ftp://), Domain- oder Server-Name (www.domain.de) und Dateipfad (/verzeichnis/datei.html). Der Dateipfad kann aus mehreren Verzeichnisebenen bestehen.
Anstelle des Server-Namens könnte auch eine IP-Adresse stehen.
Wird eine Datei nicht über einen Browser oder anderen Client im Web abgerufen, sondern von einem anderen Server, kann eine URL auch so aussehen:
https://peter:[email protected]:8080/index.html
In diesem Fall besteht die URL neben dem Protokoll/Schema noch aus dem User-Namen mit Kennwort, dem Host der Datei (www.beispiel.de) sowie dem Port (8080), über welchen die Daten abgerufen werden können.
Innerhalb eines HTML-Dokuments können auch relative URLs verwendet werden. Dabei werden Protokoll und Server-Name weggelassen. Es wird im Code nur noch der Verzeichnis- und Dateiname angegeben, zum Beispiel /verzeichnis/datei.html. Wird eine relative URL auf einer Website verwendet, greift ein Browser beim Klick auf einen solchen Link immer auf die Adresse des Domain Servers zurück, auf dem er sich gerade befindet.
Kodierung von URLs
Damit es beim Abrufen und Interpretieren von URLs keine Fehler gibt, dürfen diese im Rahmen des URL Encoding nur bestimmte Zeichen enthalten. Hierfür wird der sogenannte ASCII-Zeichensatz verwendet. Damit ist es zum Beispiel möglich, &-Zeichen oder Bindestriche in URLs zu verwenden, ohne dass der Browser diese falsch interpretiert. Gibt es zum Beispiel ein nicht codiertes Leerzeichen in einer URL, bricht der Browser die weitere Encodierung ab. Erst mit Hilfe der Umwandlung von ASCII-Zeichen in einer Prozentdarstellung können Browser die URLs korrekt auslesen. Das gilt zum Beispiel für Umlaute oder das ß.
Probleme dieser Art tauchen häufig auf, wenn Artikelüberschriften von CMS automatisiert für die URL verwendet werden. Im Quellcode können kodierte URLs mit Hilfe des MIME-Typs markiert werden.
Die Kodierung von URLs sieht außerdem vor, dass bestimmte Zeichen für Funktionen innerhalb der URL reserviert sind. Reservierte Zeichen sind:
- Fragezeichen (?): Es leitet den sogenannten „Query-String“ einer URL ein. Dabei handelt es sich um eine Zeichenkette mit bestimmten Parametern, die zum Beispiel für das Tracking verwendet werden.
- Gleichheitszeichen (=): Diese Zeichen wird zwischen Parameter und deren Werte gesetzt.
- Et-Zeichen (&): Dabei handelt es sich um ein Trennzeichen zwischen den einzelnen Parametern in einem Query String.
- Doppelkreuz (#): Dieses Zeichen verweist auf einen Anker-Link innerhalb eines Dokuments.
Zu den nicht-reservierten Zeichen zählen die Ziffern von 0 bis 9 sowie die Buchstaben von A bis Z in Klein- und Großschreibweise. Ebenso haben diese Zeichen keine Funktion: – _ ~. Sie können also je nach Wunsch des Programmierers eine jeweils andere Bedeutung haben.
Domain vs. URL
Häufig werden die Begriffe Domain und URL heute gleichbedeutend verwendet. Allerdings besteht in der Praxis ein deutlicher Unterschied. Während die URL aus dem Domain-Namen und der Pfadangabe im WWW besteht, handelt es sich bei der Domain lediglich um den Namen eines Bereichs im sogenannten Domain Name System (DNS). Der Name der Domain kann relativ frei gewählt werden und wird einer Top Level Domain zugeordnet.
Ein Beispiel: Die URL unserer Seite lautet „https://www.searchmetrics.com“. Unsere Domain hingegen lautet „searchmetrics.com“
URL-Relevanz im SEO
Lange Zeit waren Keywords in der URL wichtig für die Suchmaschinenoptimierung. So konnten Webmaster bei Suchmaschinen wie Google mit Keyword Domains bessere Rankings erzielen. Allgemein wurde davon ausgegangen, dass entsprechende Keywords in der URL das Thema besser wiedergeben und deshalb Vorteile beim Ranking entstehen konnten. Tatsächlich können Schlüsselwörter in der URL Usern und Suchmaschinen dabei helfen, sich thematisch auf einer Website zu orientieren.
Diese Orientierung kann zum Beispiel auch durch kurze URLs erleichtert werden. Grundsätzlich ist Google aber in der Lage, URLs mit mehr als 1.000 Zeichen sicher auszulesen.