Duplicate Content

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Duplicate Content (engl. für „doppelter Inhalt“) bezeichnet die Darstellung von gleichem Inhalt auf verschiedenen Webseiten. Dies gilt sowohl für Webseiten der gleichen als auch unterschiedlichen Domains.

Suchmaschinen filtern Duplicate Content heraus oder bewerten ihn zum Teil sogar negativ.[1]

Entstehung[Bearbeiten]

Duplicate Content kann entstehen, wenn mehrere URLs den gleichen Inhalt anzeigen. Dies kann beispielsweise so sein, wenn an eine URL noch GET-Parameter oder in unterschiedlichen Reihenfolge angehängt werden: www.example.com/index.php?a=1&b=2 und www.example.com/index.php?b=2&a=1 liefern normalerweise identische Seiten, sind aber verschiedene URLs. Suchmaschinen sehen also zwei Adressen, die ähnliche oder gleiche Inhalte haben und werden bei entsprechenden Suchanfragen nur eine dieser Seiten anzeigen.

Eine weitere, häufig anzutreffende Form von Duplicate Content entsteht bei der Verfügbarkeit einer Webseite unter Angabe der www-Subdomain, wenn diese gleichzeitig auch ohne diese Angabe erreichbar ist (also zum Beispiel http://www.example.com/ und http://example.com/). Dieses Problem tritt dabei in der Regel auf jeder einzelnen Unterseite einer Domain automatisch auf.

Lösung[Bearbeiten]

Als Lösung bietet sich die Einrichtung einer Weiterleitung an, so dass zum Beispiel der Aufruf von http://www.example.com/ zu http://example.com/ weiterleitet. Dazu sollte http://www.example.com/ den HTTP-Statuscode 301 ausliefern, so dass die Webcrawler der Suchmaschinen die Weiterleitung erkennen.

Mit dem Canonical Link kann man für die Suchmaschine angeben, unter welcher URL die „Original“-Seite liegt. Die Verwendung dieses Tags bietet sich immer dann an, wenn die Erreichbarkeit über verschiedene URLs zwingend nötig ist, wie z.B.die Druckversionen einer Webseite. Canonical-Tags lassen sich sowohl für HTML-Webseiten als auch für Nicht-HTML-Webseiten wie beispielsweise Office- oder PDF-Dokumenten erstellen. Allerdings muss im letzteren Fall über die Konfiguration des Webservers dafür das Canonical-Tag in den HTTP-Header eingebaut werden. Zur Vermeidung von Problemen bei der Paginierung wird mit den RDFa Tags rel=“next“ und rel=“prev“ gearbeitet, die die Beziehung zwischen einer Hauptkategorieseite und den Paginationsseiten herausstellen.[2]

Einzelnachweise[Bearbeiten]

  1. Warum stellt Duplicate Content ein Problem dar?
  2. Seitennummerierung, Google Webmaster-Tools

Weblinks[Bearbeiten]