DMOZ

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Open Directory Project)
Wechseln zu: Navigation, Suche
Open Directory Project
DMOZ Logo
www.dmoz.org
Motto Humans do it better
Beschreibung Webverzeichnis
Sprachen multilingual
Erschienen 1998

Das Open Directory Project (ODP), auch bekannt als dmoz (für „Directory Mozilla“), ist nach eigenen Angaben das größte von Menschen gepflegte Webverzeichnis des World Wide Web.[1] Die Inhalte des Projekts sind frei und werden von ehrenamtlichen Redakteuren, den so genannten Editoren, bearbeitet und aktualisiert.

Geschichte[Bearbeiten]

Von "Gnuhoo" zum "Open Directory Project"[Bearbeiten]

Das ODP wurde ursprünglich unter dem Namen Gnuhoo gegründet und ging am 5. Juni 1998 online. Der Name wurde später in Newhoo geändert, nachdem ein Slashdot-Artikel darauf hinwies, dass Gnuhoo nicht auf freier Software basiert, und dass Gnuhoo das Markenzeichen des GNU-Projektes ohne Erlaubnis benutzte.[2]

Newhoo wurde zum Open Directory Project, nachdem es im Oktober 1998 von Netscape gekauft wurde und seinen Inhalt unter einer Open-Content-Lizenz veröffentlichte. Kurz darauf wurde Netscape inklusive des ODP von AOL gekauft, welches einige Zeit später mit Time Warner fusionierte. Abgeleitet von der ersten Hostingadresse directory.mozilla.org entstand die Kurzform "Dmoz" bzw. "dmoz.org".

Am 20. Oktober 2006 erfuhr das ODP schwerwiegende technische Probleme. Die Funktionen für das Vorschlagen von Links und Änderungen sowie die internen Bearbeitungsfunktionen zum Ändern von Katalogeinträgen waren gesperrt. Am 18. Dezember 2006 wurde der Zugang für Editoren wieder freigegeben; am 13. Januar 2007 das öffentliche Interface für das Vorschlagen von Sites und Änderungen und am 23. Februar 2007 die Möglichkeit, sich als neuer Editor zu bewerben.

Motivation[Bearbeiten]

Die Motivation zur Gründung des ODP war die Frustration über die mangelhafte Aktualität, d. h. die lange Verzögerung bei der Aufnahme neuer Sites und der hohe Anteil toter Links in redaktionell betreuten Verzeichnissen. Aber auch Kritik daran, das Internet immer weiter zu kommerzialisieren und auf einen Werbeträger zu reduzieren, statt dem freien Zugang zu Informationen eine höhere Priorität einzuräumen.

Davon ausgehend, dass der Mensch automatisierten Katalog- und Suchsystemen überlegen ist, soll dem Nutzer ein qualitiv besseres, verdichtetes Suchergebnis zur Verfügung gestellt werden. Dies soll mit dem Slogan Humans do it better zur Abgrenzung von automatisierten Suchmaschinenkonzepten ausgedrückt werden.

Allerdings wird auch beim ODP die mangelhafte Aktualität und lange Bearbeitungsdauer kritisiert. Die Verzögerung bei der Aufnahme ähnelt in vielen Kategorien jener, die früher bei Yahoo üblich war. Dies liegt daran, dass die Editorengemeinschaft mit dem Wachstum des Internet nur mühsam Schritt halten kann und daher in zahlreichen Kategoriezweigen Editoren fehlen, um die Vielzahl der Anmeldungen zu bearbeiten.

Nachahmer[Bearbeiten]

Die Idee inspirierte mindestens zwei weitere Webverzeichnisse, welche ebenfalls von privaten Unternehmen finanziert und von freiwilligen Editoren bearbeitet wurden: Das Go-Verzeichnis (ehemals betrieben von Disney) und Zeal (gekauft von LookSmart). Beide sind mittlerweile eingestellt. Keines dieser Verzeichnisse veröffentlichte seine Daten jedoch als Open Content.

Struktur[Bearbeiten]

Das Open Directory Project baut auf einer klassifizierten Baumstruktur im Hypertext-System auf. Vom Ursprung aus gesehen werden Kategorien thematisch oder regional abgeleitet und bis in die Unterkategorien in 89 Sprachen und Dialekten (Stand Juni 2014) vererbt. Jeder Eintrag kann so nach der höchsten Relevanz für ein Thema oder eine Region in einer passenden Kategorie zugeordnet werden. Auch Mehrfacheinträge sind möglich, wenn sie an mehreren Stellen relevant sind.

Datennutzung[Bearbeiten]

Die ODP-Inhalte sind kostenlos und ungehindert öffentlich zugänglich. Zusätzlich wird ein kostenfreies Nutzungsrecht zur Weiterverbreitung als komplette oder auszugsweise Veröffentlichung gewährt.[3] Die Daten stehen dafür in einer frühen Form des RDF-Formats zum Download zur Verfügung. Es erscheint in der Regel wöchentlich eine neue Version. Die Daten des in sich abgeschlossenen ODP Sets (Dump) enthalten sowohl die URL-Einträge als auch die Verzeichnisstruktur inklusive der Verlinkung zwischen Kategorien.

Die Weiterverbreitung der Daten erfolgt zu Open-Directory-Project-Lizenzbedingungen. Diese sehen eine sichtbare ODP-Quellenangabe mit Links für das Vorschlagen neuer Einträge und für die Bewerbung zur Mitarbeit beim ODP auf jeder einzelnen Seite vor, die Inhalte des ODP beinhaltet.[4] Aufgrund dieser Regelung wurden und werden die Inhalte vielfach von anderen Seiten übernommen. Unter anderem nutzte auch Google bis 2011 die Daten des Dmoz für sein eigenes Webverzeichnis.[5]

Editoren[Bearbeiten]

Das ODP bezeichnet sich als ein Projekt ehrenamtlicher Redakteure, die im Internet veröffentlichte Informationen systematisch katalogisieren und öffentlich zur Verfügung stellen. Jeder Internetnutzer kann Editor werden. Die Mitarbeit in der Freizeit ist aber nicht verpflichtend und nicht an feste Zeiten gebunden. Editoren sind immer nur für bestimmte Kategorien und Zweige zuständig. Hierzu werden möglichst viele verschiedene Editoren, mit jeweils besten Kenntnissen auf einem Spezial- und Interessengebiet, im Konsens betraut.

Trotz der Möglichkeit Seiten vorzuschlagen wächst das Verzeichnis überwiegend durch eigene Recherchen von Editoren. Dazu gehören auch Querschnittstätigkeiten, wie die Anlage neuer Unterkategorien, das Verschieben von Einträgen in passendere Kategorien und die Aktualisierung von Einträgen und Kommentaren.

Die Editorengemeinschaft baut auf

  • den öffentlich zugänglichen Richtlinien
  • Vertrauen auf Kompetenz, Verantwortung und Zuverlässigkeit des Einzelnen
  • einem Mehraugenprinzip, mit gegenseitiger Abstimmung von Zweifelsfällen und bei der Einarbeitung neuer Editoren
  • Hilfestellung von übergeordneten Editoren (Metaeditoren) und Administratoren

auf. Neben der Pflege des bestehenden Datenbestandes umfasst die Tätigkeit von Editoren vornehmlich die Veröffentlichung neuer Einträge in der von ihnen bearbeiteten Kategorie.

Das Bewerbungsverfahren als neuer Editor oder um neue Kategorien und Erweiterung der Editierrechte umfasst drei Beispiellinks und Beschreibungen sowie Fragen zum Themenbezug.[6] Qualität und Verhinderung von Missbrauch spielen, auch wegen der Abgabe der Daten in offener Lizenz an weitere Datennutzer, eine übergeordnete Rolle.

So wie Editoren auch von ihren Rechten zurücktreten und das ODP verlassen können, können aktive Editoren bei Verstößen gegen die Richtlinien wegen Missbrauch, Unzuverlässigkeit und unverantwortlichem Verhalten kurzfristig aus dem Projekt ausgeschlossen werden.

Datenaufnahme und Pflege[Bearbeiten]

DMOZ-Einträge umfassen einen kurzen Titel (i.d.R. Bezeichnung der Website oder Firma) und eine Kurzbeschreibung zu Inhalt, Angebot und Besonderheiten einer Website.

Die Aufnahmekriterien sind seit Beginn des Verzeichnisses unverändert. Zum Eintrag soll ein informatives, zuordnungsfähiges, seriöses und relevantes Informationsangebot mit eigenen Inhalten einer Website kommen. Der Informationsgehalt einer Website bestimmt sich nach dem Grad eigener Inhalte im Verhältnis zu Werbung (Banner, Adwords, Adlinks), fremd eingebundenen Seiten und kopierten Informationen aus anderen Seiten. Gewaltverherrlichende, rassistische, pornografische und zu kriminellen Handlungen auffordernde Websites werden nicht aufgenommen bzw. aus dem Datenbestand entfernt.[7]

Zusätzlich gibt es eine Reihe von Mechanismen und Werkzeugen, die auf eine Verbesserung von Datenqualität und Relevanz von Kategorien sowie Ausschluss von Missbrauch einwirken sollen. Dafür steht in jeder Kategorie ein Formular für externe Aufnahmevorschläge, eines für Aktualisierungswünsche bestehender Einträge und eines zur Überprüfung eines Missbrauchsverdachts (durch Metaeditoren) zur Verfügung.

Ergänzend zur Arbeit der Editoren wird der eigene Webcrawler namens Robozilla in Zeitabständen über alle im Verzeichnis gelisteten Einträge geschickt, um tote, beeinträchtigte oder verdächtige Links zu finden. Robozilla entfernt sie vorübergehend aus dem Verzeichnis und markiert sie zur Prüfung durch Editoren, die weitergehende Maßnahmen ergreifen können.

Einträge abgelaufener Domains werden inzwischen weitgehend automatisch aus dem Verzeichnis entfernt, um die Aktualität zu gewährleisten und falsche oder irreführende Inhalte durch Hijacking und „Parking“ von Internetadressen zu verhindern.

Im Laufe der Zeit nahm die Zahl der von Netscape bzw. AOL kontinuierlich für das Projekt abgestellten festen Mitarbeiter ab. Dies wurde kompensiert durch eine Reihe Tools, die von Editoren geschaffen und qualifiziert in Absprache mit der Administration eingeführt wurden. Um sich die Arbeit zu vereinfachen wurden Linkprüfer, spezialisierte Webcrawler, Rechtschreibprüfer, verbesserte Suchmaschinen und eine Reihe von Bookmarklets für Bearbeiter erstellt.

Ausgliederungen[Bearbeiten]

Im Laufe der Jahre haben Editoren eine Reihe verwandter Projekte autonom gestartet, die teilweise auf der auch vom ODP genutzten Software basieren. Keines davon war jedoch bislang so erfolgreich wie das ODP selbst.

Eines dieser Projekte ist als Verzeichnis im Verzeichnis direkt ins ODP integriert: Der Zweig für Kinder und Jugendliche, kidmoz. Dort werden ausgewählte Sites speziell für die Zielgruppe Kinder und Jugendliche mit passenden Beschreibungen sowie Altersangaben versehen und gelistet. Organisatorisch ist dieser Teil des Verzeichnisses relativ unabhängig, auch wenn die Richtlinien für beide Verzeichnisse gelten und eine Reihe von Editoren in beiden Verzeichnissen aktiv sind. Gegründet wurde es im November 2000.[8]

Ein weiteres, auf das Sammeln aller mit Musik und Musikern zusammenhängenden Daten spezialisiertes Projekt ist MusicMoz. Dieses existiert derzeit nur auf Englisch, ein deutschsprachiger Zweig ist jedoch in Vorbereitung.

Daten und Fakten[Bearbeiten]

Anzahl der Einträge im deutschsprachigen Teil des ODP

Am 31. Januar 2014 verzeichnete das ODP über 4,2 Millionen Einträge (knapp 500.000 davon im deutschsprachigen Teil des Katalogs) in über 1.000.000 Kategorien sortiert. Seit der Gründung des Projektes haben mehr als 89.000 Editoren zum Wachstum des Verzeichnisses beigetragen. Seit dem Software-Release 2.1.2 (Anfang 2014) werden die Anzahl der eingetragenen Sites, der Editoren und der Kategorien in Echtzeit angezeigt.

Grundlage für die Aufnahme und Pflege von Einträgen sind die öffentlich zugänglichen Richtlinien und Hinweise und ob eine Seiteninformation für das Thema sinnvoll und eine wertvolle Ergänzung ist.[7]

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. dmoz.org
  2. Slashdot: The GnuHoo BooBoo
  3. Gesellschaftsvertrag von Netscape mit Selbstverpflichtungen gegenüber der Web-Community
  4. Open Directory License
  5. Herbert Braun: Google schließt seine Labs. In: Heise Developer. 21. Juli 2011, abgerufen am 30. Juli 2011: „Zugleich machte Google seinen Webkatalog Google Verzeichnis stillschweigend dicht. Dieser bereits vor elf Jahren als Konkurrenz zum Yahoo-Katalog gestartete Dienst wertete Daten aus Netscapes dmoz-Verzeichnis mit einem Ranking innerhalb der Rubriken auf.“
  6. Fragen und Antworten zur Bewerbung als Editor beim Open Directory Project
  7. a b Open Directory: Editierrichtlinien
  8. Newsletter März 2001 mit Vorstellung des neuen Projekts