Kataloganreicherung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Mit Kataloganreicherung (englisch catalog enrichment) werden Katalogisate eines Bibliothekskatalogs um weiterführende Informationen ergänzt, die über die reguläre Formal- und Sacherschließung hinausgehen. Das können bloße Bilder eines Buchumschlags sein, aber auch der elektronische Volltext eines Buches.

Beispiele und Formen[Bearbeiten]

Die weiterführenden Inhalte im Rahmen der Kataloganreicherung[1] können unter anderem sein: die Angaben von Inhaltsverzeichnissen (Tables of Content, TOCs), die Einfügung von Inhaltsangaben und Abstracts,[2][3] die Aufnahme von Rezensionen,[4] die Übernahme von Volltexten[5] oder Empfehlungsdiensten.[6] Darüber hinaus können Coverabbildungen eingebunden werden. Eine weitere mögliche Form sind maschinell generierte Deskriptoren [7] auf Grundlage computerlingustistischer und/oder statistischer Extraktions- und Modifikationsverfahren auf Basis digitalisierter oder importierter Texte wie TOC, Abstract, Volltext oder Rezension.[8] Das Tagging,[9] von Nutzern manuell ergänzte freie Deskriptoren oder von Verlagen übernommene Deskriptoren, gehört ebenfalls zu den üblichen Möglichkeiten. Die so genannte Query Expansion,[10] die Erweiterung der Benutzeranfragen durch zusätzliche semantische Ressourcen (Thesaurus, Ontologie,[11] Klassifikation, Taxonomie, Übersetzung und andere Listen) ist eine weitere Option.

Umsetzung und Geschichte[Bearbeiten]

Die Anreicherung kann entweder durch Einbringung der Informationen (Inhaltsverzeichnisse, Inhaltsangaben, maschinell generierte Deskriptoren usw.) in den Katalogeintrag selbst oder durch Verlinkung erfolgen, wobei die verlinkte Quelle entweder auf einem Server der Bibliothek liegt oder von einem externen Anbieter zur Verfügung gestellt wird.

Viele Formen der Kataloganreicherung werden bereits seit mehreren Jahren von Buchhändlern im Internet angewandt. Anfang der 1990er Jahre erweiterte die Universitätsbibliothek Düsseldorf durch die maschinelle Indexierung der Titel und Untertitel die Menge der suchbaren Worte um Grundformen, Komposita-Zerlegung, Synonyme und Schlagworte aus der Deutschen Schlagwortnormdatei. Kataloganreicherung insbesondere mit Inhaltsverzeichnissen und daraus maschinell generierten Deskriptoren ist im deutschsprachigen Raum seit 2002 State-of-the-Art. Die zusätzlichen Inhalte sind in den Katalogsystemen teils über maschinell generierte Deskriptoren abfragbar, teils auch über in den Katalog übertragene meist kurze Texte.

Einige Bibliotheken beziehen die zusätzlichen Inhalte in die Suche bewusst nicht ein, insbesondere weil die meisten Bibliothekssysteme kein Relevance Ranking besitzen und bei eher allgemeinen Begriffen zu große Treffermengen befürchtet werden. Dadurch geht jedoch die Chance verloren, sehr spezifische Fachbegriffe oder z. B. Autoren von Sammelwerken finden zu können, die über maschinelle Indexierung erkannt und extrahiert werden (siehe auch Named Entity Recognition, Information Extraction oder Text Analytics).

Die Entwicklung zum Einsatz von Suchmaschinen additiv oder alternativ zu den OPACs (online public access catalog) der Bibliothekssysteme zeichnet sich klar als Trend ab. Sowohl nationale und internationale Bibliotheksverbundanbieter (wie OCLC mit WorldCat) und die Bibliothekssystemanbieter konkurrieren um Suchlösungen für den Bibliotheksmarkt. Deutscher Pionier ist dandelon.com. Seit 2003 nutzen die Bibliotheken, die gemeinsam dandelon.com als Austauschplattform für Kataloganreicherung aufbauen, diese Datenbank auch als frei zugängliche Suchmaschine, die die Anfrage automatisch gegen zahlreiche Fachthesauri validiert und darüber semantisch um Synonyme, Akronyme, Übersetzungen und Unterbegriffe erweitert und schließlich die Suchergebnisse nach Relevanz sortiert. Die Datenbank kombiniert die Suche in Feldern, die den jeweiligen Bibliothekskatalogen entnommen sind, zusätzlich importierten Daten von Verlagen, darunter vor allem Abstracts und Klappentexte sowie die digitalisierten oder importierten Volltexte bis hin zu ganzen Büchern. Die Suchergebnisse verlinken auf den jeweiligen Bibliotheksdatensatz zurück, wo ein Teil der Titel als E-Books lizenziert und direkt zugänglich sind.

Die deutschen Bibliotheksverbünde vereinbarten 2007 Standards für die Digitalisierung von Inhaltsverzeichnissen und Methoden des Austauschs. Seit 2008 nimmt die Deutsche Nationalbibliothek an der Produktion von Inhaltsverzeichnissen teil.

Man trifft in manchen amerikanischen Verbundkatalogen Inhaltsverzeichnisse (als Content Notes) an, deren Inhalte über die Keyword-Suche auffindbar sind und in denen bei Sammelbänden auch die Namen der Beitragsautoren über die Verfassersuche zur Verfügung stehen. Google geht das Thema noch forcierter an: es arrangiert sich Ende 2008 mit US-Verlagen und Autorenorganisationen bezüglich der Urheberrechte und digitalisiert massenhaft ganze Bibliotheken und die ganzen Werke und verlinkt über OCLC-WorldCat auf die dort registrierten Bibliotheken.

Literatur[Bearbeiten]

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. Vom Katalog zur Bibliothek: Zwischenschritt und Zwischenstand. (PDF; 94 kB)
  2. Guidelines for writing abstracts. (PDF; 19 kB)
  3. What are Structured Abstracts?
  4. Edmund Schalkowski: Rezension und Kritik. UVK-Verlagsgesellschaft, Konstanz 2005. ISBN 3-89669-341-7.
  5. Beispiel: Digitale Volltexte der Universitätsbibliothek Bielefeld
  6. A. Klahold: Empfehlungssysteme: Grundlagen, Konzepte und Systeme. Vieweg+Teubner, Wiesbaden, 2009. ISBN 3-8348-0568-8.
  7. hebis.de (PDF; 63 kB)
  8. vifa-recht.de (PDF; 1,1 MB)
  9. Assoziative Elemente in der Inhaltserschließung: Kataloganreicherung (PDF; 1,4 MB)
  10. An example of query expansion in the interface of the Yahoo! web search engine in 2006
  11. Dissertationsprojekt zum Einsatz von Ontologien und ontologischen Wissensbasen zur Generierung von Query Expansion-Termen