Ontologie (Informatik)

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Ontologien in der Informatik sind meist sprachlich gefasste und formal geordnete Darstellungen einer Menge von Begrifflichkeiten und der zwischen ihnen bestehenden Beziehungen in einem bestimmten Gegenstandsbereich. Sie werden dazu genutzt, „Wissen“ in digitalisierter und formaler Form zwischen Anwendungsprogrammen und Diensten auszutauschen. Wissen umfasst dabei sowohl Allgemeinwissen als auch Wissen über sehr spezielle Themengebiete und Vorgänge.

Ontologien enthalten Inferenz- und Integritätsregeln, also Regeln zu Schlussfolgerungen und zur Gewährleistung ihrer Gültigkeit. Ontologien haben mit der Idee des semantischen Webs in den letzten Jahren einen Aufschwung erfahren und sind damit Teil der Wissensrepräsentation im Teilgebiet Künstliche Intelligenz. Im Unterschied zu einer Taxonomie, die nur eine hierarchische Untergliederung bildet, stellt eine Ontologie ein Netzwerk von Informationen mit logischen Relationen dar.

In Veröffentlichungen wird meist von einer „expliziten formalen Spezifikation einer Konzeptualisierung“ (Begriffsbildung)[1] gesprochen.

Zweck[Bearbeiten]

Ontologien dienen als Mittel der Strukturierung und zum Datenaustausch, um

  • bereits bestehende Wissensbestände zusammenzufügen
  • in bestehenden Wissensbeständen zu suchen und diese zu editieren
  • aus Typen von Wissensbeständen neue Instanzen zu generieren.

Die meisten bekannten Anwendungen kennen keine individuellen Instanzen und beschränken sich auf wissenschaftliche Zwecke zur Systematisierung der Nutzung von Begriffsräumen. Ontologien sind bekannt für genetische Daten in der Bioinformatik oder räumliche Information in der Geosemantik.

Neue Anwendungen sind zu erwarten, wenn die Ontologien als Typen zur Instantiierung von individuellen Informationskonzepten verwendet werden, beispielsweise in der Humanmedizin für die fallspezifische medizinische Dokumentation, die Patientenakte. Bereits entwickelte Anwendungen in der Humanmedizin stellen bisher keine Verbindung zwischen bekannten Klassifikationssystemen der klinischen Praxis her. Stattdessen binden sie bislang lediglich an einzelne Klassifikationen für wissenschaftliche Arbeit an.

Experimente zur gewinnbringenden Nutzung von Ontologien in betriebswirtschaftlicher Anwendungssoftware wurden von SAP veröffentlicht.[2]

In der Brückenfunktion zwischen verschiedenen Klassifikationen und zu benachbarten Begriffswelten liegt die Stärke ontologischer Konzepte: Sie erlauben das Ablösen der konzeptionellen Arbeit von festen Textvorlagen und Textbausteinen und den Übergang zu wechselnden Zusammenstellungen halbfertig formulierter Texte zum Abfassen individueller Texte.

Aufbau von Ontologien[Bearbeiten]

Analog zu einer Datenbank, in der Struktur (Datenbankschema) und Inhalt (Daten) ein Ganzes bilden, gehören auch bei einer Ontologie die Regeln und die Begriffe zusammen. Während klassische Datenbanken keine Informationen über die Bedeutung der gespeicherten Daten haben, besitzen Ontologien eine formale Beschreibung der Daten sowie Regeln über deren Zusammenhang. Diese Regeln erlauben es, Rückschlüsse aus den vorhandenen Daten zu ziehen, Widersprüche in den Daten zu erkennen und fehlendes Wissen selbstständig aus dem Vorhandenen zu ergänzen. Diese Rückschlüsse werden durch Inferenz abgeleitet, also durch logisches Folgern.

Unter „Ontology learning“ (vielleicht mit „ontologisches Lernen“ zu übersetzen) kann der Prozess beschrieben werden, bei dem eine Ontologie durch automatische Verfahren weiteres Wissen akquiriert und dadurch an Umfang und Struktur zunimmt. Dafür spielen Inferenzen eine wichtige Rolle. In diesem Prozess wird Wissen durch einen automatisierten Prozess erzeugt, während Ontologien sonst durch Eingaben menschlicher Experten Wissen hinzugewinnen.

Von der Möglichkeit von Relationen über Relationen (in RDF als Reifikation bezeichnet) und Regeln wird unter anderem aufgrund ihrer Komplexität in der Praxis relativ selten Gebrauch gemacht, obwohl gerade diese Merkmale Ontologien von anderen Begriffssystemen unterscheiden.

Bestandteile[Bearbeiten]

  • Begriffe: (im Englischen: „concepts“, manchmal mit dem falschen Freund „Konzepte“ übersetzt): Die Beschreibung gemeinsamer Eigenschaften wird als Begriff definiert (z. B. „Stadt“ oder „Land“). Begriffe werden auch als Klassen bezeichnet. Diese können in einer Klassenstruktur mit Über- und Unterklasse angeordnet werden.
  • Typen: Typen repräsentieren Objekttypen in der Ontologie und stellen die zur Verfügung stehenden Typen in Klassen dar. Diese werden anhand vorher definierter Begriffe erzeugt und als Types bezeichnet (z. B. Stadt als Instanz des Begriffs topologisches Element der Klasse Punkte oder Fluss als Instanz des Begriffs topologisches Element der Klasse Linien)
  • Instanzen: Instanzen repräsentieren Objekte in der Ontologie und stellen das zur Verfügung stehende Wissen dar. Diese werden anhand vorher definierter Begriffe erzeugt und auch als Individuals bezeichnet (z. B. München als Instanz des Begriffs topologischer Ort vom Typ Stadt oder Deutschland als Instanz des Begriffs topologischer Ort vom Typ Land).
  • Relationen: Instanzen gleichen Typs müssen an verschiedene Gegebenheiten angepasst werden. Dazu werden Relationen verwendet, die beschreiben, welche Beziehungen zwischen den Instanzen bestehen (z. B. Stadt München liegt in Land Deutschland). Relationen werden auch als Eigenschaften bezeichnet.
  • Vererbung: Es ist möglich, Relationen und Eigenschaften der Begriffe zu vererben. Dabei werden alle Eigenschaften an das erbende Element weitergegeben. Mehrfachvererbung bei Begriffen ist grundsätzlich möglich. Durch den Einsatz von Transitivität können Instanzen in einer Bottom-Up-Hierarchie aufgebaut werden. Dabei spricht man von Delegation.
  • Axiome: Axiome sind Aussagen innerhalb der Ontologie, die immer wahr sind. Diese werden normalerweise dazu verwendet, Wissen zu repräsentieren, das nicht aus anderen Begriffen abgeleitet werden kann (z. B. "Zwischen Amerika und Europa existiert keine Zugverbindung.").

Ontologietypen[Bearbeiten]

Grundsätzlich unterteilt man Ontologien in zwei Typen:

  • lightweight-Ontologien beinhalten Begriffe, Taxonomien und Beziehungen zwischen Begriffen und Eigenschaften, welche diese beschreiben.
  • heavyweight-Ontologien sind eine Erweiterung von lightweight-Ontologien und fügen diesen Axiome und Einschränkungen hinzu, wodurch die beabsichtigte Bedeutung einzelner Aussagen innerhalb der Ontologie klarer wird.

Ontologie-Erstellung[Bearbeiten]

Eine Ontologie ist abhängig davon, von wem sie eingesetzt wird. Beispielsweise kann es bei einer Ontologie über Weine für ein Restaurant wichtig sein, auch passende Speisen zu den Weinen in der Ontologie aufzunehmen. Ist der Benutzer dagegen ein Weinabfüller, dürfte der Bereich der Speisen völlig uninteressant sein. Dagegen ist es für den Abfüller wichtig, welche verschiedenen Kork- und Flaschensorten existieren.

Zur Erstellung und Erweiterung von Ontologien wurden verschiedene formalisierte Prozessabläufe vorgeschlagen. Die Verfahren nach Holsapple und Joshi, nach Gómez-Pérez oder Uschold widmen sich verstärkt der Zusammenarbeit von Experten des Wissensgebietes der Ontologie und Informatikern oder allgemeiner Formalisten. Automatisch unterstützende Verfahren haben entweder das Ziel, eine vollständige Konstruktion der Ontologie vorzunehmen (wie etwa das Verfahren von Mädche) oder bestehende Ontologien durch Begriffsvorschläge zu erweitern (beispielsweise das Verfahren von Faatz und Steinmetz). Bei der Erstellung von Ontologien kann auch die Verschmelzung bestehender Ontologien von Interesse sein. Hierzu gibt es ein formales Verfahren nach Stumme und Mädche. Im Projekt „Ontoverse“[3] wird der Ansatz verfolgt, eine Ontologie kollaborativ aufzubauen und als Wiki zu realisieren.

Beispiel-Ontologie[Bearbeiten]

Beispielontologie

Die nebenstehende Abbildung zeigt das Funktionsprinzip einer Ontologie. Die obere Ebene zeigt die Ontologie, die Begriffe und Relationen enthält. Begriffe werden durch Ellipsen dargestellt und Relationen durch Pfeile. Die Rechtecke stellen einfache Container für Informationen dar. Die Relationen verbinden zwei Begriffe miteinander und schränken diese gleichzeitig ein, beispielsweise wird ein Kunstwerk von einem Künstler erzeugt.

Begriffe können zur Vererbung herangezogen werden. Aus diesem Grund besitzen die Maler und Bildhauer ebenfalls die Relationen Name und Vorname. Der dicke Pfeil kennzeichnet die Vererbung. Die beiden Relationen schlägt und malt sowie gemaltVon und geschlagenVon sind vererbte Relationen von erzeugt und hergestelltVon. Die ursprünglichen Relationseigenschaften bleiben dabei erhalten, können jedoch erweitert werden.

Die Relationen malt und gemaltVon besitzen inverse Beziehungen zueinander, wodurch weitere Logik in die Ontologie integriert wird, die es ermöglicht, dass von einem Maler auf seine Kunstwerke und umgekehrt, von einem Bild zum Maler, geschlossen werden kann.

Die untere Ebene der Abbildung zeigt Instanzen der Ontologie. Diese werden durch einen schwarzen Punkt dargestellt. Das Kürzel (I1) steht dabei für den eindeutigen Ressourcennamen der Instanz. Im Semantischen Web wird ein URI zur Kennzeichnung verwendet. Eine Besonderheit besitzt die Instanz des Malers Raffaello Santi. Dieser verwendet bereits existierende Instanzen, nämlich I3 vom Typ Ölzeichnung und I6 vom Typ Galleria dell’Accademia.

Ontologie-Editoren[Bearbeiten]

Hauptartikel: Ontologie-Editor

Verschiedene Software-Werkzeuge unterstützen die Konstruktion von Ontologien in diversen Ontologie-Sprachen.

Ontologiesprachen[Bearbeiten]

Formale Sprachen zur Beschreibung von Ontologien sind unter anderem das RDF-Schema, DAML+OIL, F-Logic, die vom World Wide Web Consortium für das semantische Web propagierte Web Ontology Language (OWL), die Web Service Modeling Language (WSML) und die unter ISO/IEC 13250:2000 normierten Topic Maps. Auch das Knowledge Interchange Format (KIF) wird gelegentlich benutzt.

Geschichte[Bearbeiten]

Ursprünglich ist Ontologie als Lehre vom Seienden eine philosophische Disziplin und Teil der Metaphysik.

Als Vorläufer einer expliziten Formalisierung des Ontologiebegriffs sind Charles S. Peirce und Edmund Husserl zu nennen. Eine formale Sicht auf die philosophische Ontologie hatte auch Alonzo Church 1958[4] sowie Willard Van Orman Quine. Quine hat einen Ontologiebegriff vorgetragen, der mit der Tradition der klassischen Auffassung des Ontologiebegriffs in der Philosophie brach. Nach Quine meint „Sein“: Wert einer gebundenen Variable zu sein.[5] In Unterwegs zur Wahrheit findet sich die These: „Empirisch von Belang sind an einer Ontologie ausschließlich die besagten neutralen Knoten, die sie zur Struktur der Theorie beiträgt.“[6]

Im Bereich der künstlichen Intelligenz wurde der Begriff „Ontologie“ ab Anfang der 1990er Jahre durch einen Artikel von Neches et al.[7] und nachfolgende Publikationen[1] populär.

Von da an hat sich der Begriff „Ontologie“ als explizite Formalisierung ausgebreitet, wurde in der Künstliche-Intelligenz-Forschung verwendet und von der Bioinformatik[8] und weiteren Fächern aufgegriffen.

1999 stellte Tim Berners-Lee im Buch Weaving the Web seine Vision des Semantic Web vor.[9] Vielmals zitiert ist in diesem Zusammenhang auch der Artikel The Semantic Web von Berners-Lee u. a. aus dem Jahre 2001, in dem er auch die Verwendung von Ontologien im Zusammenhang mit dem Semantic Web beschreibt.[10]

Siehe auch[Bearbeiten]

  • Formale Begriffsanalyse. Ontologien im Sinne der Informatik lassen sich mathematisch mit den Mitteln der Formalen Begriffsanalyse darstellen. Es besteht also zwischen beiden Gebieten eine enge Verwandtschaft.
  • Systemtheorie. Während die Ontologie ihren Fokus darauf hat, grundsätzliche Strukturen zu erfassen, bzw. in großen Datenmengen diese Strukturen zu erkennen und abzuleiten, versucht die Systemtheorie zumindest im technischen Bereich auch weitergehende Aspekte solcher Strukturen zu erfassen, z.B. quantitative Aspekte und deren zeitliches Verhalten. Dies geschieht z.B. durch Differentialgleichungssysteme.
  • Ontologie. Der Begriff Ontologie wurde ursprünglich in der Philosophie geprägt, und von der Philosophie entlehnt.

Verweise[Bearbeiten]

Literatur[Bearbeiten]

Grundlegendes zu Ontologie[Bearbeiten]

Biomedizinische Ontologie[Bearbeiten]

Anwendungen[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. a b T. R. Gruber: A translation approach to portable ontologies. In: Knowledge Acquisition, 1993, Band 5, Nummer 2, Seite 199–220, ksl-web.stanford.edu
  2. Daniel Oberle, How ontologies benefit enterprise applications, Semantic Web Journal, IOS Press, 2013. DOI 10.3233/SW-130114 [1]
  3. wwwalt.phil-fak.uni-duesseldorf.de
  4. Ontological Commitment. In: The Journal of Philosophy, 55, S. 1008–1014
  5. Einschlägige Texte sind Von einem logischen Standpunkt, engl. Orig. 1961 und Ontologische Relativität, engl. Orig. 1969
  6. (W. V. O. Quine: Unterwegs zur Wahrheit, §13 Auflösung der Ontologie, Paderborn u. a. 1995, S. 45.). Siehe auch Stellvertreterfunktion
  7. Robert Neches, Richard Fikes, Tim Finin, Thomas Gruber, Ramesh Patil, Ted Senator, William R. Swartout: Enabling technology for knowledge sharing. In: AI Magazine, Band 12, Nummer 3, 1991 isi.edu
  8. M Ashburner, CA Ball, JA Blake, D Botstein, H Butler, JM Cherry, AP Davis, K Dolinski, SS Dwight, JT Eppig, MA Harris, DP Hill, L Issel-Tarver, A Kasarskis, S Lewis, JC Matese, JE Richardson, M Ringwald, GM Rubin, G Sherlock: Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. In: Nat Genet., 2000 May, 25(1), S. 25–29, PMID 10802651
  9. Tim Berners-Lee, Fischetti, Mark: Weaving the Web. HarperSanFrancisco, 1999, ISBN 978-0-06-251587-2, S. chapter 12.
  10. Tim Berners-Lee, James Hendler, Ora Lassila: The Semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. In: Scientific American, 284 (5), S. 34–43, May 2001 (dt.: Mein Computer versteht mich. In: Spektrum der Wissenschaft, August 2001, S. 42–49)