Informationsqualität

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Datenqualität)
Wechseln zu: Navigation, Suche

Informationsqualität ist das Maß für die Erfüllung der „Gesamtheit der Anforderungen an eine Information bzw. ein Informationsprodukt, die sich auf deren Eignung zur Erfüllung gegebener Informationsbedarfe beziehen“.[1] Aussagen zur Qualität einer Information beziehen sich zum Beispiel darauf, wie genau diese die Realität ‚beschreibt‘ oder wie verlässlich sie ist, inwieweit sie also als Grundlage für eine Planung des eigenen Handelns verwendbar ist.

Der Begriff Datenqualität (als Qualitätsmaß für Daten) steht der ‚Informationsqualität‘ sehr nahe. Da die Grundlage für Informationen ‚Daten‘ sind, wirkt sich die ‚Datenqualität‘ auf die Qualität der Informationen aus, die aus den entsprechenden Daten gewonnen werden: Keine „gute“ Information aus schlechten Daten.

Definitionen[Bearbeiten]

Die Informationsqualität muss von der reinen Bedeutsamkeit (der Semantik) und vom formalen Informationsgehalt (der statistischen Signifikanz) unterschieden werden.

Es gibt eine große Zahl von Qualitätskriterien, deren Bedeutung vom Kontext und der Verwendung von Informationen und den diesen zugrunde liegenden Daten abhängt. Typische, häufig verwendete Qualitätskriterien sind Korrektheit, Vollständigkeit, Relevanz, Konsistenz und Aktualität (besonders im Nachrichtenwesen).

Die IQ-Community (Information Quality) betrachtet die Qualität von Informationen (nach Richard Y. Wang[2]) nach folgenden Kategorien und Dimensionen:

  1. Informationszugang:
    Systemzugang, Zugangssicherheit
  2. Darstellung:
    Interpretierbarkeit, Verständlichkeit, Manipulationsfähigkeit, Integrität und Widerspruchsfreiheit
  3. Informationszusammenhang:
    Relevanz, Zusatznutzen, Aktualität, Vollständigkeit, Informationsumfang
  4. Eigenwert (inhärente bzw. intrinsische Dimension):
    Richtigkeit, Objektivität, Glaubwürdigkeit, Reputation

Die Deutsche Gesellschaft für Informations- und Datenqualität (DGIQ) hat auf Basis des Bewertungssystems von Richard Y. Wang eine deutsche Übersetzung vorgeschlagen. Sie empfiehlt, diese im deutschen Sprachraum einheitlich zu verwenden. Eine grafische Übersicht der 15 IQ-Dimensionen kann auf der Seite der DGIQ abgerufen werden.[3][4].

Zur Optimierung der Informationsqualität in Informationssystemen wird die Qualität einzelner Datenquellen mittels einer Kostenfunktion anhand verschiedener Kriterien bewertet. Anhand von Präferenzen über die Qualitätskriterien kann eine Anfrage an das Informationssystem so optimiert werden, dass die Antwort eine möglichst hohe Informationsqualität besitzt!

Informationsqualität kann sich, ebenso wie ein allgemeiner Qualitätsbegriff, auf verschiedene Vorstellungen beziehen (nach der klassischen Einteilung von Garvin)[5]

  • produktbezogen; hier wird die Qualität als inhärente Eigenschaft betrachtet;
  • anwenderbezogen; die Nutzung des Produkts definiert die Qualität;
  • prozessbezogen; die Einhaltung der Spezifikation wird gewährleistet;
  • wertbezogen; erstellt einen Bezug beispielsweise zwischen Preis und Qualität.

Eine schlechte Informationsqualität kann weitreichende Folgen haben, wenn sie nicht frühzeitig erkannt wird. Beispiele:

  • Hotelreservierungen werden nicht gefunden wegen falsch geschriebener Namen.
  • Auf Grund unvollständiger Adressangaben werden Rechnungen an falsche Personen geschickt.
  • Wegen Übersetzungsfehlern werden aus Milliardenbeträgen ('billion') Billionenbeträge.
  • Schlechte Kreditwürdigkeit durch Scoring-Verfahren wegen falscher Ausgangsdaten.


Qualitätskriterien für Datenqualität unterscheiden sich von denen für Informationsqualität und sind nach [6]:

  • Korrektheit: Die Daten müssen mit der Realität übereinstimmen.
  • Konsistenz: Ein Datensatz darf in sich und zu anderen Datensätzen keine Widersprüche aufweisen.
  • Zuverlässigkeit: Die Entstehung der Daten muss nachvollziehbar sein.
  • Vollständigkeit: Ein Datensatz muss alle notwendigen Attribute enthalten.
  • Genauigkeit: Die Daten müssen in der jeweils geforderten Exaktheit vorliegen (Beispiel: Nachkommastellen).
  • Aktualität: Alle Datensätze müssen jeweils dem aktuellen Zustand der abgebildeten Realität entsprechen.
  • Redundanzfreiheit: Innerhalb der Datensätze dürfen keine Dubletten vorkommen.
  • Relevanz: Der Informationsgehalt von Datensätzen muss den jeweiligen Informationsbedarf erfüllen.
  • Einheitlichkeit: Die Informationen eines Datensatzes müssen einheitlich strukturiert sein.
  • Eindeutigkeit: Jeder Datensatz muss eindeutig interpretierbar sein.
  • Verständlichkeit: Die Datensätze müssen in ihrer Begrifflichkeit und Struktur mit den Vorstellungen der Fachbereiche übereinstimmen.

Maßnahmen zur Verbesserung der Datenqualität werden u. a. Datenbereinigung genannt.

Bedeutung in unterschiedlichen Bereichen[Bearbeiten]

Statistik[Bearbeiten]

Eurostat definiert Datenqualität nach folgenden Gesichtspunkten:[7]

  • Relevanz der statistischen Konzepte (relevance): Benutzer, user needs, Gliederungstiefe und Gegenstand
  • Genauigkeit der Schätzergebnisse (accuracy & reliability):
  • Aktualität und Pünktlichkeit der Datenbereitstellung (timeliness & punctuality): Zeitpunkt und Dauer der Datengewinnung bis zur Publikation
  • Kohärenz & Vergleichbarkeit von Statistiken (coherence & comparabilty): Vorläufige und endgültige Statistik, jährliche und unterjährige

Statistik bzw. Regionen, Teilgruppen, Zeit

  • Zugänglichkeit und Klarheit der Informationen (accessibility & clarity): Publikation der Daten, Methodenbericht, Vollständigkeit (nicht Teil des Code of Practice)

Natur- und Gesellschaftswissenschaften[Bearbeiten]

In den Natur- und Gesellschaftswissenschaften spricht man besonders in Bezug auf Messungen und Erhebungen von Datenqualität. Dabei spielen vor allem Störeinflüsse, die Präzision der Messung und die Größe der Datenbasis, also die Anzahl der Messungen bzw. Befragungen, eine Rolle: Je weniger mögliche Störeinflüsse es gibt, je präziser die Messung und je größer die Anzahl der Messungen ist, desto genauer bilden die resultierenden Daten die Realität ab und desto besser ist damit die Datenqualität. Wichtig ist es dabei, zu bedenken, dass eine gute Datenqualität allein nicht ausreicht, um ein gutes Modell zu konstruieren: hierfür muss auch die Interpretation der Daten insbesondere in Bezug auf die Kausalität korrekt sein.

Nachrichtenagenturen und Nachrichtendienste[Bearbeiten]

Der Zweck von Nachrichtenagenturen und Geheimdiensten ist es, Informationen von möglichst guter Qualität zu sammeln und zur Verfügung zu stellen. Dabei ist es vor allem entscheidend, dass aus der Menge der zur Verfügung stehenden Daten diejenigen ausgewählt werden, die für die Klientel relevant sind, und dass diese in eine konsistente Form gebracht werden, ohne die Aussage zu verzerren. Insbesondere sollen Irrtümer und Fehlinformationen ausgeschlossen werden, häufig indem Nachrichten anhand mehrerer Quellen überprüft werden.

Wirtschaft[Bearbeiten]

In der Wirtschaft ist Informationsqualität von zentraler Bedeutung, da auf Basis von Informationen z. B. Entscheidungen gefällt, Markt-Chancen bewertet und Verhandlungen geführt werden. All das kann nur so gut sein wie die zugrunde liegenden Daten bzw. Informationen. Oft wird der Begriff Datenqualität oder auch unternehmensweite Datenqualität als Synonym für ‚Informationsqualität‘ verwendet; datenbezogene Qualität bezieht sich jedoch lediglich auf die gespeicherten Inhalte von Daten, während ‚Informationsqualität‘ zusätzliche Aspekte wie zweckmäßiges Auswählen geeigneter Datenmengen, das Bilden von (Teil-) Summen und/oder deren Darstellung einschließt.

Vielschichtiger Begriff[Bearbeiten]

Umgangssprachlich wird der Begriff 'Informationsqualität' häufig mit 'hohe Qualität' gleichgesetzt. Dies ist jedoch nur bedingt korrekt und bedarf - ähnlich wie bei anderen Qualitätsbegriffen (z. B. Software-, Wasser-, Klangqualität) oder wertenden Aussagen (wie schnell, hell, laut) - zur zuverlässigen Qualitätsbestimmung einer relativierenden Betrachtung: Der Anwendungskontext bestimmt, welche Qualitätskriterien (als allgemeiner Rahmen) relevant sind und welche konkreten Anforderungen je Kriterium gestellt werden. Der Erfüllungsgrad dieser Anforderungen durch die jeweilige Information ergibt - in Summe – deren Informationsqualität. Die Qualität einer Information ist also immer kontext- und nutzerabhängig,[1] niemals 'isoliert für sich selbst' zu beurteilen.

Anwendungskontext[Bearbeiten]

Bezugspunkt ist die ‚Information‘, für die die Qualitätsaussage gelten soll.

  • Worüber wurden Informationen gewünscht/erwartet?
  • Welche Details werden konkret erwartet? Nur konkret Festgelegtes kann überprüft werden. "Alles über ..." ließe sich kaum bewerten.
  • Für welche Information ist die Qualität zu bestimmen? Was wurde konkret geliefert?
  • Für welche(n) Nutzer ist die Information bestimmt? Sprache, Wissensstand (Laien, Spezialisten)?
  • Welchem Zweck dient die Information? "interessiert nur", Kaufentscheidung, brauche Hilfe
  • wie bedeutend ist dieser Zweck? Entstehende Kosten, beabsichtigte Investitionshöhe, lebenswichtig
  • welche Bedeutung kommt dabei der Informationsqualität zu? Was geschieht in Abhängigkeit von hoher oder minderer Qualität? Bei welchen Qualitätskriterien?

Qualitätskriterien und ihre Relevanz[Bearbeiten]

Die Informationsqualität ergibt sich aus der Überprüfung bzw. der Erfüllung relevanter Kriterien. Nohr[1] verwendet die folgenden „Dimensionen der Qualität“ (*):

  • die Aufgabenrelevanz und Zweckorientiertheit der Information: verständlich? passend zur Erwartung?
  • der Grad der Sicherheit, wahr zu sein
  • die Glaubwürdigkeit aufgrund vorhandener Erfahrungen
  • die Überprüfbarkeit der Information: Welche Quellen sind bekannt? Sind diese zuverlässig?
  • die Genauigkeit der Information: Ist sie vollständig? Dieses Kriterium ist oft nur schwierig zu überprüfen. Ist sie widerspruchsfrei?
  • und die Aktualität der Information

(*) Bewertungskriterien für die Informationsqualität werden uneinheitlich angewendet. Nohr[1] stellt dazu fest: „An Kriterien und Bewertungsmaßstäben für die Qualität von Information besteht ein als gravierend empfundener Mangel.“ Mit Bezug auf „Rolph/Bartram 1994“ verweist er auf von britischen Managern verwendete Kriterien: Sie „bewerteten die ihren Entscheidungen zugrunde liegende Informationsqualität hinsichtlich einer acht Kriterien umfassenden Qualitätsskala insgesamt als eher unzureichend (1= poor, 5= high)“: Richtigkeit 3.64, Glaubwürdigkeit 3.31, Darstellung 3.18, Aktualität 3.07, Vollständigkeit 2.88, Sichtbare Schwerpunkte 2.84, Sachdienlichkeit 2.80, brauchbares Format 2,80.

Derartige Fragestellungen bedürfen je nach Kontext, in dem die Information benutzt und ihre Qualität festzustellen ist, einer mehr oder weniger ausführlichen Überprüfung. Dabei sind u. U. weitere Recherchen erforderlich – die wiederum neue Informationen (mit eigener 'Informationsqualität') liefern.

Bedeutungskontext[Bearbeiten]

Eine wertende Aussage zur Info-Qualität ist demnach pauschal und undifferenziert nicht möglich, sondern kann sich stets nur aus dem Erfüllungsgrad der (relevanten) Anforderungen ableiten. Defizite bzw. Lücken stellen Risiken dar, die umso höher sind, je bedeutender der Anwendungskontext ist und je bedeutender die potenziellen Auswirkungen dieser Defizite sind. Unter Umständen müssen die Anforderungen/Erwartungen an die Informationsqualität deshalb priorisierend/gewichtet betrachtet werden. Für Informationen mit hoher Bedeutung können dazu zum Beispiel besondere Wertungs- und Dokumentationsverfahren (wie Scoring) benutzt werden.
Im Umkehrschluss treten bei einem wenig(er) wichtigen Kontext (etwa „es interessiert mich nur“) solche Überlegungen in den Hintergrund; einer Information, deren Aktualität (z. B.) nicht bekannt ist, könnte – in dieser Hinsicht – ‚gute Qualität‘ attestiert werden, wenn dieses Kriterium nicht wichtig oder nicht relevant ist; denn die (definierten) Anforderungen wären erfüllt. Die Informationsqualität mag in einfachen Situationen oft nur pauschal, ‚aus dem Gefühl heraus‘ beurteilt werden; das Urteil basiert dann auf einer intuitiven Abschätzung gewisser Einzelkriterien, ist nur bedingt sicher und kann in diesem Szenario nicht begründet werden.

Sonstige Dimensionen[Bearbeiten]

In der Literatur sind im Zusammenhang mit Informationsqualität weitere Unterscheidungen anzutreffen:

  • Aussagen zur Informationsqualität sind als Wertung zu einer konkreten Information möglich, aber auch als Zielvorgabe für eine potenziell erwartete oder herzustellende Information - wobei besonders hier die qualitätsbestimmenden Kriterien präziser zu definieren sind.
  • Mit ähnlicher Bedeutung unterscheidet Nohr[1] zwischen konstruktiver (= Qualität bei der Produktion von Informationen) und rezeptiver (= Prüfung extern bezogener Informationen) Informationsqualität.
  • Im Hinblick auf die der Qualität zugrundeliegenden Anforderungen lässt sich nach nutzerspezifischen oder allgemeingültigen Anforderungen unterscheiden.[1]

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

  • Jürgen Bode: Der Informationsbegriff in der Betriebswirtschaftslehre. In: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung, 49. Jg., Nr. 5, S. 449-468, 1997.
  • Larry P. English: Improving Data Warehouse and Business Information Quality: Methods for Reducing Costs and Increasing Profits. New York: John Wiley & Sons, 1999.
  • Martin Eppler: Managing Information Quality: Increasing the Value of Information in knowledge-intensive Products and Processes. 2nd revised and extended Edition, New York/Berlin: Springer, 2006. ISBN 978-3540314080
  • Gernot Gräfe: Informationsqualität bei Transaktionen im Internet. Wiesbaden: Dt. Univ.-Verl., 2005.
  • Knut Hildebrand, Marcus Gebauer, Holger Hinrichs, Michael Mielke (Hrsg.): Daten- und Informationsqualität: Auf dem Weg zur Information Excellence, Vieweg+Teubner Verlag, Wiesbaden 2008, ISBN 978-3-8348-0321-4
  • Holger Hinrichs: Datenqualitätsmanagement in Data Warehouse-Systemen, Oldenburg 2002 (online PDF)
  • Thomas C. Redman: Data Quality for the Information Age. Boston: Artech House, 1996.
  • Richard Wang, Diane Strong: Beyond Accuracy: What Data Quality Means to Data Consumers. In: Journal of Management Information Systems, Bd. 12, Nr. 4, S. 5-33, 1996.
  • Holger Nohr, Management der Informationsqualität, Arbeitspapiere Wissensmanagement, Fachhochschule Stuttgart, Nr. 3/2001, ISSN 1616-5349 (Internet, PDF), ISSN 1616-530 (Print)
  • Carsten Kraus, Adress- und Kundendatenbanken für das Direktmarketing, Verlag Business Village, Göttingen 2004, ISBN 3-934424-59-7
  • Volker Würthele, Datenqualitätsmetrik für Informationsprozesse, Department of Computer Sciences, Abteilung Informationssysteme, Eidgenössische Technische Hochschule (ETH) Zürich, Verlag Books on Demand GmbH, Norderstedt 2003, ISBN 3833403454, (online PDF)
  • Jan Rutenberg: Der Einfluss der Informationsqualität und -menge auf die Mental Convenience in Kaufentscheidungen. Verlag Dr. Kovač, Hamburg 2008, ISBN 978-3-8300-3696-8.

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. a b c d e f Prof. Holger Nohr FH Stuttgart Management der Informationsqualität [1] (PDF; 102 kB)
  2. MIT Total Data Quality Management (TDQM). Abgerufen am 1. September 2014.
  3. Deutsche Gesellschaft für Informations- und Datenqualität - Graphische Übersicht der 15 IQ-Dimensionen (Version vom 1. September 2014 im Internet Archive)
  4. Die DGIQ legt eine anwenderbezogene Definition für 15 IQ-Dimensionen vor. Abgerufen am 1. September 2014.
  5. David A. Garvin, What Does "Product Quality" Really Mean?, In: Sloan Management Review, 1984, Jahrgang 26, Heft 1, S. 25-43
  6. Martin Bayer in Gute Daten - schlechte Daten in Computerwoche 24. Jan. 2011 [2] (PDF, 515 kB)
  7. Vorlage:Internetquelle/Wartung/Zugriffsdatum nicht im ISO-FormatMethodological Documents: Definition of Quality in Statistics. In: epp.eurostat.ec.europa.eu. Working Group "Assessment of quality in Statistics", abgerufen am 3. Dezember 2013.