Daten

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 23. November 2015 um 10:55 Uhr durch VÖRBY (Diskussion | Beiträge) (Aussage inkl gelöschter Quellangabe entfernt; trivial). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Zur Navigation springen Zur Suche springen

Unter Daten versteht man im Allgemeinen Angaben, (Zahlen-)Werte oder formulierbare Befunde, die durch Messung, Beobachtung u. a. gewonnen wurden.[1] In der Umgangssprache versteht man darunter Gegebenheiten, Tatsachen, Ereignisse.[2] Daneben existieren in verschiedenen Fachbereichen, wie z. B. der Informatik oder der Wirtschaftstheorie, unterschiedliche – wenn auch meist ähnliche – Definitionen. Eine einheitliche Definition existiert jedoch nicht.[3][4]

Im Datenschutzrecht sind damit im Wesentlichen die personenbezogenen Daten gemeint, d. h. Angaben über natürliche Personen, z. B. das Geburtsdatum oder der Wohnort.

Für die Datenverarbeitung und (Wirtschafts-)Informatik werden Daten als Zeichen (oder Symbole) definiert, die Informationen darstellen und die dem Zweck der Verarbeitung dienen.[5][6]

Die Wirtschaftstheorie beschreibt Daten als diejenigen volkswirtschaftliche Gegebenheiten, die einen wesentlichen Einfluss auf den Ablauf der Wirtschaft haben, selbst dabei aber nicht beeinflusst werden.[5][7]

Die Semiotik definiert Daten als potenzielle Information, siehe dazu semiotisches Dreieck. Hier werden Daten heute in die Sigmatik-Ebene eingeordnet.

Etymologie und Sprachgebrauch

Daten oder zuvor Data sind eigentlich Pluralbildungen von Datum[8], das als Lehnwort aus dem Lateinischen zurückgeht auf datum ‚gegeben‘ (PPP zu lat. dare ‚geben‘) bzw. substantiviert ‚das Gegebene‘.[9] Auf wichtigeren Schriftstücken war in der üblichen Einleitungsformel vermerkt „datum …“ („gegeben (am) …“) mit <Zeitangabe> und eventueller <Ortsangabe> – womit deren Inhalt „das Gegebene“ wurde. Die Pluralform Daten zu Datum folgt anderen Wörtern lateinischen Ursprungs wie StudienStudium oder IndividuenIndividuum.

Da sich in der deutschen Sprache die Bedeutung von „Datum“ im allgemeinen Sprachgebrauch eingeengt hat auf ‚Kalenderdatum‘, wird für die Pluralbildung im Sinne von Zeitpunkten oft nicht die Wortform „Daten” benutzt, sondern stattdessen von „Datumsangaben“ oder „Terminen“ gesprochen. Umgekehrt werden für die Einzahl von „Daten“ im weiteren Sinn als eine gegebene Messung, Information oder Zeichen(kette) dann Wörter wie „Wert“, „Angabe“ oder „Datenelement“ verwendet. Es handelt sich also um einen Pluraletantum[1].

Daten im Unterschied zu Information

Obwohl diese beiden Ausdrücke in der Standardsprache synonym benutzt werden, unterscheidet die Informationstheorie beide dem Begriff nach grundlegend voneinander, Details und Beispiele siehe Information.

Recht

Das deutsche Recht verwendet an verschiedenen Stellen den Datenbegriff, weist aber keine diesbezügliche Definition auf. Verwendet wird der Begriff etwa im Datenschutz oder im Strafrecht unter „Ausspähen von Daten“ (§ 202a StGB); „Daten“ in diesem Sinn sind „nur solche, die elektronisch, magnetisch oder sonst nicht unmittelbar wahrnehmbar gespeichert sind oder übermittelt werden.“

Das österreichische Kernstrafrecht kennt den Datenbegriff seit der Einführung des § 126a StGB (Datenbeschädigung). Im Laufe der Zeit wurden weitere Tatbestände hinzugefügt, sodass heute auch der betrügerische Datenverarbeitungsmissbrauch (§ 148a StGB), Datenfälschung (§ 225a StGB), die Störung der Funktionsfähigkeit eines Computersystems (§ 126b StGB) und diverse Vorfelddelikte (ua § 118a, § 119a und § 126c StGB) bestraft werden können.[10]

Weiters findet sich eine differenzierte Darstellung des Begriffs im § 4 Datenschutzgesetz 2000 (DSG). So wird zwischen personenbezogenen und nicht personenbezogenen Daten unterschieden, wobei nur erstere durch das DSG geschützt werden.

Informatik

Laut Definition der inzwischen abgelösten Norm DIN 44300 Nr. 19 waren Daten (ab 1985) Gebilde aus Zeichen oder kontinuierliche Funktionen, die aufgrund bekannter oder unterstellter Abmachungen Informationen darstellen, vorrangig zum Zweck der Verarbeitung und als deren Ergebnis.

Gemäß Terminologie der geltenden Norm des internationalen Technologiestandards ISO/IEC 2382-1 für Informationstechnik (seit 1993) sind Daten – Data: „a reinterpretable representation of information in a formalized manner, suitable for communication, interpretation, or processing“ – eine wieder interpretierbare Darstellung von Information in formalisierter Art, geeignet zur Kommunikation, Interpretation oder Verarbeitung.

In der Informatik und Datenverarbeitung versteht man Daten gemeinhin als (maschinen-) lesbare und -bearbeitbare, in der Regel digitale Repräsentation von Information. Ihr Inhalt wird dazu meist zunächst in Zeichen bzw. Zeichenketten kodiert, deren Aufbau strengen Regeln folgt, der sogenannten Syntax. Um aus Daten wieder die Informationen zu abstrahieren, müssen sie in einem Bedeutungskontext interpretiert werden.[6] So kann eine Ziffernfolge wie „123456“ zum Beispiel in Abhängigkeit vom Kontext für eine Telefonnummer, eine Kontonummer oder die Anzahl von Kfz-Neuzulassungen in einem bestimmten Zeitraum stehen. Die betrachtete Zeichenfolge „123456“ oder auch „11110001001000000“ als solche kann nur als Aneinanderreihung von Ziffern erkannt werden; ihre konkrete Bedeutung wird erst im jeweils passenden Kontext (siehe Semantik) klar.

Die Speicherung von Daten erfolgt auf Datenspeichern, wie z. B. Festplatten, DVDs, Flash-Speichern oder auch Magnetbändern, früher z. B. auch Lochkarten. Diese Datenträger gelten als Hardware, während die auf/in ihnen enthaltenen Daten als „immaterieller Begriff“ zu verstehen sind.[11][12]

Die Form der Darstellung von Daten nennt man Kodierung, die Menge der dabei möglichen Zeichen nennt man Codealphabet (z. B. UTF-8). Daten können unterschiedlich kodiert sein, d. h. in unterschiedlichen Codes notieren, aber dennoch die gleiche Information repräsentieren.[13][14] In der heutigen Digitaltechnik hat sich die Kodierung in binärer Form fast ausschließlich durchgesetzt. Ein Bit ist dabei die kleinste Informationseinheit. Grundsätzlich ist neben Binärcode auch die Verwendung von Alphabeten mit mehr als zwei Symbolen möglich.

  • Gebräuchliche Speicherzellen kennen nur die Zustände „an“ und „aus“, die als „1“ und „0“ und damit als die Basiswerte des Binärsystems interpretiert werden.
  • Speicherzellen mit mehr als einem Bit pro Zelle finden sich in Flash-Speichern, z. B die MLC- oder TLC-Speicherzelle.
  • Speicherzellen für überlagerte Quantenzustände, sogenannte Qubits, befinden sich noch im Forschungsstadium.

Kategorisierung von Daten

Man unterscheidet:

Nach dem Grad ihrer Beständigkeit unterscheidet man:

  • Transiente Daten (flüchtig, übergangsweise) versus persistente Daten (dauerhafter)
  • Eingabedaten und Ausgabedaten bzw. zu speichernde versus gespeicherte Daten

Weitere Begriffe für Datenarten:

  • Anwendungsdaten sind fachlich-funktional zu verarbeitende Daten – im Gegensatz zu technischen Daten (wie Installationsdaten, Programmcode, Ausführbare Dateien etc.) Anwendungsdaten lassen sich unterscheiden nach Stammdaten, Bewegungsdaten und Bestandsdaten; siehe auch Stammdaten.
  • Neartime-Daten sind Kopien von aktuellen Daten mit etwas geringerer Aktualität als die Originaldaten (in Echtzeit Realtime-Daten).
  • Sicherungsdaten sind zur Sicherheit kopierte Datenbestände, auf die bei Bedarf zurückgegriffen werden kann
  • Originäre versus abgeleitete Daten: Originär sind erst- und einmalig vorhandene Daten. Aus ihnen können Summen, Kopien oder andere Konstrukte gebildet (abgeleitet) werden.
  • Serielle Daten (auch sequentielle Daten genannt): Die Daten werden nicht unter dem Managementsystem einer Datenbank (DBMS) verwaltet, sondern in einer Standard-Dateiform des Betriebssystems gespeichert und verarbeitet. In der Regel ist dabei ein Direktzugriff nicht möglich; die Daten müssen dann der Reihe nach geschrieben bzw. gelesen werden.
  • Historische Daten: Der Datenbestand zu bestimmten Zeitpunkten (z. B. Stand vor Änderungen, Stand zum Jahresanfang) kann getrennt gespeichert und später in bestimmten Funktionen (z. B. Bildschirmanzeige) verwendet werden.

Formen der Verarbeitung von Daten

Als Datenoperationen beim Speichern von Daten sind nach dem Prinzip „CRUD“ das erstmalige Erfassen von Daten (create), das Lesen (read), das Verändern (update) und das Löschen (delete) zu unterscheiden. Gegenstand solcher Operationen ist zumeist eine bestimmte Gruppe von Daten (wie eine Kundenadresse, Bestellung etc.), die z. B. nach den Regeln der Datenmodellierung gebildet wurde. Diese datentechnischen Operationen werden durch Computerprogramme ausgelöst, d. h. über entsprechende, in diesen enthaltene Befehle (als Teil eines implementierten Algorithmus’) vorgegeben. Die Operationen sind einerseits selbst Input-/Output-Befehle in Bezug auf den Datenbestand, sie stehen zum Teil aber auch im Zusammenhang mit Eingabe und Ausgabe seitens der Benutzer des Computerprogramms.

Zweck der Speicherung von Daten ist in der Regel ihre spätere Nutzung. Dabei lässt sich die einfache Wiedergabe (z. B. in Form von Anzeigen oder Listen) unterscheiden von dem Auswerten, bei dem die Daten in unterschiedliche logische, mathematische oder darstellende Verfahren einfließen (z. B. zur Summenbildung, Durchschnittsberechnung, Differenzbildung, Datenabgleich, als grafische Diagramme etc.).

Eine besondere Form der Daten-Verarbeitung sind der Datenimport (Dateiimport) und Datenexport (Dateiexport) als gängige Methode zum Datenaustausch zwischen verschiedenen Systemen. Hierbei ist unter Umständen auch eine Datenkonvertierung erforderlich, wenn Ausgangs- und Zielsystem unterschiedliche Datenformate oder Dateiformate verwenden.

Betrachtungs- und Wirkungsebenen für Daten

Wie Daten entstehen und welche Begriffe/Bezeichnungen dabei auftreten können

Der Begriff ‚Daten‘ tritt in unterschiedlichen, miteinander im Zusammenhang stehenden Wirkungs- und Betrachtungsebenen auf. Dies sind im Wesentlichen:

  • Im Datenmanagement werden allgemeine Rahmenbedingungen für das Arbeiten mit den Daten festgelegt und im laufenden Betrieb angewendet, zum Beispiel: Wer gilt als Eigentümer der Daten? Wo und wie entstehen die Daten oder werden sie genutzt? Wer darf auf sie zugreifen (Datensicherheit); Regeln und Maßnahmen für den Datenschutz und die Datensicherung; unternehmensweite Modelle und Namenskonventionen; Einsatzkonzepte für Datenwerkzeuge usw.
  • Datendesign: Vornehmlich bei Softwareentwicklung im Rahmen von Projekten spielen Daten, neben der Funktionalität der Programme, eine zentrale Rolle. Unter Einsatz individuell hierfür verfügbarer Verfahren und Werkzeuge werden dabei Details der Datenarchitektur festgelegt, z. B.: Welche Daten kennt die Software? Wie stehen sie untereinander im Zusammenhang? Gibt es sie bereits? Werden sie in Datenbanken oder in Dateien verwaltet/gespeichert? Pflicht- oder optional mögliches Feld? Welche Datentypen und Datenstrukturen sind zu bilden? Welche Ausprägungen/Inhalte kann ein Attribut annehmen?
  • Technische Implementierung:
    • Die Ergebnisse der Designfestlegungen werden (bei Speicherung in einem Datenbanksystem) in ein Datenbankmodell eingestellt, als Grundlage für die Verarbeitung und Verwaltung der Daten, die die Datenbank aufnehmen soll.
    • In der Programmierung entsteht der Programmcode, über dessen Befehle Daten verarbeitet werden. Mit sogenannten Deklarationen werden Datenstrukturen mit ihren einzelnen Datenfeldern so angeordnet, dass sie die Daten aufnehmen können, und dass bei der Übersetzung Befehle erzeugt werden, wie es den Feldeigenschaften (Position, Länge, Datenformat etc.) entspricht.
  • Tatsächliche Daten: Hier werden die Daten tatsächlich gespeichert und von den Programmen benutzt.

Daten in der Programmierung

Daten sind vornehmlich Quelle und Ziel der Verarbeitung in Computerprogrammen. Dazu sind im Programm, d. h. in dessen Quelltext, dem Verarbeitungszweck entsprechende Deklarationen und Befehle erforderlich. Diese können, abhängig von der Programmiersprache, erhebliche syntaktische und auch sprachlich-begriffliche (semantische) Unterschiede aufweisen. Wichtige datenbezogenen Begriffe sind hier (jeweils mit Synonymen, ähnlichen Begriffen und Beispiel angegeben):

  • Datenbestand: Dort werden Daten gespeichert, von einem Programm erzeugt, verändert oder gelöscht und/oder von dort gelesen (siehe auch CRUD). Ähnlich: Datenbank, Datei, Datenbasis; Beispiel: Kundenadressen
  • Datensatz: Fasst die auf ein Objekt (Entität) bezogenen Angaben/Werte zusammen. Ähnliche Begriffe: Tupel, Verbund, Dataset, Recordset; Beispiel: Adresse eines bestimmten Kunden.
  • Datenfeld: Eine einzelne, elementare, zu einem Datensatz gehörende Angabe/Information. Nur programmintern verwendete Daten (zum Beispiel Summenfelder, der Mehrwertsteuersatz in Prozent …) werden ebenfalls in Datenfeldern definiert und verarbeitet. Ähnlich: Variable, Konstante, Feld; Beispiel: Postleitzahl des Wohnorts
  • Datenstruktur: Zusammenfassung mehrerer Datenfelder zu einer Gruppe. Vertreter: Verbund (Datengruppe), Array/Tabelle, Stack; Beispiel: Telefonnummer(n) des Kunden, Ländercode, Vorwahl, Tel-Nr, gegebenenfalls Durchwahl
  • Datentyp: Klassifizierung für Datenfelder und -strukturen, zum Beispiel Text, numerisch/Gleitkomma, Array. Hieran orientieren sich die Befehle (Methoden, Funktionen), die auf die Datenfelder angewendet werden können. Ähnlich: Datenformat; Beispiel: Postleitzahl ist ein numerisches Feld

Weitere Datenbegriffe, denen in der Programmierung / Softwareentwicklung eine wesentliche Bedeutung zukommt, sind beispielsweise: Datenmodellierung, Eingabe und Ausgabe, Datenfluss, …

Bemerkenswertes

Seit der Jahrtausendwende soll der Anteil der digitalen Daten, die der analogen Aufzeichnungsbestände überschritten haben. [15] Auf der Erde gibt es (Stand 2011)[16] 1,8 Zettabytes (1021 Bytes = 1,8 Billionen Gigabytes) an digitalen Informationen. Das Gesamtvolumen wuchs in den letzten fünf Jahren um den Faktor fünf und wächst zurzeit täglich um 1018 Bytes. Wollte man die gesamte Datenmenge auf DVD brennen, so benötigte man einen Stapel DVDs, der von der Erde zum Mond und wieder zurück reichen würde. Auch in den nächsten Jahren wird sich der weltweite Datenverkehr voraussichtlich vervielfachen.[17]

Beispiele

Daten im allgemeinen Sinn

  • Inhalte von Lexika und Büchern
  • Die an einem Thermometer angezeigte Temperatur
  • Die (gemessene) Geschwindigkeit eines vorbeifahrenden Fahrzeugs
  • Antworten bei Umfragen, Volkszählungen – auf die Fragen in Fragebögen
  • Ergebnisse von Experimenten in den Naturwissenschaften, technische Fakten
  • Pressearchive von Zeitungsverlagen
  • Der Inhalt von Schriftstücken (z. B. Briefe, Notizen, Protokolle usw.)

Daten in der Informatik

Siehe auch

Weblinks

Wiktionary: Daten – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Literatur

  • Herbert E. Wiegand: Wörterbuchforschung, Teilband 1. de Gruyter, Berlin 1998, ISBN 3-11-013584-1, Kapitel 1.5.2.2 (Bemerkungen zum Gebrauch von Daten und Information).

Einzelnachweise

  1. a b Daten. In: Duden (online)
  2. W. E. Proebster: Rechnernetze, Technik, Protokolle, Systeme, Anwendungen. books.google.de
  3. B. Witt: Datenschutz Kompakt und Verständlich: Eine Praxisorientierte Einführung. Vieweg+Teubner (Springer Fachmedien), Wiesbaden 2010, S. 4, Definition: Daten.
  4. Was sind Daten? Das Datenschutz-Blog
  5. a b Daten. In: Gabler Wirtschaftslexikon. Abgerufen am 27. Februar 2011.
  6. a b Heinz-Peter Gumm, Manfred Sommer: Einführung in die Informatik. 10. Auflage. Oldenbourg Verlag, ISBN 978-3-486-70641-3, S. 4 f.
  7. D. v. Erffa: Taschenlexikon der Wirtschaft. books.google.de „Daten“ beziehungsweise erläuternd z. B. in G. Blümle et al.: Perspektiven einer kulturellen Ökonomik, Band 1. LIT Verlag, Münster 2004, ISBN 3-8258-6137-6, books.google.de Datenbegriff von Eucken.
  8. datum, n.. In: Jacob Grimm, Wilhelm Grimm: Deutsches Wörterbuch. Hirzel, Leipzig 1854–1961 (woerterbuchnetz.de, Universität Trier).
  9. siehe „Daten“ und „Datum“ in Kluge: Etymologisches Wörterbuch der deutschen Sprache, 23. Auflage, S. 163f.
  10. Susanne Reindl-Krauskopf: Computerstrafrecht im Überblick. 2. Auflage. Facultas Verlag, Wien 2009, ISBN 978-3-7089-0523-5, S. 8f.
  11. Gesetzentwurf zur Kriminalisierung von Datenhehlerei. cr-online.de, Portal zum IT-Recht
  12. Die naive Datenkuh. In: Der Tagesspiegel
  13. Peter Rechenberg, Gustav Pomberger: Informatik Handbuch. 4. Auflage. Carl Hanser Verlag, München, ISBN 978-3-446-40185-3, S. 189.
  14. Nach Schneider (1997) in Bernard Favre-Bulle: Informationen und Zusammenhang: Informationsfluß in Prozessen der Wahrnehmung des Denkens und der Kommunikation, S. 35, books.google.de
  15. The World’s Technological Capacity to Store, Communicate, and Compute Information. martinhilbert.net, abgerufen am 29. September 2015.
  16. Datenwachstum verdoppelt sich alle zwei Jahre – EMC. EMC Corporation, abgerufen am 16. Juli 2011.
  17. Datenverkehrprognose für 2016. In: Spiegel Online. Abgerufen am 4. Mai 2013.