Datensatz

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Ein Datensatz ist nach Mertens (1998)[1] eine Gruppe von inhaltlich zusammenhängenden (zu einem Objekt gehörenden)[2] Datenfeldern, z. B. Artikelnummer und Artikelname. Die Datenfelder ‚Name‘, ‚Adresse‘ und ‚Geburtsdatum‘ könnten ferner einen Datensatz zu einer Person bilden. Datensätze entsprechen einer logischen Struktur, die bei der Softwareentwicklung (z. B. im konzeptionellen Schema der Datenmodellierung) festgelegt wurde.[3]

In der Datenverarbeitung werden Daten zu Datensätzen zusammengefasst in Datenbanken oder in Dateien gespeichert, sie sind Gegenstand der Verarbeitung von Computerprogrammen und werden von diesen erzeugt, gelesen, verändert und gelöscht (siehe CRUD). Bei der Eingabe wird der Inhalt von Datensätzen oft in der Form eines Formulars dargestellt, bei der Ausgabe oder Anzeige auch in Listenform, ggf. nur mit einem Teil der Datenfelder.

Auch nicht-elektronische Daten können zu Datensätzen zusammengefasst sein, zum Beispiel ist eine Karteikarte in einer Kartei ein Datensatz.[4]

Neben der Bedeutung von „Datensatz“ im engeren Sinn - als Sammlung konkreter Daten (z. B. die Adressdaten von Kunde Müller) - wird der Ausdruck im Kontext der Softwareentwicklung auch als Typbegriff für die Struktur von Daten verwendet (Datensatz Adressdaten). Abhängig von den dabei angewendeten Methoden, Programmiersprachen etc. werden anstelle von ‚Datensatz‘ auch andere Ausdrücke benutzt, z. B. Entität/Entitätstyp, Klasse, Tupel, Zeile, Struktur, Satz (englisch Record), Verbund usw.

Abgrenzung: Obwohl Daten eigentlich immer als Aneinderreihung mehrerer Datenelemente auftreten, nennt man nicht alle Erscheinungsformen von Daten 'Datensatz', sondern nur Datengruppierungen, die zu einem bestimmten Objekt gehören und die innerhalb eines Datenbestands identische Strukturen aufweisen. Nicht als Datensätze in diesem Sinn gelten demnach zum Beispiel: Fließtexte, Drucker- oder Video-Datenströme, Inhalte von ausführbaren Dateien, Fotodaten oder die Daten von Grafiksoftware u.a.

Umgangssprachliche Verwendung des Begriffs[Bearbeiten]

Während in der relationalen Algebra, in relationalen Datenbanksystemen und in der Informatik allgemein der Begriff Datensatz eingeschränkt als eindimensionale, strukturierte Sammlung von Attributen eines Elements einer übergeordneten Menge (z. B. Karteikarte in einer Kartei, Adresszeile in einer Adressliste etc.) definiert ist, wird der Ausdruck ‚Datensatz‘ umgangssprachlich und auch medial häufig (und im Singular fälschlicherweise) in einem breiteren Sinn verwendet, z. B. zur Benennung einer ganzen Tabelle mit ihren voneinander unabhängigen Zeilen, einer mehrdimensionalen (Daten-)Matrix oder auch für die Gesamtheit von „Daten“ in einem bestimmten Zusammenhang, also gleichbedeutend mit „ein Satz von Daten“, „eine Sammlung von Daten“ – beispielsweise alle in einer statistischen Erhebung ermittelten Daten, die Steuersünder-CD etc.

Varianten bei der Speicherung[Bearbeiten]

Im Allgemeinen entspricht ein Datensatz, mit den Ausdrucksmitteln von Programmiersprachen deklariert, dem Datentyp Verbund bzw. Record, ggf.innerhalb eines assoziativen Arrays. Das mathematische Modell eines Datensatzes ist ein Tupel.

Bezüglich der Speicherung von Datensätzen lassen sich zahlreiche Unterscheidungen treffen. Zum Beispiel:

  • Speicherung in normalen Dateien: Hier bieten sich Alternativen wie:
    • Benutzerdefinierte individuelle Datenformate und -strukturen,
    • CSV-Dateien mit Feldtrennzeichen wie Strichpunkt o. ä.,
    • XML-Format in der Form <Feldname = Feldinhalt> und mit weiteren strukturbezogenen, textlich formulierten Informationen,
    • RDF-Format für Internet-Informationen.
  • Speicherung in Datenbanken:
    • In relationalen Datenbanken werden Datensätze in Tabellenform gespeichert, wobei ein Datensatz i. d. R. einer Tabellenzeile entspricht.
    • Spaltenorientierte Datenbanken speichern nicht alle Datenfelder je Datensatz hintereinander, sondern für jedes Datenfeld die Inhalte aller Datensätze, eine Spalte (mit all ihren Zeilen) steht hier also für 'Datensatz'.[5]

Im Detail ist ‚Datensatz‘ jedoch kein technischer, sondern ein logischer Begriff, für den es zahlreiche technische Erscheinungs- und Implementierungsfomen gibt. Dabei können Datensätze nach den folgenden Merkmalen/Eigenschaften unterschieden werden:

  • Allgemeingültigkeit: Verbindlich festgelegte Strukturen und Formate (wie binäre Daten oder Text, Länge, sonstige Regeln), z. B. für bestimmte Softwarelösungen (wie beim DTA-Verfahren) vs. individuell vom Anwender definierte Formate.
  • Satz-/Datenfeldlänge: Fixe und einheitliche Länge je Feld vs. variabel lange Felder (z. B. mit Feldtrennzeichen wie bei CSV oder mit Feldlängenangabe); führt entsprechend zu Datensätzen mit fixer oder variabler Länge.
  • Verwendete Zeichenkodierung: Nur Textzeichen z. B. im ASCII-Code vs. andere Datentypen in einem Binärcode.
  • Feldattribute: Nur Nettodaten vs. weitere Informationen je Feld (wie fett, unterstreichen, Schrifttyp usw., meist nicht sichtbar).
  • Datensatzbegrenzung: Satzende-Kennzeichnung vs. feste Satzlänge.
  • Homogenität: Einheitliche vs. unterschiedliche Datenarten in derselben Datei, erkennbar z. B. durch ein Datenfeld ‚Satzart‘.

In Anwendungen zur Tabellenkalkulation wird ein Datensatz meist durch eine Zeile, je nach Anordnung alternativ durch eine Spalte repräsentiert. Eine klassisches Beispiel für einen Datensatz ist eine Lochkarte.

Für elektronische Daten gilt: Sie existieren in ihrem Speichermedium als Bit-/Bytefolgen beliebiger Länge. In dieser Datenmenge werden die einzelnen Datensätze und Datenfelder durch meist von der Programmiersprache und/oder der Systemsoftware bereitgestellte Verfahren identifiziert und adressiert und zum Beispiel in Zeilen und Spalten dargestellt.

Logische/physische Datensätze: Auf elektronischen Datenträgern werden in der Regel mehrere Datensätze zu größeren Speichereinheiten zusammengefasst. Solche Einheiten werden je nach Computersystem unterschiedlich bezeichnet, zum Beispiel als ‚Page‘ (Seite, bei vielen Datenbanksystemen) oder als Block (bei konventioneller Speicherung).[6] In einem Computerprogramm sind der Verarbeitung des einzelnen Datensatzes Routinen vorgeschaltet (meist des Betriebssystems oder des DBMS), die das tatsächliche Lesen oder Schreiben auf dem Datenträger aus Optimierungsgründen block-/seitenweise durchführen und den jeweils einzelnen Datensatz innerhalb des Datenblocks iterativ positionieren und zur Verarbeitung im Hauptspeicher bereitstellen.

Einzelnachweise[Bearbeiten]

  1. Mertens, P; et al (1998): Grundzüge der Wirtschaftsinformatik, 5. Auflage, Springer Verlag, Berlin, S. 59
  2. GablerWirtschaftslexikon [1] Datensatz
  3. Dr. Henry Herper: Informatisches Modellieren. Uni Magdeburg, 2004, abgerufen am 11. März 2014 (PDF).
  4. Fremdwort.de [2] Datensatz
  5. Eliteinformatiker Zeilen- und spaltenorientierte Datenbanken[3]
  6. Sebastian Dworatschek Grundlagen der Datenverarbeitung [4] Kap. 1.2.1 Logische und physische Sätze

Siehe auch[Bearbeiten]