Standard Generalized Markup Language

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Vorlage:Infobox Dateiformat/Wartung/MagischeZahl fehltVorlage:Infobox Dateiformat/Wartung/Entwickler fehltVorlage:Infobox Dateiformat/Wartung/Website fehlt

Standard Generalized Markup Language
Screenshot

Vorlage:Infobox Dateiformat/Wartung/Screenshot Format

Dateiendung: keineVorlage:Infobox Dateiformat/Wartung/Endung fehlt
MIME-Type: application/sgml, text/sgml
Art: Metasprache
Container für: HTML
Erweitert von: GML
Erweitert zu: XML
Standard(s): ISO 8879
Logo des Deutschen Instituts für Normung DIN EN 28879
Bereich Informationsverarbeitung
Titel Text- und Bürosysteme
Kurzbeschreibung: Genormte Verallgemeinerte Auszeichnungssprache (SGML)
Letzte Ausgabe 1991-03 (zurückgezogen)
ISO ISO 8879:1986 Information Processing — Text and Office Systems — Standard Generalized Markup Language (SGML)

Standard Generalized Markup Language (SGML, englisch; deutsch Normierte Verallgemeinerte Auszeichnungssprache) ist eine Metasprache, mit deren Hilfe man verschiedene Auszeichnungssprachen (engl. markup languages) für Dokumente definieren kann. SGML ist ein ISO-Standard: ISO 8879:1986 Information Processing – Text and Office Systems – Standard Generalized Markup Language (SGML). SGML war weiterhin in der Europäischen Norm EN 28879:1990 und der DIN EN 28879:1991 beschrieben. Diese Normen wurden 2012 ersatzlos zurückgezogen.

Inhalt und Darstellung[Bearbeiten]

Um ein gültiges (engl. valid) Dokument in SGML zu beschreiben, wird die Dokumenttypdefinition (DTD) verwendet, die den strukturellen Aufbau von Dokumenten beschreibt.

In SGML sind der Inhalt des Dokuments und das Layout voneinander getrennt (d. h. voneinander unabhängig angebbar), wobei ersteres durch SGML-Elemente strukturiert wird.

Zur Wiedergabe dieser Struktur auf einem bestimmten Ausgabemedium wurde die Sprache Document Style Semantics and Specification Language (DSSSL) entwickelt. Eine Überschrift wird also in SGML zwar mit einem sogenannten Markup gekennzeichnet; wie diese bei der Ausgabe dargestellt wird, ist für SGML unerheblich.

Die Gültigkeit des Dokumentes überprüft man mit so genannten Parsern. SGML-Parser lesen zunächst die SGML-Deklaration und die DTD ein und prüfen dann, ob das eigentliche Dokument konform mit Deklaration und DTD ist. Ein solcher Parser ist beispielsweise nsgmls von James Clark; dieser Parser wird im Rahmen des OpenSP-Projektes weiterentwickelt.

Abgrenzung[Bearbeiten]

Die bekanntesten auf SGML basierenden Sprachentwicklungen sind HTML und XML. Sie werden oft als Ableitungen beziehungsweise als Dialekte von SGML beschrieben. HTML ist eine Anwendung (engl. application) von SGML und XML eine bestimmte Untermenge von SGML. In der Praxis hat XML heute den Platz von SGML eingenommen und wird in breitem Umfang verwendet.

Bekannte SGML-Sprachelemente[Bearbeiten]

Neben den Tags in spitzen Klammern leben folgende ursprünglich von SGML eingeführte Sprachelemente heute noch in HTML bzw. XML weiter:

Geschichte[Bearbeiten]

Einer der Väter von SGML ist Charles Goldfarb, der die Grundlagen für IBMs Document Composition Facility Generalized Markup Language (IBM GML oder DCF GML) definierte. Ziel der GML war es, Dokumente so zu beschreiben, dass das Ergebnis weder von einer bestimmten Plattform noch von einer spezifischen Anwendung abhing. Es ging dabei rein um die logische Struktur wie z. B. die Einteilung eines Buches in Überschriften, Kapitel, Abschnitte und nicht um das Aussehen eines Dokumentes. Diese wesentliche Idee, das Konzept des generic coding, ist bereits Ende der 1960er Jahre entstanden und geht auf William W. Tunnicliffe zurück. Im Lauf der Jahre wurde GML weiterentwickelt und setzte sich letztendlich 1986 als internationaler Standard ISO 8879:1986 Standard Generalized Markup Language – SGML durch.

Behörden, Firmen, Bildungseinrichtungen und Institutionen begannen damit, ihre Daten in SGML zu speichern. Den großen Durchbruch auf breiter Front schaffte SGML aber erst mit seiner Anwendung HTML.

Anwendungen[Bearbeiten]

  • HTML, Standard zur Strukturierung von Webseiten
  • DocBook, Standard zur Erstellung von (technischen) Dokumentationen
  • TEI, Dokumentformat zur Kodierung und für den Austausch von Texten
  • EAD, Standard zur Beschreibung von Findbüchern und anderen Findhilfen in Archiven

Die aufgeführten Anwendungen werden heute zumeist auf Basis von XML weiterentwickelt.

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

  • Charles F. Goldfarb: The SGML Handbook. Oxford University Press (1991), ISBN 0-19-853737-9
  • Horst Szillat: SGML: Eine Einführung. International Thompson Publishing (1995), ISBN 3-929821-75-3

Weblinks[Bearbeiten]