Zeichen-Entität-Referenz

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Die Entitäten in Auszeichnungssprachen und Zeichen-Entität-Referenz überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zusammenzuführen (→ Anleitung). Beteilige dich dazu an der betreffenden Redundanzdiskussion. Bitte entferne diesen Baustein erst nach vollständiger Abarbeitung der Redundanz und vergiss nicht, den betreffenden Eintrag auf der Redundanzdiskussionsseite mit {{Erledigt|1=~~~~}} zu markieren. Stf 22:39, 25. Apr. 2009 (CEST)

In Auszeichnungssprachen wie SGML, HTML, XHTML und XML ist eine Zeichen-Entität-Referenz (häufig auch engl. character entity reference) eine Referenz auf eine bestimmte benannte SGML-Entität, die zuvor explizit in einer Dokumenttypdefinition (Document Type Definition, DTD) definiert wurde. Beim Parsen wird die Referenz durch ihren Wert – ein oder mehrere Zeichen – ersetzt. Durch Zeichen-Entität-Referenzen ist es beispielsweise möglich, auf nicht von der Software unterstützte Zeichen zu verweisen oder Abkürzungen für längere Texte zu verwenden.

Inhaltsverzeichnis

Beispiele[Bearbeiten]

XML[Bearbeiten]

Die folgenden Entitäten müssen statt der jeweiligen Zeichen verwendet werden, da sie innerhalb von XML-Tags eine Bedeutung haben: Das Et-Zeichen leitet Entitäten ein, die Größer-als- und Kleiner-als-Zeichen umschließen Tags und Anführungszeichen bzw. Apostrophe werden bei Attributwerten als Begrenzungszeichen verwendet. Apostrophe werden in der Praxis jedoch nur selten als Entität dargestellt, auch da ihr Nutzen als Begrenzungszeichen wenig bekannt ist.

HTML[Bearbeiten]

In HTML-Dokumenten werden neben den oben genannten XML-Entitäten (Apostroph nur in XHTML) zum Beispiel häufig die folgenden Referenzen (benannte Zeichen) verwendet:

  • ä für den Umlaut ä (Ä steht für den entsprechenden Großbuchstaben Ä)
  • ö für den Umlaut ö (Ö steht für den entsprechenden Großbuchstaben Ö)
  • ü für den Umlaut ü (Ü steht für den entsprechenden Großbuchstaben Ü)
  • ß für die Ligatur ß
  • … für die Auslassungspunkte … („horizontale Ellipse“)

Durch die Angabe des korrekten 8-Bit-Zeichensatzes (im Deutschen meist Windows-1252 oder ISO 8859-1) werden solche Referenzen in normalem Text bzw. bei der Nutzung von UTF-8 gänzlich überflüssig. Somit müssen nur die oben genannten XML-Zeichen ersetzt werden.

Weblink[Bearbeiten]