Leerzeichen

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
 
Satzzeichen
Leerzeichen  
Punkt .
Komma, Beistrich (AT; im Text) ,
Semikolon, Strichpunkt (AT) ;
Doppelpunkt :
Fragezeichen ?
Ausrufezeichen (DE),
Rufzeichen (AT),
Ausrufzeichen (CH)
!
Anführungszeichen„ “  » «  « »
Apostroph
Gedankenstrich, Bis-Strich
Bindestrich, Trennstrich,
Ergänzungsstrich
-
Doppelbindestrich
Schrägstrich /
Klammern     ( )[ ]{ }⟨ ⟩
Auslassungspunkte
Mittelpunkt ·
Hochpunkt · ·
Interrobang
Aufzählungszeichen

Das Leerzeichen (auch Wortzwischenraum, seltener Leerstelle, Leerschritt oder sinngemäß Spatium, bes. schweiz. Leerschlag, engl. space [speɪs], blank [blæŋk]) dient der Abgrenzung von Wörtern oder anderen Informationen innerhalb eines zusammenhängenden Fließtextes. Auf der Schreibmaschine und der Computertastatur erhält man durch Betätigen der Leertaste, der größten Taste unten auf der normalen Standardtastatur, ein Leerzeichen. Für einen guten Schriftsatz werden Leerzeichen unterschiedlicher Breite verwendet.

Breite des Leerzeichens[Bearbeiten]

Die übliche Breite des Leerzeichens und damit des Wortabstandes beträgt ein Viertelgeviert; das ist allerdings vom Schriftdesign abhängig.

Daneben gibt es auch ein schmales Leerzeichen, um für zusammengehörende Texteinheiten einen erkennbaren Unterschied gegen den normalen Wortabstand zu setzen (etwa in Abkürzungen wie »z. B.«, als Tausendertrenner oder zwischen Maßzahl und Maßeinheit).

Schreibmaschinenschriften waren überwiegend nichtproportional, also dicktengleich – das heißt jedes Zeichen besaß die gleiche Breite, auch das Leerzeichen. Bei solchen Monospace-Schriften können daher Leerzeichen auch zur Ausrichtung von Tabellen anstelle des Tabulators verwendet werden.

Entwicklung des Leerzeichens[Bearbeiten]

In antiken Texten war eine Trennung der Wörter nicht üblich. Die dichte Anordnung des Textes zwang den Leser zur sorgfältigen und in den meisten Fällen lauten Lektüre. Erst im 7. Jahrhundert wurde die Wortteilung eingeführt. Die klaren Wortabstände erleichterten das schnelle Erkennen und Verstehen der Texte.

Johannes Gutenberg kannte nur einen richtigen Wortabstand. Den Randausgleich der Zeilen in seiner 42-zeiligen Bibel erzielte er mit Hilfe verschieden breiter Buchstaben. Der gute Wortabstand entsprach dem Innenraum (Punze) des kleinen „n“. An ihm orientierten sich von nun an die guten Schriftsetzer.

Die Erfindung der Schreibmaschine brachte einen weiteren Wortabstand. Er entsprach der immer gleichen Buchstabenbreite und ließ das Gefühl für den richtigen Zwischenraum verschwinden.

Jan Tschichold, der Erneuerer der Typografie des 20. Jahrhunderts, griff die mittelalterliche Idee des guten Wortabstands wieder auf. Sein Biograf Werner Lemke berichtet, dass Tschichold kleine Florpapierstückchen in seiner Geldbörse aufbewahrte, um die Buchstaben- und Wortabstände ideal auszugleichen, wo die feinsten Spatien der Schriftsetzer nicht ausreichten.

Dementsprechend sollte bei Drucksachen auf den guten Wortabstand geachtet werden. Denn zu große Wortabstände erzeugen, wie der präraffaelitische Buchkünstler William Morris sagt: „Hässliche sich windende weiße Linien im Text“, die senkrecht oder schräg zu den Zeilen verlaufen. In der Sprache der Buchdrucker heißt dieser typografische Fehler „Gießbach“ oder „Gasse“. Gießbäche lassen das Auge aus dem Text irren und erschweren das Lesen.

Verwendung von Leerzeichen[Bearbeiten]

Untersucht man deutsche Texte daraufhin, wie viele Buchstaben, Satz- und Wortzeichen sowie Leerzeichen sie enthalten, so stellt sich heraus, dass die Leerzeichen die größte Häufigkeit aufweisen, vor „e“ als dem häufigsten Buchstaben.[1]

Druckwesen[Bearbeiten]

Leerzeichen sind zum einen notwendig, um eine Zeile zum Blocksatz zu strecken. Darüber hinaus werden sie in Abkürzungen wie z. B. verwendet. Auch die korrekte Schreibweise von Zahlen wird mit Hilfe der Leerzeichen erreicht (Bsp. 123 456 789). Der Wortzwischenraum entspricht bei den meisten Schriftarten etwa dem Raum, den ein schmales Schriftzeichen (Buchstabe oder Satzzeichen) einnehmen würde. Die Größe der Wortzwischenräume bleibt im Flattersatz konstant, während sie im Blocksatz variieren kann.

Zwei typische Fehler der Leerzeichensetzung haben eigenständige Namen bekommen:

  • Plenk: überflüssiges Leerzeichen vor Satzzeichen
  • „Deppenleerzeichen“ (Leerzeichen in Komposita): fehlerhaftes Leerzeichen innerhalb zusammengesetzter Substantive
Dieser Artikel oder Abschnitt bedarf einer Überarbeitung: Aussage falsch ("¡" im Spanischen) Hilf mit, ihn zu verbessern, und entferne anschließend diese Markierung.

Satzzeichen werden im Deutschen im Allgemeinen nie mit führendem, aber immer mit nachgestelltem Leerraum gesetzt, gewisse Stichzeichen (etwa Streckenstrich) auch mit führendem Leerraum, andere (Bindestrich) aber grundsätzlich ohne: Zeichensatz ohne Leerzeichen nennt man kompress.

Textverarbeitung, Webtypographie und Datenverarbeitung[Bearbeiten]

In der modernen Textverarbeitung trifft klassische Typographie auf Webdesign, wodurch sich zusätzliche Komplikationen ergeben:

Leerzeichen gehören zum Whitespace und sind damit als Steuerzeichen zu werten: Sie beeinflussen im Allgemeinen in allen Belangen das Parsen beliebigen Codes, indem sie Codeblöcke abgrenzen. In diesem Sinne gilt das auch für die reine Schriftdarstellung: Die Wörter stellen für den am Computer allgemein üblichen automatischen Zeilenumbruch die einzeln zu lesenden Informationseinheiten dar. Daher sind Leerzeichen, sofern sie nicht dagegen geschützt sind, im Text immer Umbruchmarken. Neben den unterschiedlichen Breiten von Leerzeichen gibt es in der Webtypographie, wo es den automatischen Umbruch gibt, noch geschützte Leerzeichen, an deren Position am Zeilenende nicht umbrochen werden darf.

Teilweise werden von Textverarbeitungsprogrammen oder Betriebssystemen selbstständig passende oder unpassende Leerzeichen erkannt (Autokorrektur), so etwa Leerzeichen am Absatzanfang oder in Einzelworten (etwa führendes Leerzeichen in Dateinamen).

In vielen Programmiersprachen und Codierungen sind sie das Terminationszeichen der einzelnen Befehle – in anderen werden sie aber als Whitespace prinzipiell ignoriert: C zum Beispiel verwendet sie, Java nicht, HTML ignoriert sie (außer im Text), nicht aber der URI-Code, siehe unten.

Darstellung des Leerzeichens[Bearbeiten]

Bleisatz[Bearbeiten]

Im Bleisatz wurden Leerzeichen als Form des typografischen Weißraums in verschiedenen Breiten mit Hilfe des Ausschlusses (Blindmaterials, wie Gevierte, Spatien) erzeugt.

Desktop-Publishing und Webtypographie[Bearbeiten]

In der Darstellung der Datenverarbeitung ist das Leerzeichen im Allgemeinen ein Leerraum (whitespace).

Für die Zwecke des Zeilenumbruchs gibt es zwei Typen von Leerzeichen:

Schriftzeichen in ASCII und andere Kodierungen[Bearbeiten]

Das Leerzeichen hat den ASCII-Code 32, Unicode U+0020. Für bestimmte Zwecke gibt es besondere Leerzeichen, zum Beispiel das nicht-umbrechende oder geschützte Leerzeichen, in ISO 8859-1 mit dem Zeichencode 160, HTML-Entity  :

Leerzeichen im Unicode
Code Kein Umbruch HTML Name Codeblock Beispiel Beschreibung
U+0020   Space Basic Latin ▕ ▏ Normales Leerzeichen, vergleichbar mit dem ASCII-Zeichen 0x20
U+00A0   No-Break Space Latin-1 Supplement ▕ ▏ Wie U+0020, aber die Zeile darf hier nicht umbrochen werden.
U+1680   Ogham Space Mark Ogham ▕ ▏ Wird für Wortzwischenräume in Ogham-Texten benutzt. Benötigt eine Ogham-Schriftart.
U+2002   En Space,
or Nut
General Punctuation ▕ ▏ So breit wie ein en (halb so breit wie ein em)
U+2003   Em Space,
or Mutton
General Punctuation ▕ ▏ So breit wie ein em
U+2004   Three-Per-Em Space,
or Thick Space
General Punctuation ▕ ▏ So breit wie 1/3 des em
U+2005   Four-Per-Em Space,
or Mid Space
General Punctuation ▕ ▏ So breit wie 1/4 des em
U+2006   Six-Per-Em Space General Punctuation ▕ ▏ So breit wie 1/6 des em. In der computergestützten Typografie oft gleich mit U+2009.
U+2007   Figure Space General Punctuation ▕ ▏ In Schriften mit Ziffern fester Breite entspricht Figure Space der Breite einer Ziffer.
U+2008   Punctuation Space General Punctuation ▕ ▏ So breit wie ein enger, nach einem Interpunktionszeichen wie einem Komma folgender Abstand zum nächsten Zeichen.
U+2009   Thin Space General Punctuation ▕ ▏ So breit wie 1/5 des em (manchmal auch gleich wie U+2006)
U+200A   Hair Space General Punctuation ▕ ▏ Noch dünner als U+2009
U+200B &#8203; Zero-Width Space General Punctuation ▕​▏ Breitenloses Leerzeichen: tatsächlich kein Leerzeichen,[2] es zählt auch nicht zu den Whitespace-Zeichen, sondern ist ein nicht sichtbarer Abstand. Wird für Computersysteme verwendet um Wortgrenzen anzuzeigen, wenn die Wörter nicht getrennt geschrieben werden. Daher zählt es nicht zu den Whitespace-Zeichen. Im Blocksatz können aber Leerräume zwischen den Wörtern entstehen. In HTML kann man dieses Zeichen als optionalen Umbruch in sehr langen Wörtern verwenden, vergleichbar mit dem Tag <wbr>. Dieses HTML-Tag wird aber nicht von allen Browsern unterstützt.
U+202F &#8239; Narrow No-Break Space General Punctuation ▕ ▏ Nicht umbrechend wie U+00A0 jedoch schmaler
U+205F &#8287; Medium Mathematical Space General Punctuation ▕ ▏ Für mathematische Formeln
U+2060 &#8288; Word Joiner General Punctuation ▕⁠▏ Wie U+200B, und daher ebenfalls kein Whitespace-Zeichen, aber ohne Zeilenumbruch. Dieses Zeichen wurde in Unicode 3.2 eingeführt um die Funktion von U+FEFF als „Wortverbinder“ zu übernehmen.
U+3000 &#12288; Ideographic Space CJK Symbols and Punctuation ▕ ▏ So breit wie ein chinesisches, japanisches bzw. koreanisches Schriftzeichen.
U+FEFF &#65279; Zero Width No-Break Space
= Byte Order Mark (BOM)
Arabic Presentation Forms-B ▕▏ Wird vorwiegend für die Darstellung der Byte Order Mark verwendet. Daher zählt es nicht zu den Whitespace-Zeichen. Die Verwendung als Leerzeichen mit Nullbreite ohne Umbruch wird seit Unicode 3.2 nicht mehr empfohlen. Siehe auch U+2060.

Darstellung von Leerzeichen[Bearbeiten]

Der Unicode-Block Symbole für Steuerzeichen definiert auch drei visuelle Symbole, die Leerzeichen darstellen, selbst jedoch keine sind.

Code Zeichen Name Beschreibung
U+2420 symbol for space In den meisten unterstützenden Schriftarten, eine Glyphe mit diagonal von links oben nach rechts unten laufender Buchstabenfolge SP für space (Leerzeichen).
U+2422 blank symbol Das kleine b mit Strich steht für blank (englisch für „Leerzeichen“). Es wurde in den 1960er Jahren von IBM eingeführt und wird nicht mehr verwendet.
U+2423 open box Die offene Schachtel wird beispielsweise in Softwaredokumentation verwendet, um ein Leerzeichen grafisch darzustellen. Sie wird auch in den meisten Handytastaturen dafür verwendet.

Darstellung in HTML und Verwandten[Bearbeiten]

In HTML ist eine Einstellung des typographischen Weißraums durch Skalierung des Leerzeichens oder eine Spationierung, also Sperrung, möglich. Mehrere aufeinanderfolgende Leerzeichen werden grundsätzlich zu einem Leerzeichen zusammengefasst, wenn dies nicht explizit verhindert wird. In HTML werden Zeilenumbrüche, falls nötig an Leerzeichen erzeugt, wenn dies nicht explizit verhindert wird.

Ein Umbruch eines nicht geschützten Leerzeichens kann in HTML 3.2 durch das Attribut nowrap="nowrap" unterdrückt werden.[3] In XHTML gibt es dieses Attribut nicht. Hier kann dieser Effekt aber mithilfe der CSS Eigenschaft white-space:nowrap erzeugt werden.

Abstände zwischen den Wörtern können mit der CSS Eigenschaft word-spacing reguliert werden.

<div style="word-spacing:3em">Dieser Satz hat einen hohen Wortabstand.</div>

erzeugt:

Dieser Satz hat einen hohen Wortabstand.

In HTML gibt es des Weiteren auch verschiedene Arten von Leerzeichen:

Name Unicode Kommentar
&#32; Normales Leerzeichen. Mehrere aufeinanderfolgende werden zu einem Leerzeichen zusammengefasst.
&nbsp; &#160; Dieses Leerzeichen erzeugt bei einem Umbruch keine Trennung
&ensp; &#8194; Leerzeichen in der Breite eines n
&emsp; &#8195; Leerzeichen in der Breite eines m
&thinsp; &#8201; schmales Leerzeichen

Codierung in TeX[Bearbeiten]

Für die manuelle Einstellung der Abstände zwischen Zeichen stellt TeX folgende Befehle zur Verfügung:

Darzustellender Zwischenraum Syntax Länge Darstellung
2 quad a\qquad b 2 Geviert a\qquad b
1 quad a\quad b 1 Geviert a\quad b
normaler Textabstand[4] a\ b 6/18 Geviert a\ b
großer Zwischenraum a\;b 5/18 Geviert a\;b
kleiner Zwischenraum a\,b 3/18 Geviert a\,b
kein Zwischenraum ab 0 Geviert ab\,
kleiner negativer Zwischenraum a\!b −3/18 Geviert a\!b

Dabei stehen der große Zwischenraum a\;b und der kleine negative Zwischenraum a\!b nur im Mathematikmodus, nicht aber im Textmodus zur Verfügung. Dort muss das Leerzeichen mittels des horizontalen Abstands (z. B. a\hspace{-1pt}b) angegeben werden.

Leerzeichen in 8.3-Dateinamen[Bearbeiten]

Im FAT-Dateisystem sind Leerzeichen in Dateinamen eigentlich nicht zulässig, werden aber von mancher Software geschrieben und akzeptiert (Beispiel OS/2 auf FAT-Volumes: EA DATA. SF. Dieser Dateiname für die Erweiterten Attribute eines Volumes erfüllt zwar die 8.3-Längenkonvention, enthält aber Leerzeichen, um die Datei vor Zugriffen und Veränderungen zu schützen. Mit moderneren Texteditoren wie Edit.com seit MS-DOS-Version 7.0 sind auch solche Dateinamen lesbar und die Dateien folglich bearbeitbar.). Dateinamen kürzer als acht Buchstaben (und Dateinamenserweiterungen kürzer als drei Buchstaben) werden in den Verzeichniseinträgen von links nach rechts mit Leerzeichen aufgefüllt, welche aber nicht zum Dateinamen gehören.

Im ISO-9660-Dateisystem können Leerzeichen in Dateinamen durch Unterstriche („_“) ersetzt werden.

Leerzeichen in URIs[Bearbeiten]

Da ein Leerzeichen auch in URIs als Sonderzeichen zählt (Ende der URL), werden darin vorhandene Leerzeichen umkodiert, wie auch beispielsweise deutsche Umlaute und eckige oder geschweifte Klammern. Die Kodierung besteht aus dem Zeichen % und dem Zeichencode in zwei Hexadezimal-Ziffern (bei Multibytezeichen entsprechend für jedes Byte), für das Leerzeichen wäre das (gemäß ASCII) %20.

In der älteren Codierung application/x-www-form-urlencoded wird ein Leerzeichen durch ein „+“ ersetzt.

French/English Spacing[Bearbeiten]

Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Die fraglichen Angaben werden daher möglicherweise demnächst entfernt. Bitte hilf der Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst. Näheres ist eventuell auf der Diskussionsseite oder in der Versionsgeschichte angegeben. Bitte entferne zuletzt diese Warnmarkierung.

Vor dem 20. Jahrhundert war es üblich, nach dem Satzende ein einzelnes, jedoch verbreitertes Leerzeichen zu benutzen. Das im Englischen sogenannte French spacing, also das Setzen eines einzelnen Leerzeichens nach dem Satzende, ist seit dem 20. Jahrhundert üblich und empfohlen. Im Gegensatz dazu steht das im Engl. sog. English spacing, das das Setzen von zwei Leerzeichen nach dem Satzende beschreibt.

Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]

 Wiktionary: Leerzeichen – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise[Bearbeiten]

  1. Karl-Heinz Best: Zur Häufigkeit von Buchstaben, Leerzeichen und anderen Schriftzeichen in deutschen Texten. In: Glottometrics 11, 2005, S. 9–31. Der Beitrag enthält Angaben zur Häufigkeit von Leerzeichen in 5 deutschsprachigen Texten, darunter 4 literarische Texte und ein längerer Pressetext.
  2. Unicode Technical Note #27
  3. Suchanfrage nowrap. SELFHTML Referenz für HTML, XHTML, CSS, XML/DTD und anderes
  4. typischer Wert, vgl. TeXbook, S. 433