Leerzeichen

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
 
Interpunktionszeichen
Leerzeichen  
schmales Leerzeichen
Komma, Beistrich ,
Strichpunkt, Semikolon ;
Doppelpunkt :
Punkt .
Auslassungspunkte
Mittelpunkt ·
Aufzählungszeichen
Fragezeichen ?
Ausrufe‑, Ausruf‑, Rufzeichen !
Apostroph, Hochkomma
Anführungszeichen„ “  » « / « »
‚ ‘   › ‹ / ‹ ›
-Bindestrich; Trennstrich;
Ergänzungsstrich
Gedankenstrich; Bis-Strich
Doppelbindestrich
Schrägstriche /\
Klammern ( )

Das Leerzeichen (auch Wortzwischenraum, seltener Leerstelle, Leerschritt oder sinngemäß Spatium, bes. schweiz. Leerschlag, engl. space [speɪs], blank [blæŋk]) dient der Abgrenzung von Wörtern oder anderen Informationen innerhalb eines Textes. Auf der Schreibmaschine und der Computertastatur erhält man durch Betätigen der Leertaste, der größten Taste unten auf der normalen Standardtastatur, ein Leerzeichen. Für einen guten Schriftsatz werden Leerzeichen unterschiedlicher Breite verwendet.

Breite des Leerzeichens[Bearbeiten]

Die übliche Breite des Leerzeichens und damit des Wortabstandes beträgt ein Viertelgeviert; das ist allerdings vom Schriftdesign abhängig.

Daneben gibt es auch ein schmales Leerzeichen, um für zusammengehörende Texteinheiten einen erkennbaren Unterschied gegen den normalen Wortabstand zu setzen (etwa in Abkürzungen wie »z. B.«, als Tausendertrenner oder zwischen Maßzahl und Maßeinheit).

Schreibmaschinenschriften waren überwiegend nichtproportional, also dicktengleich – das heißt jedes Zeichen besaß die gleiche Breite, auch das Leerzeichen. Bei solchen Monospace-Schriften können daher Leerzeichen auch zur Ausrichtung von Tabellen anstelle des Tabulators verwendet werden.

Entwicklung des Leerzeichens[Bearbeiten]

In antiken Texten war eine Trennung der Wörter nicht üblich. Die dichte Anordnung des Textes zwang den Leser zur sorgfältigen und in den meisten Fällen lauten Lektüre. Erst im 7. Jahrhundert wurde die Wortteilung eingeführt. Die klaren Wortabstände erleichterten das schnelle Erkennen und Verstehen der Texte.

Johannes Gutenberg kannte nur einen richtigen Wortabstand. Den Randausgleich der Zeilen in seiner 42-zeiligen Bibel erzielte er mit Hilfe verschieden breiter Buchstaben. Der gute Wortabstand entsprach dem Innenraum (Punze) des kleinen „n“. An ihm orientierten sich von nun an die guten Schriftsetzer.

Die Erfindung der Schreibmaschine brachte einen weiteren Wortabstand. Er entsprach der immer gleichen Buchstabenbreite und ließ das Gefühl für den richtigen Zwischenraum verschwinden.

Jan Tschichold, der Erneuerer der Typografie des 20. Jahrhunderts, griff die mittelalterliche Idee des guten Wortabstands wieder auf. Sein Biograf Werner Lemke berichtet, dass Tschichold kleine Florpapierstückchen in seiner Geldbörse aufbewahrte, um die Buchstaben- und Wortabstände ideal auszugleichen, wo die feinsten Spatien der Schriftsetzer nicht ausreichten.

Dementsprechend sollte bei Drucksachen auf den guten Wortabstand geachtet werden. Denn zu große Wortabstände erzeugen, wie der präraffaelitische Buchkünstler William Morris sagt: „Hässliche sich windende weiße Linien im Text“, die senkrecht oder schräg zu den Zeilen verlaufen. In der Sprache der Buchdrucker heißt dieser typografische Fehler „Gießbach“ oder „Gasse“. Gießbäche lassen das Auge aus dem Text irren und erschweren das Lesen.

Verwendung von Leerzeichen[Bearbeiten]

Untersucht man deutsche Texte daraufhin, wie viele Buchstaben, Satz- und Wortzeichen sowie Leerzeichen sie enthalten, so stellt sich heraus, dass die Leerzeichen die größte Häufigkeit aufweisen, vor „e“ als dem häufigsten Buchstaben.[1]

Druckwesen[Bearbeiten]

Leerzeichen sind zum einen notwendig, um eine Zeile zum Blocksatz zu strecken. Darüber hinaus werden sie in Abkürzungen wie z. B. verwendet. Auch die korrekte Schreibweise von Zahlen wird mit Hilfe der Leerzeichen erreicht (Bsp. 123 456 789). Der Wortzwischenraum entspricht bei den meisten Schriftarten etwa dem Raum, den ein schmales Schriftzeichen (Buchstabe oder Satzzeichen) einnehmen würde. Die Größe der Wortzwischenräume bleibt im Flattersatz konstant, während sie im Blocksatz variieren kann.

Drei typische Fehler der Leerzeichensetzung haben eigenständige Namen bekommen:

  • Plenk: überflüssiges Leerzeichen vor Satzzeichen
  • Klemp: ausgelassenes Leerzeichen nach Satzzeichen
  • „Deppenleerzeichen“ (Leerzeichen in Komposita): fehlerhaftes Leerzeichen innerhalb zusammengesetzter Substantive

Satzzeichen werden im Deutschen im Allgemeinen nie mit führendem, aber immer mit nachgestelltem Leerraum gesetzt, gewisse Stichzeichen (etwa Streckenstrich) auch mit führendem Leerraum, andere (Bindestrich) aber grundsätzlich ohne: Zeichensatz ohne Leerzeichen nennt man kompress.

Textverarbeitung, Webtypographie und Datenverarbeitung[Bearbeiten]

In der modernen Textverarbeitung trifft klassische Typographie auf Webdesign, wodurch sich zusätzliche Komplikationen ergeben:

Leerzeichen gehören zum Whitespace und sind damit als Steuerzeichen zu werten: Sie beeinflussen im Allgemeinen in allen Belangen das Parsen beliebigen Codes, indem sie Codeblöcke abgrenzen. In diesem Sinne gilt das auch für die reine Schriftdarstellung: Die Wörter stellen für den am Computer allgemein üblichen automatischen Zeilenumbruch die einzeln zu lesenden Informationseinheiten dar. Daher sind Leerzeichen, sofern sie nicht dagegen geschützt sind, im Text immer Umbruchmarken. Neben den unterschiedlichen Breiten von Leerzeichen gibt es in der Webtypographie, wo es den automatischen Umbruch gibt, noch geschützte Leerzeichen, an deren Position am Zeilenende nicht umbrochen werden darf.

Teilweise werden von Textverarbeitungs­programmen oder Betriebssystemen selbstständig passende oder unpassende Leerzeichen erkannt (Autokorrektur), so etwa Leerzeichen am Absatzanfang oder in Einzelworten (etwa führendes Leerzeichen in Dateinamen).

In vielen Programmiersprachen und Codierungen sind sie das Terminationszeichen der einzelnen Befehle – in anderen werden sie aber als Whitespace prinzipiell ignoriert: C zum Beispiel verwendet sie, Java nicht, HTML ignoriert sie (außer im Text), nicht aber der URI-Code, siehe unten.

Darstellung des Leerzeichens[Bearbeiten]

Bleisatz[Bearbeiten]

Im Bleisatz wurden Leerzeichen als Form des typografischen Weißraums in verschiedenen Breiten mit Hilfe des Ausschlusses (Blindmaterials, wie Gevierte, Spatien) erzeugt.

Desktop-Publishing und Webtypographie[Bearbeiten]

In der Darstellung der Datenverarbeitung ist das Leerzeichen im Allgemeinen ein Leerraum (whitespace).

Für die Zwecke des Zeilenumbruchs gibt es zwei Typen von Leerzeichen:

Schriftzeichen in ASCII und andere Kodierungen[Bearbeiten]

Das Leerzeichen hat den ASCII-Code 32, Unicode U+0020. Für bestimmte Zwecke gibt es besondere Leerzeichen, zum Beispiel das nicht-umbrechende oder geschützte Leerzeichen, in ISO 8859-1 mit dem Zeichencode 160, HTML-Entity  :

Leerzeichen im Unicode
Code Kein Umbruch HTML Name Codeblock Beispiel Beschreibung
U+0020   Space Basic Latin ▕ ▏ Normales Leerzeichen, vergleichbar mit dem ASCII-Zeichen 0x20
U+00A0   No-Break Space Latin-1 Supplement ▕ ▏ Wie U+0020, aber die Zeile darf hier nicht umbrochen werden.
U+1680   Ogham Space Mark Ogham ▕ ▏ Wird für Wortzwischenräume in Ogham-Texten benutzt. Benötigt eine Ogham-Schriftart.
U+2002   En Space,
or Nut
General Punctuation ▕ ▏ So breit wie ein en (halb so breit wie ein em)
U+2003   Em Space,
or Mutton
General Punctuation ▕ ▏ So breit wie ein em
U+2004   Three-Per-Em Space,
or Thick Space
General Punctuation ▕ ▏ So breit wie 1/3 des em
U+2005   Four-Per-Em Space,
or Mid Space
General Punctuation ▕ ▏ So breit wie 1/4 des em
U+2006   Six-Per-Em Space General Punctuation ▕ ▏ So breit wie 1/6 des em. In der computergestützten Typografie oft gleich mit U+2009.
U+2007   Figure Space General Punctuation ▕ ▏ In Schriften mit Ziffern fester Breite entspricht Figure Space der Breite einer Ziffer.
U+2008   Punctuation Space General Punctuation ▕ ▏ So breit wie ein enger, nach einem Interpunktionszeichen wie einem Komma folgender Abstand zum nächsten Zeichen.
U+2009   Thin Space General Punctuation ▕ ▏ So breit wie 1/5 des em (manchmal auch gleich wie U+2006)
U+200A   Hair Space General Punctuation ▕ ▏ Noch dünner als U+2009
U+200B &#8203; Zero-Width Space General Punctuation ▕ ▏ Breitenloses Leerzeichen: tatsächlich kein Leerzeichen,[2] es zählt auch nicht zu den Whitespace-Zeichen, sondern ist ein nicht sichtbarer Abstand. Wird für Computersysteme verwendet um Wortgrenzen anzuzeigen, wenn die Wörter nicht getrennt geschrieben werden. Daher zählt es nicht zu den Whitespace-Zeichen. Im Blocksatz können aber Leerräume zwischen den Wörtern entstehen. In HTML kann man dieses Zeichen als optionalen Umbruch in sehr langen Wörtern verwenden, vergleichbar mit dem Tag <wbr>. Dieses HTML-Tag wird aber nicht von allen Browsern unterstützt.
U+202F &#8239; Narrow No-Break Space General Punctuation ▕ ▏ Nicht umbrechend wie U+00A0 jedoch schmaler
U+205F &#8287; Medium Mathematical Space General Punctuation ▕ ▏ Für mathematische Formeln
U+2060 &#8288; Word Joiner General Punctuation ▕⁠▏ Wie U+200B, und daher ebenfalls kein Whitespace-Zeichen, aber ohne Zeilenumbruch. Dieses Zeichen wurde in Unicode 3.2 eingeführt, um die Funktion von U+FEFF als „Wortverbinder“ zu übernehmen.
U+3000 &#12288; Ideographic Space CJK Symbols and Punctuation ▕ ▏ So breit wie ein chinesisches, japanisches bzw. koreanisches Schriftzeichen.
U+FEFF &#65279; Zero Width No-Break Space
= Byte Order Mark (BOM)
Arabic Presentation Forms-B ▕▏ Wird vorwiegend für die Darstellung der Byte Order Mark verwendet. Daher zählt es nicht zu den Whitespace-Zeichen. Die Verwendung als Leerzeichen mit Nullbreite ohne Umbruch wird seit Unicode 3.2 nicht mehr empfohlen. Siehe auch U+2060.

Darstellung von Leerzeichen[Bearbeiten]

Der Unicode-Block Symbole für Steuerzeichen definiert auch drei visuelle Symbole, die Leerzeichen darstellen, selbst jedoch keine sind.

Code Zeichen Name Beschreibung
U+2420 symbol for space In den meisten unterstützenden Schriftarten, eine Glyphe mit diagonal von links oben nach rechts unten laufender Buchstabenfolge SP für space (Leerzeichen).
U+2422 blank symbol Das kleine b mit Strich steht für blank (englisch für „Leerzeichen“). Es wurde in den 1960er Jahren von IBM eingeführt und wird nicht mehr verwendet.
U+2423 open box Die offene Schachtel wird beispielsweise in Softwaredokumentation verwendet, um ein Leerzeichen grafisch darzustellen. Sie wird auch in den meisten Handytastaturen dafür benutzt.

Einsatz in HTML und Verwandten mit CSS[Bearbeiten]

Mehrere aufeinanderfolgende Leerzeichen im Quelltext von HTML- und ähnlichen Dokumenten werden als ein einzelnes Leerzeichen in der Seite von einem Webbrowser ausgegeben, wenn es nicht explizit verhindert wird. Mit der CSS-Eigenschaft white-space und dem Wert pre-wrap (white-space:pre-wrap) geschieht dies.

Der typographische Weißraum kann hier durch Spationierung bzw. Sperrung oder Skalierung eines Leerzeichens mittels CSS definiert werden. Für den Wortabstand existiert die CSS-Eigenschaft word-spacing und für den Zeichenabstand letter-spacing; sie akzeptieren nummerische Werte gefolgt von einer Maßangabe wie px, ex, em, rem, pt, …

Beispiel Wortabstand:

<div style="word-spacing:2em">Dieser Satz zeigt großen Wortabstand.</div>
erzeugt:
Dieser Satz zeigt großen Wortabstand.

Beispiel Zeichenabstand:

<div style="letter-spacing:1ex">Dieser Satz zeigt großen horizontalen Zeichenabstand.</div>
erzeugt:
Dieser Satz zeigt großen horizontalen Zeichenabstand.

Webbrowser erzeugen Umbrüche am Zeilenende wenn nötig nach Leerzeichen, wenn dies nicht explizit verhindert wird. Mithilfe der CSS-Eigenschaft white-space und dem Wert nowrap (white-space:nowrap) kann der Umbruch nach einem nicht umbruchgeschützten Leerzeichens u. a. verhindert werden. In HTML 3.2 war dafür noch das Attribut nowrap (nowrap bzw. nowrap="nowrap") vorgesehen,[3] allerdings ausschließlich bei Tabellenzellen.

In HTML/XML sind mehrere verschiedene Leerzeichen möglich:

HTML-/XML-Entität Beschreibung/Kommentar
namentlich/
benannt
nummerisch
(dezimal)
  &#32; Normales Leerzeichen; mehrere im Quelltext aufeinanderfolgende werden als ein einzelnes ausgegeben
&nbsp;  &#160; Leerzeichen ohne Umbruch; Umbruch erfolgt am vorstelligen normalen Leerzeichen
&ensp; &#8194; Leerzeichen in der Breite des Buchstaben n
&emsp; &#8195; Leerzeichen in der Breite des Buchstaben m
&thinsp; &#8201; schmales Leerzeichen
&#8239; schmales umbruchgeschütztes Leerzeichen

Codierung in TeX[Bearbeiten]

Für die manuelle Einstellung der Abstände zwischen Zeichen stellt TeX folgende Befehle zur Verfügung:

Darzustellender Zwischenraum Syntax Länge Darstellung
2 quad a\qquad b 2 Geviert a\qquad b
1 quad a\quad b 1 Geviert a\quad b
normaler Textabstand[4] a\ b 6/18 Geviert a\ b
großer Zwischenraum a\;b 5/18 Geviert a\;b
kleiner Zwischenraum a\,b 3/18 Geviert a\,b
kein Zwischenraum ab 0 Geviert ab\,
kleiner negativer Zwischenraum a\!b −3/18 Geviert a\!b

Dabei stehen der große Zwischenraum a\;b und der kleine negative Zwischenraum a\!b nur im Mathematikmodus, nicht aber im Textmodus zur Verfügung. Dort muss das Leerzeichen mittels des horizontalen Abstands (z. B. a\hspace{-1pt}b) angegeben werden.

Leerzeichen in Adressen und Pfadangaben[Bearbeiten]

Leerzeichen in URIs[Bearbeiten]

Da ein Leerzeichen innerhalb von URIs nicht vorkommen kann und den URI abschließt (Ende der Zeichenkette), werden Leerzeichen in z. B. Ordner- oder Dateinamen UTF8-konform umkodiert. Die Kodierung besteht aus dem Prozentzeichen % und einem zweistelligen Hexadezimalwert (bei Multibyte-Zeichen jeweils für jedes Byte).

Ein Leerzeichen wird mit %20 angegeben. Bei der älteren Codierung application/x-www-form-urlencoded wird ein Pluszeichen + verwendet.

Beispiel:
Auf einem Webserver liegt die Datei „bitte lesen.pdf“ in einem Ordner namens „wichtige dokumente“.

https://www.example.com/wichtige%20dokumente/bitte%20lesen.pdf
https://www.example.com/wichtige+dokumente/bitte+lesen.pdf

Beim Herunterladen der Datei wird in dessen Name wieder das richtige Leerzeichen eingefügt.

Leerzeichen bei lokalen Dateien und Ordnern[Bearbeiten]

Vor Allem in Unix- und unixoiden Systemen kann ein Backslash \ vor dem Leerzeichen verwendet werden, um dem System mitzuteilen, dass ein Leerzeichen Teil des Pfades (Ordner-/Dateiname) ist und nicht die Zeichenkette beendet.

Beispiel:

~/public/wichtige\ dokumente/bitte\ lesen.pdf

Eine weitere Möglichkeit ist es, Pfade mit Leerzeichen in ein Paar doppelte oder einfache Anführungszeichen (" bzw. ') einzuschließen.

Beispiel:

"~/public/wichtige dokumente/bitte lesen.pdf"

'~/public/wichtige dokumente/bitte lesen.pdf'

Leerzeichen in 8.3-Dateinamen[Bearbeiten]

Im FAT-Dateisystem sind Leerzeichen in Dateinamen eigentlich nicht zulässig, werden aber von mancher Software geschrieben und akzeptiert (Beispiel OS/2 auf FAT-Volumes: EA DATA. SF. Dieser Dateiname für die Erweiterten Attribute eines Volumes erfüllt zwar die 8.3-Längenkonvention, enthält aber Leerzeichen, um die Datei vor Zugriffen und Veränderungen zu schützen. Mit moderneren Texteditoren wie Edit.com seit MS-DOS-Version 7.0 sind auch solche Dateinamen lesbar und die Dateien folglich bearbeitbar.). Dateinamen kürzer als acht Buchstaben (und Dateinamenserweiterungen kürzer als drei Buchstaben) werden in den Verzeichniseinträgen von links nach rechts mit Leerzeichen aufgefüllt, welche aber nicht zum Dateinamen gehören.

Im ISO-9660-Dateisystem können Leerzeichen in Dateinamen durch Unterstriche („_“) ersetzt werden.

French/English Spacing[Bearbeiten]

Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Die fraglichen Angaben werden daher möglicherweise demnächst entfernt. Bitte hilf der Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst. Näheres ist eventuell auf der Diskussionsseite oder in der Versionsgeschichte angegeben. Bitte entferne zuletzt diese Warnmarkierung.

Vor dem 20. Jahrhundert war es üblich, nach dem Satzende ein einzelnes, jedoch verbreitertes Leerzeichen zu benutzen. Das im Englischen sogenannte French spacing, also das Setzen eines einzelnen Leerzeichens nach dem Satzende, ist seit dem 20. Jahrhundert üblich und empfohlen. Im Gegensatz dazu steht das im Engl. sog. English spacing, das das Setzen von zwei Leerzeichen nach dem Satzende beschreibt.

Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]

 Wiktionary: Leerzeichen – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise[Bearbeiten]

  1. Karl-Heinz Best: Zur Häufigkeit von Buchstaben, Leerzeichen und anderen Schriftzeichen in deutschen Texten. In: Glottometrics 11, 2005, S. 9–31. Der Beitrag enthält Angaben zur Häufigkeit von Leerzeichen in 5 deutschsprachigen Texten, darunter 4 literarische Texte und ein längerer Pressetext.
  2. Unicode Technical Note #27
  3. Attribute ohne Wertzuweisung im SELFHTML-Wiki
  4. typischer Wert, vgl. TeXbook, S. 433