Tonhöhe

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Tonhöhe (englischer Fachbegriff: pitch) ist neben der Tondauer, der Lautheit und der Klangfarbe, eine der wichtigsten wahrnehmbaren Eigenschaften von musikalischen Tönen[1].

Das American National Standards Institute[2] definiert die Tonhöhe[3] als eine Eigenschaft der auditorischen Empfindung „nach der Schalle auf einer musikalischen Tonleiter geordnet werden können (ANSI S1.1)“[4][5]. Dabei werden Tonhöhen im Sinne einer musikalischen Melodie als höher oder tiefer bewertet[6], was jedoch voraussetzt, dass der Hörschall bezüglich der Frequenz und Klarheit stabil genug ist um diesen von einem Geräusch zu unterscheiden[7]. Bei Sinustönen ist sie eng mit der Frequenz des Tones verbunden[4]. Bei komplexen Hörschall hängt die wahrgenommene Tonhöhe zum größten Teil von der Frequenzzusammensetzung des Schalls ab. Normalerweise wird die Tonhöhe als einfache Eigenschaft von Schall verstanden, die durch die Frequenz[8] des periodischen Hörschalls oder seines Grundtons vorgegeben ist, wobei andere Aspekte nicht ohne Bedeutung sind. Der Sachverhalt ist komplex, besonders in Bezug auf Musik spielen harmonische und melodische Zusammenhänge eine wesentliche Rolle, die über dieses einfache Modell hinausgehen.[9]

Hörschall, der einen tonalen Charakter hat, kann das menschliche Gehör eine Tonhöhenempfindung zuordnen. Einen tonalen Charakter haben Schallsignale, bei denen sich die Zeitstruktur periodisch wiederholt (z. B. Schall von schwingenden Saiten). Einen tonalen Charakter haben aber auch nicht-periodische Schallsignale, bei denen eng umgrenzte Frequenzbereiche hervorgehoben sind (z. B. Windheulen oder der Ton von Pauken).

Die Tonhöhe kann als Frequenz wiedergegeben werden, jedoch ist die Tonhöhe nicht nur eine rein objektive physikalische Eigenschaft; sie hat auch eine psychoakustische Komponente. Traditionell war und ist es ein zentrales Problem und Gegenstand der andauernden Forschungen in Bezug auf Sprachsynthese und ihre Wahrnehmung über das Gehör[10]. Für die Psychoakustik ist interessant, wie hoch oder wie tief Töne bestimmter Frequenz wahrgenommen werden. Hierzu wird eine eigene Tonhöhen-Skala aufgebaut, die wahrgenommene Tonhöhe. Die wahrgenommene Tonhöhe wird auch mit dem Begriff Tonheit bezeichnet.

Musikalische Tonhöhe[Bearbeiten]

Zusammenhang von Frequenz, Halbton und Oktave
Frequenzen (in Hertz) des Kammertons a1 und seiner Oktavverwandten

Die Tonhöhe eines Tons ist in der Musik ein musikalischer Parameter und kann unabhängig von anderen Eigenschaften einzeln beurteilt werden. Dabei umfasst die musikalische Tonhöhenwahrnehmung eine lineare und eine zyklische Komponente. Die lineare Tonhöhenwahrnehmung, mit der annähernd eine geometrische Veränderung der zugrunde liegenden Schwingungsfrequenzen einhergeht, ist an den Eindruck zu- bzw. abnehmender Helligkeit gekoppelt. Die zyklische Komponente drückt sich darin aus, dass die bei Verdopplung oder Halbierung der Frequenz eine Oktave höher oder tiefer klingenden Töne als so ähnlich empfunden werden, dass man sie als Wiederkehr von bereits Bekanntem deutet. Alle Töne, die eine oder mehrere Oktaven Abstand haben, fasst man deshalb in einer Tonklasse mit gleicher Tonigkeit zusammen und bezeichnet sie mit den gleichen Namen (ggf. mit einem Zusatz zur Kennzeichnung des Oktavraums).

Absolute und relative Tonhöhe[Bearbeiten]

Üblicherweise gibt das heutige Notenbild eine absolute (genormte) Tonhöhe wieder. Ursprung ist die Internationale Stimmtonkonferenz von 1939 in London, auf der der Kammerton mit a1 = 440 Hz festgesetzt wurde. Jedoch sind auch davon Abweichungen üblich, vor allem bei der Notation von transponierenden Musikinstrumenten bedarf es einer genauen vorherigen Übereinkunft.

Der Charakter einer Melodie ist unabhängig von der absoluten Tonlage. Eine Melodie kann als Ganzes um beliebige Intervalle verschoben werden. Die absolute Tonhöhe, mit der ein Musikstück vorgetragen wird, beruht auf individueller Vereinbarung der Musiker untereinander und ist von vielen Faktoren abhängig:

  • Im einfachsten Fall bestimmt beim Gesang die Stimmlage die verwendete Tonhöhe. Die anderen Instrumente passen sich dem an.
  • Bei Musikinstrumenten mit aufwändigen Systemen zum Stimmen wie bei der Orgel, dem Klavier oder Akkordeon bestimmen diese beim gemeinsamen Musizieren die verwendete Tonhöhe. Eine Verschiebung ist bei ihnen nur halbtonweise durch das Transponieren möglich. Andere Musikinstrumente besitzen meist eine einfache Möglichkeit, ihre Grundstimmung in begrenztem Umfang an vorgenannte Instrumente stufenlos anzupassen.
  • Für musikalische Zwecke sollen aufeinander folgende oder zusammen erklingende Töne „gut klingen“. Dies ist aber nur der Fall, wenn diese Töne bestimmte Frequenzverhältnisse einhalten, nämlich die von musikalischen Intervallen. Die für musikalische Zwecke sinnvollen Frequenzverhältnisse fasst man in Tonleitern zusammen. Die Bezeichnung des Tonleiter-Tons wird dann als Bezeichnung der (relativen) musikalischen Tonhöhe verwendet. Wird zusätzlich noch die Frequenz eines Referenztons angegeben, kann man jedem musikalischen Ton auch eine absolute Tonhöhe zuordnen.

Absolutes, relatives und Intonationsgehör[Bearbeiten]

Einige wenige Menschen verfügen über ein sogenanntes absolutes Gehör (auch Tonhöhengedächtnis) – sind also in der Lage, einem gehörten Ton seine Bezeichnung innerhalb eines bestimmten Tonsystems zuzuordnen, ohne vorher einen anderen Ton als Referenz gehört zu haben.

Vom absoluten Gehör zu unterscheiden ist das relative Gehör, das dazu befähigt, das zwischen zwei nacheinander gehörten Tönen liegende Intervall zu erkennen. Das relative Gehör wird von den allermeisten Menschen im Laufe ihres Lebens durch, oftmals ungezielte, Übung (also „nebenbei“) erlernt und kann zudem auch gezielt trainiert werden. Beim absoluten Gehör ist hingegen strittig, ob es trainierend erworben werden kann oder ob dazu nicht eine besondere angeborene Fähigkeit Voraussetzung ist.

Ein weiterer Aspekt des musikalischen Gehörs ist die Fähigkeit, Unsauberkeiten in der Intonation – also geringe Abweichungen der Tonhöhe von einem vorgegebenen Wert – zu erkennen, und wird entsprechend als Intonationsgehör bezeichnet. Versuche haben gezeigt, dass bereits acht Stunden Training genügen,[11] um an die diesbezügliche Fähigkeit von geschulten Musikern heranzukommen; der Wahrnehmbarkeit von Abweichungen in der Tonhöhe sind jedoch Grenzen gesetzt. So liegt auch für musikalisch gut geschulte Personen die entsprechende Grenze bei zirka drei Cent[12] – wobei dies auch nur dann gilt, wenn es sich um Töne handelt, die im Bereich der besten Wahrnehmbarkeit, also um 500 Hertz, liegen und ausreichend lange andauern.

Tonhöhenunschärfe[Bearbeiten]

Die Tonhöhenempfindung hat eine ausreichende Dauer des Schallsignals zur Voraussetzung. Selbst ein sinusförmiges Schallsignal, das z.B. nur die Dauer einer Halbperiode hat, würde vom Gehör nicht als Ton sondern als Knackgeräusch mit unbestimmter Tonhöhe wahrgenommen. Die Minimalzeit zur Erregung einer diskreten Tonhöhenempfindung ist von der Frequenz abhängig. „Für ein Sinussignal von 1000 Hz liegt dieser Zeitwert bei etwa 12 ms.“[13] Die Wahrnehmung und Auswertung läuft parallel in mehreren Verarbeitungsebenen im Gehirn ab das eng mit den vorgelagerten auditiven System verflochten ist. Die Auswertung erfolgt wesentlich komplexer als das technisch mittels Spektralanalyse möglich ist.[14] Der Grund für die Tonhöhenunschärfe sehr kurzer Schallsignale liegt darin, dass jede Tonhöhen- bzw. Frequenzbestimmumg mit einer unvermeidlichen Ungenauigkeit („Unschärfe“) behaftet ist, da eine absolut exakte Messung eine unendliche Dauer des Schallsignals voraussetzen würde. Dies folgt aus der Unschärferelation zwischen Zeit und Frequenz, da diese beiden Variablen durch eine Fourier-Transformation verknüpfte „konjugierte Größen“ darstellen[15]. Konkret bedeutet dies, dass die Tonhöhe umso unbestimmter wird, je kürzer ein Ton dauert. Hieraus resultiert für die Musizierpraxis die nützliche Erkenntnis, dass bei (sehr) kurzen Tönen Intonationsschwächen weit weniger stören als bei langen.

Wahrgenommene Tonhöhe (Tonheit)[Bearbeiten]

Zusammenhang zwischen Frequenz und wahrgenommener Tonhöhe (siehe auch Bildtext)

Die Tonheit ist in der Psychoakustik eine Empfindungsgröße mit der Maßeinheit Mel, anhand derer man Schallereignisse bezüglich ihrer empfundenen Tonlage ordnen kann. Im Bild rechts ist dargestellt, wie sich anhand von Hörversuchen der Zusammenhang zwischen der Frequenz eines Sinustons und der wahrgenommenen Tonhöhe ergibt. Für komplexe Töne wie diese in der Realität vorkommen gelten diese Empfindungsgrößen der Psychoakustik nicht direkt, und die Abweichungen von der Frequenzskala liegt bis 5 kHz innerhalb der vom Ohr noch nicht wahrnehmbaren Grenzen.[16]

Die Wahrnehmung der Tonhöhe ist eng verbunden mit der Physiologie des Innenohres und des auditorischen Gehirns. Das Innenohr führt eine Frequenzanalyse des gehörten Signals durch. Unterschiedliche Frequenzen führen an unterschiedlichen Orten des Innenohrs zu einer Erregung von Nervenzellen. Der Ort, an dem Nervenzellen verstärkt angeregt werden, kann so zur Bestimmung der Tonhöhe benutzt werden. Die genauen Details der Funktion sind nach wie vor Gegenstand der Forschung und es gibt mehrere Modelle dafür.[14]


  • Bei der Wahrnehmung der Tonhöhe spielt die Zusammensetzung des Tons aus Grundton und Obertönen eine wichtige Rolle. Da für die Tonhöhenwahrnehmung die Periode des Tons wichtig ist, bestimmen z. B. bei nicht hörbarem Grundton die wahrnehmbaren bzw. hörbaren Anteile der Obertöne die empfundene Tonhöhe. Dies steht im Zusammenhang mit dem Residualton, den das menschliche Ohr aus einem Frequenzgemisch bildet. So bleibt die Periode eines Tons nur dann erhalten, wenn der größte gemeinsame Teiler der Obertonfrequenzen wieder den Grundton abbildet. Dies passiert zwar selten in einer natürlichen Umgebung, ist aber grundsätzlich möglich. Besteht z. B. ein Ton aus Grundton und seinen ersten zwei Obertönen und werden dann Grundton und erster Oberton unhörbar, erscheint der Ton eine Oktave und eine Quinte höher. Das kann mit dem ggT (Größter gemeinsamer Teiler) berechnet werden. Ist der Grundton zB. 100 Hz, liegen die ersten zwei Obertöne auf 200 Hz und 300 Hz. Der ggT von 100, 200, 300 ist dann 100. Fehlt der Grundton, errechnet sich die Grundtonhöhe aus 200 und 300, was immer noch 100 ist. Fehlt aber auch der erste Oberton, ist klar, dass der ggT von 300 eben 300 ist. Dieser Effekt kann dann auftreten, wenn z. B. ein Instrument gefiltert wird oder von anderen Klängen so überlagert wird, dass bestimmte Frequenzen maskiert bzw. anderen Klängen zugeordnet werden. Auch spielen bei der Empfindung der Tonhöhe das Wissen, das Gedächtnis und die Erwartungen des Hörers eine Rolle. So würde man z. B. Oktaven immer als ein Ton interpretieren, da der ggT oder die Periode in so einem Frequenzgemisch immer den untersten Grundton ergeben würde. Dies kann das Gehirn anhand des Timbres - also die Gewichtung, Zusammensetzung und Veränderung der Obertöne einschätzen. Umso trainierter bzw. konditioniert der Hörer auf einen bestimmten Klang ist, desto eher nimmt er dabei mehrere Tönhöhen wahr. Das steht auch im Zusammenhang im Erkennen und Wahrnehmen von Akkorden, da das Timbre von dem ggT bei Akkorden selten bei monotonen Klangereignissen vorkommt, da sehr viele der ersten Obertöne fehlen würden und die Periode sehr lang wäre. Deswegen interpretiert das Gehirn in diesen Fällen mehrere Klänge anstatt einen sehr tiefen Ton. Es ist zu beachten, dass das Gehirn nicht mathematisch exakt ermittelt, es hat da auch seine Toleranzen. Der ggT ist nur ein mathematisches Hilfsmittel, um anzunähern, wie lang die Periode mehrerer Frequenzen sein wird.

Literatur[Bearbeiten]

  • Ernst Terhardt: Zur Tonhöhenwahrnehmung von Klängen:
  1. Psychoakustische Grundlagen. In: Acustica. International Journal on Acoustics, Bd. 26 (1972), S. 173–186, ISSN 0001-7884.
  2. Ein Funktionsschema. In: Acustica. International Journal on Acoustics, Bd. 26 (1972), S. 187–199, ISSN 0001-7884
  • Ernst Terhardt, Gerhard Stoll, Manfred Seewann: Algorithm for extraction of pitch and pitch salience from complex tonal signals. In: Journal of the Acoustical Society of America, Bd. 71 (1982), Heft 3, S. 679–688, ISSN 0001-4966
  • Ernst Terhardt: Calculating Virtual Pitch. In: Hearing Research. An international Journal, Jg. 1 (1979), S. 155–182, ISSN 0378-5955
  • Ernst Terhardt: Akustische Kommunikation. Grundlagen mit Hörbeispielen. Springer Verlag, Berlin 1998, ISBN 3-540-63408-8 (+ 1 CD-ROM).
  • Eberhard Zwicker, Hugo Fastl: Psychoacoustics. Facts and Models (Springer series in informations sciences; 22). 2. Aufl. Springer Verlag, Berlin 1999, ISBN 3-540-65063-6.
  • William M. Hartmann: Signals, Sound, and Sensation. Springer, New York 1998, ISBN 1-563-96283-7.[10]
  • Christopher J. Plack, Andrew J. Oxenham, Richard R. Fay, Arthur N. Popper: Pitch. Neural Coding and Perception (Springer Handbook of Auditory Research; 24). Springer, New York 2005, ISBN 0-387-23472-1.
  •  Lynne A. Werner, Richard R. Fay, Arthur N. Popper: Human Auditory Development. 2012, ISBN 1461414210 (Online in der Google-Buchsuche).
  •  Carryl L. Baldwin: Auditory Cognition and Human Performance: Research and Applications. 2012, ISBN 0415325943 (Online in der Google-Buchsuche).

Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]

 Commons: Pitch (sound) – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise[Bearbeiten]

  1.  Roy D. Patterson, Etienne Gaudrain, Thomas C. Walters: Music Perception - The Perception of Family and Register in Musical Tones. 2010, ISBN 978-1-4419-6113-6 (Online in der Google-Buchsuche).
  2. http://www.ansi.org/
  3.  Konrad Karkos: Digitale Musikproduktion von der Idee zum fertigen Song. 2010, ISBN 3869602805 (Online in der Google-Buchsuche).
  4. a b „Die Tonhöhe ist definiert als die Eigenschaft einer Hörempfindung nach der Schalle auf einer musikalischen Tonleiter geordnet werden können (ANSI S1.1), mithin auf einem Kontinuum von ‚tief‘ bis ‚hoch‘. Bei Sinustönen ist sie eng mit der Frequenz des Tones verbunden.“  Stefan Weinzierl: Handbuch der Audiotechnik. 2008, ISBN 3540343008 (Online in der Google-Buchsuche).
  5.  Anssi Klapuri, Manuel Davy: Signal processing methods for music transcription. 2006, ISBN 978-0-387-30667-4 (Online in der Google-Buchsuche).
  6. „For the purposes of this book we decided to take a conservative approach, and to focus on the relationship between pitch and musical melodies. Following the earlier ASA definition, we define pitch as 'that attribute of sensation whose variation is associated with musical melodies.' Although some might find this too restrictive, an advantage of this definition is that it provides a clear procedure for testing whether or not a stimulus evokes a pitch, and a clear limitation on the range of stimuli that we need to consider in our discussions.“  Christopher J., Andrew J. Oxenham, Richard R. Fay: Pitch: Neural Coding and Perception. 2005, ISBN 0-387-23472-1 (Online in der Google-Buchsuche).
  7. „Melody: In the most general case, a coherent succession of pitches. Here pitch means a stretch of sound whose frequency is clear and stable enough to be heard as not noise; succession means that several pitches occur; and coherent means that the succession of pitches is accepted as belonging together.“  Randel, Don Michael: The Harvard Dictionary of Music. 2003, ISBN 978-0-674-01163-2 (Online in der Google-Buchsuche).
  8. „Die Tonhöhe wird durch die Frequenz des Schalls bestimmt, nicht primär durch seine Wellenlänge. [...] In Luft und Wasser nimmt man dein gleichen Ton wahr, obwohl die Wellenlängen bei gleicher Frequenz sehr unterschiedlich sind.“  Hartmut Zabel: Kurzlehrbuch Physik. 2010, ISBN 313162521X (Online in der Google-Buchsuche).
  9. „Pitch is an important quality of sound, the focus of intense inquiry and investigation since antiquity. Pitch is basic to two forms of behavior specific to humans: speech and music. Pitch is usually understood as a one-dementional precept determined by the period of the stimulus (or its inverse, F0), and insensitive to changes along other stimulus dimensions. However, its complex role within music involves harmonic and melodic effects that go beyond this simple one-dementional model. There is still debate as to where, and how, pitch is extracted within the auditory system.“  Christopher J. Plack, David R. Moore: Hearing Olp Series Oxford Handbooks Oxford library of psychology Volume 3 of The Oxford Handbook of Auditory Science, Christopher J. Plack . 2010, ISBN 0199233551 (Online in der Google-Buchsuche).
  10. a b  Hartmann, William Morris: Signals, Sound, and Sensation. 1997, ISBN 1-56396-283-7 (Online in der Google-Buchsuche).
  11. „Pure [Sinus] tones produce a clear, unambiguous pitch, and we are very sensitiv to changes in there frequency. For instance, well-trained listeners can distinguish between two tones with frequences of 1000 and 1002 Hz - a differnce of only 0,2% (Moore, 1973). A semitone, the smalest step in the Western scale system, is a differnce of about 6%, or about a factor of 30 greather then the JND of frequency for pure [Sinus] tones. Perhaps not surprisingly, musicans are generally better then nonmusicans at discriminating small changes in frequency; what is more surpising is that it does not take much practice for people with no musical training to "catch up" with musicans in terms of there performance. In a recent study, [...] it took only between 4 and 8 hours of practice [...] of the untrained listeners to match those of the trained musicans,[...]“  Diana Deutsch: The Psychology of Music. 2012, ISBN 0123814618 (Online in der Google-Buchsuche).
  12. „The average JND for the oktave was 16 cents, and JNDs for other intervals of the chromatic scale ranged from 13 to 26 cents. [...] for Example, Hagerman and Sundberg (1980) reported that the avarage intonation accuracy in a sample of expert barbershop songs was less then 3 cents.“  Diana Deutsch: The Psychology of Music. 2012, ISBN 0123814618 (Online in der Google-Buchsuche).
  13.   Werner Kaegi: Was ist elektronische Musik. Orell Füssli, Zürich 1967, S. 63.
  14. a b „Effects of Peripheral Tuning on the Auditory Nerve's Representation of Speech Envelope and Temporal Fine Structure Cues“  Enrique A. Lopez-Poveda, A. Alan R. Palmer, Ray Meddis: The Neurophysiological Bases of Auditory Perception. 2010, ISBN 1441956867 (Online in der Google-Buchsuche).
  15.  M. Wollenhaupt: Einführung in die Fouriertransformation. S. 39. online
  16. „There is some psychoacostical evidence for both place and temporal codes. One piece of evidnce in favor of a temporal code is that pitch discriminatin abilitis deteriorate at fequences above 4 to 5 kHz - the same frequency range above with listeners' ability to recognice familar melodies (Oxenham, Micheyl, Keebler, Loper, & Santurette, 2011), degrades. ... “  Diana Deutsch: The Psychology of Music. 2012, ISBN 0123814618 (Online in der Google-Buchsuche).