„Mel“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
→‎Gehörmechanismen zur Tonheitsbestimmung: Wichtig unterscheidung komplexe Töne oder Sinus
Quelle eingefügt
Zeile 48: Zeile 48:
*Im Bereich hoher Frequenzen oberhalb von 1600 Hz ist das Gehör nicht mehr in der Lage, die Zeitstruktur der Ohrsignale zu verfolgen. Hier wird die Tonhöhenempfindung aus der Position des Erregungsmaximums auf der Basilarmembran abgeleitet. Zwischen der Tonheit und dem Ort maximaler Schwingungsamplitude der [[Basilarmembran]] des [[Innenohr]]s besteht hier ein linearer Zusammenhang; das heißt, gleichen Strecken auf der Basilarmembran entsprechen gleichen Tonheitsdifferenzen.
*Im Bereich hoher Frequenzen oberhalb von 1600 Hz ist das Gehör nicht mehr in der Lage, die Zeitstruktur der Ohrsignale zu verfolgen. Hier wird die Tonhöhenempfindung aus der Position des Erregungsmaximums auf der Basilarmembran abgeleitet. Zwischen der Tonheit und dem Ort maximaler Schwingungsamplitude der [[Basilarmembran]] des [[Innenohr]]s besteht hier ein linearer Zusammenhang; das heißt, gleichen Strecken auf der Basilarmembran entsprechen gleichen Tonheitsdifferenzen.
*Im Frequenzbereich etwa zwischen 800 und 1600 Hz überlappen sich die beiden Mechanismen. Hier gibt es stärkere individuelle Unterschiede, z. B. können Profimusiker oft noch zu etwas höheren Frequenzen die Zeitstruktur der Ohrsignale auswerten als musikalisch ungeübte.
*Im Frequenzbereich etwa zwischen 800 und 1600 Hz überlappen sich die beiden Mechanismen. Hier gibt es stärkere individuelle Unterschiede, z. B. können Profimusiker oft noch zu etwas höheren Frequenzen die Zeitstruktur der Ohrsignale auswerten als musikalisch ungeübte.
* Die wahrgenommene Tonhöhe von komplexen Tönen unterscheidet sich von der Wahrnehmung von Sinustönen ist mit geringen Abweichungen generell proportional zum Logarithmus der Frequenz. Das ist über weite Frequenzbereiche bis zu 5 kHz der Fall. Über diesen Bereich ist für komplexe Töne die „gerade noch wahrnehmbare Abweichung“ (jnd) approximativ konstant.
* Die wahrgenommene Tonhöhe von komplexen Tönen unterscheidet sich von der Wahrnehmung von Sinustönen ist mit geringen Abweichungen generell proportional zum Logarithmus der Frequenz. Das ist über weite Frequenzbereiche bis zu 5 kHz der Fall. Über diesen Bereich ist für komplexe Töne die „gerade noch wahrnehmbare Abweichung“ (jnd) approximativ konstant.<ref name="virtuelle Tonhöhe" />


== Empfindungsstufen ==
== Empfindungsstufen ==
Zeile 83: Zeile 83:
<references>
<references>
<ref name="ERB" > {{Literatur | Autor=Gert Tickheit, Theo Herrmann, Werner Deutsch | Titel=''Psycholinguistics'' | Jahr = 2003 | ISBN=3110114240 | Seite=207 | Online={{Google Buch|BuchID=-91scIqVmuIC&dq=Umrechnung%20von%20Frequenz%2C%20ERB%2C%20Bark%20und%20Mel | Seite=207 | Linktext=Online}}}}</ref>
<ref name="ERB" > {{Literatur | Autor=Gert Tickheit, Theo Herrmann, Werner Deutsch | Titel=''Psycholinguistics'' | Jahr = 2003 | ISBN=3110114240 | Seite=207 | Online={{Google Buch|BuchID=-91scIqVmuIC&dq=Umrechnung%20von%20Frequenz%2C%20ERB%2C%20Bark%20und%20Mel | Seite=207 | Linktext=Online}}}}</ref>

<ref name="virtuelle Tonhöhe" > „Ein interessantes Phänomen stellt die so genante virtuelle Tonhöhe dar. Diese entsteht dadurch, dass das Gehör bei komplexen Schallen aus dem vielfachen vorhandenen Spekraltonhöhen eine virtuelle Tonhöhe ermittelt [Zwicker 1982“ {{Literatur |Autor=Gerhard Muller, Michael Müser | Titel=''Taschenbuch der technischen Akustik'' | Jahr = 2004 | ISBN=3642188931 | Seite=84 |Online={{Google Buch|BuchID=99_004Seq0AC&dq=Zur%20Tonh%C3%B6henwahrnehmung%20von%20Kl%C3%A4ngen | Seite=86 | Linktext=Online}}}}</ref>
</references>
</references>



Version vom 21. Mai 2013, 12:47 Uhr

Vorlage:Infobox Einheit

Das Mel ist die Maßeinheit für die psychoakustische Größe Tonheit mit dem Formelzeichen Z (oder z) und beschreibt die wahrgenommene Tonhöhe, also die Tonhöhenwahrnehmung. Die Mel-Skala wurde 1937 von Stanley Smith Stevens, John Volkman und Edwin Newmann vorgeschlagen. Die Bezeichnung Mel leitet sich vom englischen Wort melody ab.

Definitionen der Tonheit in Mel

Es gibt zwei Definitionen der Mel-Skala, die sich jeweils im Referenzwert unterscheiden:

In beiden Definitionen gilt: ein Ton, der doppelt so hoch wahrgenommen wird, erhält den doppelten Tonheitswert, ein Ton, der als halb so hoch wahrgenommen wird, den halben Tonheitswert. Mit Hilfe psychoakustischer Versuche kann so die Tonheitsskala bestimmt werden.

Der restliche Artikel bezieht sich auf die Skala nach Eberhard Zwicker.

Zusammenhang zwischen Frequenz und Tonheit

Zusammenhang zwischen Frequenz und wahrgenommener Tonhöhe (Tonheit in Mel)

Für den Zusammenhang zwischen Tonheit und Frequenz gilt:

  • Für Frequenzen f bis ca. 500Hz verlaufen die logarithmische Frequenzskala und die logarithmische Mel-Skala nahezu proportional.

Eine Verdopplung der Frequenz von 100 Hz auf 200 Hz führt somit zu einer Verdopplung der Tonheit von 100 mel auf 200 mel. Ein musikalisches Intervall von einer Oktave entspricht hier einer Verdopplung der empfundenen Tonhöhe.

  • Für Frequenzen f größer als 500 Hz stehen Frequenz und Tonheit in einem nichtlinearen Zusammenhang. (1000Hz = 850mel, 8000Hz = 2100mel)[2] So muss zum Beispiel die Frequenz eines Tons von 1500 Hz auf 10000 Hz erhöht werden, um eine Verdopplung der Tonheit von 1100 mel auf 2200 mel zu erreichen; es ist hier ein musikalisches Intervall von mehr als 2,5 Oktaven erforderlich, um eine Verdopplung der empfundenen Tonhöhe zu erzielen. Das heißt, in diesem Frequenzbereich werden Tonintervalle kleiner wahrgenommen als sie es musikalisch gesehen sind.

Die Mel-Skala in kHz kann mit folgender Formel approximativ beschrieben werden:

[3][4][5]

Gehörmechanismen zur Tonheitsbestimmung

Zusammenhang zwischen Basilarmembranort, Tonheit in Mel und Frequenz eines Tons

Das Gehör wendet unterschiedliche Mechanismen an, um Tonhöhen wahrzunehmen:

  • Im Bereich niedriger Frequenzen unterhalb von 500...800 Hz wird vor allem die Zeitstruktur der Ohrsignale ausgewertet und zur Tonhöhenempfindung heran gezogen. Hier folgt die Tonhöhenempfindung sehr genau der musikalischen Tonhöhe.
  • Im Bereich hoher Frequenzen oberhalb von 1600 Hz ist das Gehör nicht mehr in der Lage, die Zeitstruktur der Ohrsignale zu verfolgen. Hier wird die Tonhöhenempfindung aus der Position des Erregungsmaximums auf der Basilarmembran abgeleitet. Zwischen der Tonheit und dem Ort maximaler Schwingungsamplitude der Basilarmembran des Innenohrs besteht hier ein linearer Zusammenhang; das heißt, gleichen Strecken auf der Basilarmembran entsprechen gleichen Tonheitsdifferenzen.
  • Im Frequenzbereich etwa zwischen 800 und 1600 Hz überlappen sich die beiden Mechanismen. Hier gibt es stärkere individuelle Unterschiede, z. B. können Profimusiker oft noch zu etwas höheren Frequenzen die Zeitstruktur der Ohrsignale auswerten als musikalisch ungeübte.
  • Die wahrgenommene Tonhöhe von komplexen Tönen unterscheidet sich von der Wahrnehmung von Sinustönen ist mit geringen Abweichungen generell proportional zum Logarithmus der Frequenz. Das ist über weite Frequenzbereiche bis zu 5 kHz der Fall. Über diesen Bereich ist für komplexe Töne die „gerade noch wahrnehmbare Abweichung“ (jnd) approximativ konstant.[6]

Empfindungsstufen

Es lassen sich 620 Empfindungsstufen der Tonheit mit einer konstanten Breite von 3,9 mel unterscheiden. Der gesamte Hörbereich von 16 Hz bis 19000 Hz umfasst 2400 mel.

Ein weiteres Maß der Tonheit ist das Bark: 1 Bark = 100 mel oder 1 mel = 0,01 Bark [7]

Für kritische Bänder (Frequenzgruppen) gibt es zwei Skalen: Die Bark-Skala (Mel-Skala) und die ERB-Skala.[8]

Literatur

  • Ernst Terhardt: Zur Tonhöhenwahrnehmung von Klängen I, Psychoakustische Grundlagen; Acustica 26, S. 173–186 (1972)
  • Stanley Smith Stevens, John Volkman, Edwin Newman: A scale for the measurement of the psychological magnitude of pitch. In: The Journal of the Acoustical Society of America. 8. Jahrgang, Nr. 3. Acoustical Society of America, 1937, S. 185-90 (aip.org [abgerufen am 4. September 2008]).

Siehe auch

Einzelnachweise

  1. Sprachverarbeitung: Grundlagen und Methoden der Sprachsynthese und Spracherkennung, Beat Pfister, Tobias Kaufmann, 2008, Seite 95 online
  2. Grundbegriffe - Akustische Phonetik, Universität zu Köln
  3. A COMPARATIVE STUDY OF PERFORMANCE OF FPGA BASED MEL FILTER BANK & BARK FILTER BANK, Debalina Ghosh, Depanwita Sarkar Debnath, Saikat Bose, Department of Microelectronics & VLSI Design, Techno India, SaltLake, Kolkata, PDF
  4. Prof. Bryan Pellom, “Automatic Speech Recognition : From Theory to Practice” Department of Computer Science Center for Spoken Language Research University of Colorad PDF
  5. Dipl.-Ing. Jan Robert Stadermann: Automatische Spracherkennung mit hybriden akustischen Modellen.PDF
  6. „Ein interessantes Phänomen stellt die so genante virtuelle Tonhöhe dar. Diese entsteht dadurch, dass das Gehör bei komplexen Schallen aus dem vielfachen vorhandenen Spekraltonhöhen eine virtuelle Tonhöhe ermittelt [Zwicker 1982“ Gerhard Muller, Michael Müser: Taschenbuch der technischen Akustik. 2004, ISBN 3-642-18893-1 (Online in der Google-Buchsuche).
  7. Digitale Sprachsignalverarbeitung, Peter Vary, Ulrich Heute, Wolfgang Hess, 1998 ISBN 3519061651, 9783519061656, Seite 34 online
  8. Gert Tickheit, Theo Herrmann, Werner Deutsch: Psycholinguistics. 2003, ISBN 3-11-011424-0 (Online in der Google-Buchsuche).