Mel

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Physikalische Einheit
Einheitenname Mel
Einheitenzeichen
Physikalische Größe Tonheit
Formelzeichen
Dimension
Benannt nach englisch melody

Das Mel (vom englischen Wort melody) ist die Maßeinheit für die psychoakustische Größe Tonheit mit dem Formelzeichen Z (oder z) und beschreibt die wahrgenommene Tonhöhe von Sinustönen, also die Tonhöhenwahrnehmung. Die Mel-Skala wurde 1937 von Stanley Smith Stevens, John Volkman und Edwin Newmann vorgeschlagen.

Allgemein gilt für die Tonheit: ein Ton, der doppelt so hoch wahrgenommen wird, erhält den doppelten Tonheitswert, ein Ton, der als halb so hoch wahrgenommen wird, den halben Tonheitswert. So kann mit Hilfe psychoakustischer Versuche die Tonheitsskala bestimmt werden.

Für die Mel-Skala gibt es zwei Definitionen, die sich im Referenzwert unterscheiden:

  • Basis der ursprünglichen Definition nach Stanley Smith Stevens ist der Ton mit der Frequenz f = 1000 Hertz, ihm wird die Tonheit Z = 1000 mel zugeordnet.[1]
Diese Mel-Skala kann mit folgender Formel approximativ beschrieben werden[1][2][3][4]:
  • Eberhard Zwicker definierte später eine Mel-Skala basierend auf der Bark-Skala mit dem musikalischen Ton c als Basis. Diesem Ton mit der Frequenz f = 131 Hertz wird die Tonheit Z = 131 mel zugeordnet. Später wurde erneut auf 125 Hz geändert. Auf diese Definition bezieht sich der restliche Artikel.

Zusammenhang mit der Frequenz

[Bearbeiten | Quelltext bearbeiten]
Zusammenhang zwischen wahrgenommener Tonhöhe (Tonheit in Mel) und Frequenz

Für den Zusammenhang zwischen Tonheit und Frequenz gilt:

  • Für Frequenzen bis ca. 500 Hz verlaufen die Frequenzskala und die Mel-Skala nahezu proportional. Eine Verdopplung der Frequenz von 100 Hz auf 200 Hz führt somit zu einer Verdopplung der Tonheit von 100 mel auf 200 mel. D. h. ein musikalisches Intervall von einer Oktave entspricht hier einer Verdopplung der empfundenen Tonhöhe.
  • Für Frequenzen größer als 500 Hz stehen Frequenz und Tonheit in einem nichtlinearen Zusammenhang (1000 Hz = 850 mel, 8000 Hz = 2100 mel).[5] So muss z. B. die Frequenz eines Tons von 1500 Hz auf 10.000 Hz erhöht werden, um eine Verdopplung der Tonheit von 1100 mel auf 2200 mel zu erreichen; hier ist für eine Verdopplung der empfundenen Tonhöhe also ein musikalisches Intervall von mehr als 2,5 Oktaven erforderlich. D. h. in diesem Frequenzbereich werden Tonintervalle kleiner wahrgenommen, als sie es musikalisch gesehen sind.
  • Die wahrgenommene Tonhöhe von komplexen Tönen unterscheidet sich von derjenigen der bisher beschriebenen rein harmonischen Sinustöne. Bis zu einer Frequenz von 5 kHz ist sie – mit geringen Abweichungen – proportional zum Logarithmus der Frequenz. In diesem Bereich ist die „gerade noch wahrnehmbare Abweichung“ (JND, just noticable difference) für komplexe Töne approximativ konstant.[6]

Gehörmechanismen zur Tonheitsbestimmung

[Bearbeiten | Quelltext bearbeiten]
Zusammenhang zwischen Ort auf der Basilarmembran, Tonheit in Mel und Frequenz eines Tons

Das Gehör wendet unterschiedliche Mechanismen an, um Tonhöhen wahrzunehmen:

  • bei Frequenzen unterhalb von 500…800 Hz wird vor allem die Zeitstruktur der Ohrsignale ausgewertet und zur Tonhöhenempfindung herangezogen. Hier folgt die Tonhöhenempfindung sehr genau der musikalischen Tonhöhe.
  • bei Frequenzen oberhalb von 1600 Hz ist das Gehör nicht mehr in der Lage, die Zeitstruktur der Ohrsignale zu verfolgen. Hier wird die Tonhöhenempfindung aus der Position des Erregungsmaximums auf der Basilarmembran des Innenohrs abgeleitet, indem zwischen der Tonheit und dem Ort maximaler Schwingungsamplitude der Basilarmembran ein linearer Zusammenhang angenommen wird: gleichen Strecken auf der Basilarmembran entsprechen gleiche Tonheitsdifferenzen.
  • bei Frequenzen etwa zwischen 800 und 1600 Hz überlappen sich die beiden beschriebenen Mechanismen.

Empfindungsstufen

[Bearbeiten | Quelltext bearbeiten]

Im gesamten Hörbereich von 16 Hz bis 19.000 Hz lassen sich 620 Empfindungsstufen der Tonheit mit einer konstanten Breite von 3,9 mel unterscheiden. Damit umfasst der Hörbereich 2400 mel.

Ein weiteres Maß der Tonheit ist das Bark: 1 Bark = 100 mel 1 mel = 0,01 Bark.[7] Es ist die Basis der Bark-Skala für kritische Bänder (Frequenzgruppen). Eine weitere Frequenzgruppen-Skala ist die ERB-Skala.[8]

  • Ernst Terhardt: Zur Tonhöhenwahrnehmung von Klängen I, Psychoakustische Grundlagen; Acustica 26, (1972). S. 173–186
  • Stanley Smith Stevens, John Volkman, Edwin Newman: A scale for the measurement of the psychological magnitude of pitch. In: The Journal of the Acoustical Society of America. Band 8, Nr. 3. Acoustical Society of America, 1937, S. 185–90 (englisch).
  • Ville Pulkki, Matti Karjalainen: Communication Acoustics: An Introduction to Speech, Audio and Psychoacoustics. John Wiley & Sons, 2015, ISBN 978-1-118-86654-2.
Commons: Mel scale – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. a b Beat Pfister, Tobias Kaufmann: Sprachverarbeitung: Grundlagen und Methoden der Sprachsynthese und Spracherkennung. 2008, ISBN 3-540-75910-7, S. 95 (eingeschränkte Vorschau in der Google-Buchsuche).
  2. A COMPARATIVE STUDY OF PERFORMANCE OF FPGA BASED MEL FILTER BANK & BARK FILTER BANK, Debalina Ghosh, Depanwita Sarkar Debnath, Saikat Bose, Department of Microelectronics & VLSI Design, Techno India, SaltLake, Kolkata PDF
  3. Prof. Bryan Pellom, “Automatic Speech Recognition : From Theory to Practice” Department of Computer Science Center for Spoken Language Research University of Colorado PDF (Memento des Originals vom 2. August 2014 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.cs.tut.fi
  4. Jan Robert Stadermann: Automatische Spracherkennung mit hybriden akustischen Modellen. (tum.de [PDF]).
  5. Grundbegriffe - Akustische Phonetik, Universität zu Köln
  6. „Ein interessantes Phänomen stellt die sogenannte virtuelle Tonhöhe dar. Diese entsteht dadurch, dass das Gehör bei komplexen Schallen aus dem vielfachen vorhandenen Spektraltonhöhen eine virtuelle Tonhöhe ermittelt [Zwicker 1982]“ Gerhard Müller, Michael Möser: Taschenbuch der Technischen Akustik. 2004, ISBN 3-540-41242-5, S. 821 (eingeschränkte Vorschau in der Google-Buchsuche).
  7. Peter Vary, Ulrich Heute, Wolfgang Hess: Digitale Sprachsignalverarbeitung. 2003, ISBN 3-519-06165-1, S. 34 (eingeschränkte Vorschau in der Google-Buchsuche).
  8. Gert Tickheit, Theo Herrmann, Werner Deutsch: Psycholinguistics. 2003, ISBN 3-11-011424-0, S. 207 (eingeschränkte Vorschau in der Google-Buchsuche).