Automatische Tonhöhenkorrektur

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Automatische Tonhöhenkorrektur (auch als Auto-Tune bezeichnet) ist ein Verfahren zur Tonhöhenänderung bei der Musikproduktion. Dabei wird die Tonhöhe (Intonation) eines Audiosignals, meistens Gesang, korrigiert bzw. verändert, ohne Beeinflussung der Obertonstruktur und des Tempos.

Geschichte[Bearbeiten | Quelltext bearbeiten]

Analoge Tonhöhenkorrektur[Bearbeiten | Quelltext bearbeiten]

Die Korrektur von Tonhöhen wurde erst durch die Aufzeichnung von Musik möglich und variiert noch heute durch Qualität der Aufnahme und der technischen Möglichkeiten. Eine der ersten Methoden, Musik aufzunehmen und somit auch zu korrigieren und zu manipulieren, bot die Schallplatte. In der analogen Tonhöhenkorrektur ist eine Veränderung der Tonhöhe mit einer Veränderung des Tempos und umgekehrt verbunden: Die Erhöhung macht die Aufnahme schneller, die Erniedrigung langsamer.[1]

Digitale Tonhöhenkorrektur[Bearbeiten | Quelltext bearbeiten]

Die Ursprünge der digitalen Tonhöhenkorrektur sind auf erste Musikcomputer zurückzuführen, die in den 1950er Jahren für wissenschaftliche Datenverarbeitung im Einsatz waren. Jedoch waren sie groß und teuer und wurden gegen Ende der 1960er Jahre durch kleinere und günstigere Modelle ersetzt. Diese Geräte konnten zwar noch kein Audiomaterial bearbeiten, jedoch analoge Geräte steuern. In den 1970er Jahren begann dann die eigentliche Entwicklung der heutigen digitalen Tonhöhenkorrektur.[2]

Funktionsweise[Bearbeiten | Quelltext bearbeiten]

Die Veränderung der Tonhöhe eines Klanges ohne gleichzeitige Veränderung der Abspielgeschwindigkeit wird als Pitch Shifting bezeichnet. Die Trennung der Abhängigkeit von Tonhöhe und Geschwindigkeit eines akustischen Signals ist auch analog, per rotierender Tonköpfe, möglich, jedoch aufwendig und die Klangqualität des Ergebnisses fällt gering aus. Größere Verbreitung fand Pitch Shifting erst mit der Einführung digitaler Anwendungen. Die folgenden Verfahren kommen in den meisten aktuellen Anwendungen zur Tonhöhenbearbeitung zum Einsatz, wobei sie mitunter auch kombiniert werden.[3]

Granularsynthese[Bearbeiten | Quelltext bearbeiten]

Die Granularsynthese ist eine Methode, um künstliche Klänge zu generieren. Es wird ein kontinuierlicher Klang „vorgetäuscht“, der in Wirklichkeit aus einzelnen Grains besteht. Diese Grains sind etwa 50 Millisekunden lange Klangfragmente, die der Zuhörer wegen ihrer geringen Dauer nicht als einzelne Klangereignisse wahrnehmen kann. Angewendet wird die Granularsynthese zur Resynthese von gesampletem Material. Der aufgezeichnete Klang wird analysiert und in Grains zerlegt. Dies bewirkt, dass die Tonhöhe nun unabhängig von der Abspielgeschwindigkeit beliebig verändert werden kann (und umgekehrt). Die Granularsynthese kann in Echtzeit angewendet werden.[4]

Phase Vocoder[Bearbeiten | Quelltext bearbeiten]

Beim Phase Vocoding handelt es sich ebenfalls um ein Resynthese-Verfahren. Hier werden wie bei einer Filterbank die Filter in Reihe geschaltet und jeder Filter filtert einen bestimmten Bereich der Frequenzen heraus und ermittelt dessen Lautstärke. Anhand dieser Daten kann nun ein Klang neu zusammengesetzt werden, wobei Klangeigenschaften und zeitliche Strukturen erhalten bleiben. Das Phase Vocoder-Verfahren kann nicht in Echtzeit eingesetzt werden.[5]

Produkte (Beispiele)[Bearbeiten | Quelltext bearbeiten]

Software[Bearbeiten | Quelltext bearbeiten]

Antares Auto-Tune

  • nahezu latenzfreie Echtzeit-Klangmanipulation
  • neben der Bearbeitung von aufgezeichnetem Material auch für den Live-Einsatz geeignet

Melodyne / Ableton Live

  • Audiomaterial wird vor der Bearbeitung einer Analyse unterzogen und anschließend in Echtzeit manipuliert
  • flexible Eingriffe sind möglich, die bei gewöhnlicher Echtzeitbearbeitung starke Latenzen bewirken würden

WaveLab / Time Factory (Prosoniq)

  • Manipulation wird in die Audiodatei hineingerechnet
  • destruktive Bearbeitung (keine Rückkehr zum Originalmaterial möglich)[6]

Mobilgeräte[Bearbeiten | Quelltext bearbeiten]

  • I Am T-Pain (Smule)

Hardware[Bearbeiten | Quelltext bearbeiten]

  • TC-Helicon VoiceLive 2 Vocal Effects Processor
  • DigiTech Vocalist Live 4 Harmony-Effects Processor

Gründe für die Anwendung[Bearbeiten | Quelltext bearbeiten]

Einerseits kann zur Effizienzsteigerung wiederholtes Einsingen im Studio vermieden, bei Konzerten unter verschiedenen Bedingungen eine vermeintlich gleichbleibende Qualität der Musik suggeriert werden, sollte die (Gesangs-)Künstlerin/der Künstler indisponiert oder unvorbereitet sein. „Perfekte“ Gesangsaufnahmen sind daher in deutlich kürzerer Zeit möglich. Andererseits als ästhetisches Gestaltungsmittel angewandt, können Stimmen verfremdet werden.

Anwendungsbeispiele[Bearbeiten | Quelltext bearbeiten]

Audiobeispiel:
1. Original
2. Korrektur
3. Verfremdung

“I would dare to say that (pitch correction) is in almost all music you hear on pop radio to some extent.”

Taylor, Adam (Head Engineer des Camp Street Studio in Cambridge)[7]

Die gebräuchlichste Anwendung automatischer Tonhöhenkorrekturen ist die Perfektionierung von Gesangsspuren in der populären Musik. Die Intensität der Anwendung reicht von der Korrektur einzelner Noten bis zur Verfremdung der gesamten Stimmcharakteristik. Die Stimmverfremdung wurde erstmals Ende der 1990er Jahre von verschiedenen Künstlern gezielt als Stilmittel eingesetzt. Das wohl bekannteste Beispiel ist das Lied Believe von Cher aus dem Jahr 1998 (Cher-Effekt). Große Bekanntheit erhielt der Effekt ebenfalls durch den US-Rapper T-Pain, der ihn als sein Markenzeichen in fast jedem seiner Stücke verwendet.

Kritik[Bearbeiten | Quelltext bearbeiten]

Durch das sofortige Korrigieren der gesungenen und gespielten Töne kann der Hörer nicht mehr unterscheiden, was Realität und Fiktion ist – ihm werden zu jeder Zeit scheinbar perfekt intonierende Künstler präsentiert. In der Vergangenheit kam es zu Protesten gegen die Nutzung von Tonhöhenkorrektursoftware von Seiten der Musiker: Unter anderem veröffentlichte der Rapper Jay Z im Jahr 2009 den Titel D.O.A. (Death of Auto-Tune). Unter Sängern wird der Einsatz von Tonkorrekturen meist verheimlicht. Durch das einheitliche Klangbild tonal korrekter Musik entsteht der Eindruck, Musik verliere durch den Einsatz von Korrektursoftware an Authentizität. Eine Manipulation bei instrumentellen Aufnahmen dagegen wird im Allgemeinen weniger kritisch angesehen. Als Gegenbewegung wird immer mehr Musik frei von Software und anderen Manipulationsinstrumenten gefordert. Aktuell (Stand 2009) ist der Umgang mit Tonhöhenkorrektur-Software wieder offener geworden.[8]

Literatur[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Philip von Beesten: Elastic Audio. Die digitale Manipulation von Tonhöhen- und Zeitstrukturen.. 2009. Abgerufen am 24. Januar 2015. S. 3f.
  2. Philip von Beesten: Elastic Audio. Die digitale Manipulation von Tonhöhen- und Zeitstrukturen.. 2009. Abgerufen am 24. Januar 2015. S. 28.
  3. Philip von Beesten: Elastic Audio. Die digitale Manipulation von Tonhöhen- und Zeitstrukturen.. 2009. Abgerufen am 24. Januar 2015. S. 32.
  4. Curtis Roads: microsound. S. 86–118.
  5. Michael Dickreiter, Volker Dittel, Wolfgang Hoeg, Martin Wöhr: Handbuch der Tonstudiotechnik. S. 87.
  6. Philip von Beesten: Elastic Audio. Die digitale Manipulation von Tonhöhen- und Zeitstrukturen.. 2009. Abgerufen am 24. Januar 2015. S. 50f.
  7. Christopher John Treacy: Fixing Flats. Paula pitchy? Not with an Auto-Tune up!. Online. Zitiert nach Philip von Beesten: Elastic Audio. Die digitale Manipulation von Tonhöhen- und Zeitstrukturen. S. 70f.
  8. Philip von Beesten: Elastic Audio. Die digitale Manipulation von Tonhöhen- und Zeitstrukturen.. 2009. Archiviert vom Original am 14. Juli 2016. Abgerufen am 24. Januar 2015. S. 74, 87-88.