Direct Stream Digital

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

DSD (Direct Stream Digital) ist eine Methode der hochauflösenden Audiosignalspeicherung, die auf dem Prinzip der Delta-Sigma-Modulation beruht.

Angewendet wird die DSD-Technologie im Wesentlichen bei der Super Audio CD (SACD). Gespeichert wird dabei der direkte Datenstrom eines Delta-Sigma-Modulators, der mit 2,8224 MHz arbeitet, was dem 64-fachen (DSD64) der 44,1 kHz Abtastrate der Red-Book-Audio-CD entspricht, welche mit linearen 16-bit-Wandlern arbeiten. Neuere, höher auflösende DSD-Versionen gehen darüber weit hinaus, z.B. bis zum 512-fachen der 44,1 kHz-Rate (DSD512), aber auch DSD128 und DSD256 sind im HiRes-Bereich üblich. Als Speichermedien dienen heute Festplatten, SSDs, USB-Sticks und Flash-Speicherkarten.

Funktion[Bearbeiten | Quelltext bearbeiten]

Der so gewonnene hochaufgelöste 1-Bit-Datenstrom wird direkt aufgezeichnet, statt ihn - wie in klassischen Analog-Digital-Umsetzern üblich - intern zu dezimieren und mit geringerer Rate als Datenwort mit 16, oder 24 Bit Breite als PCM auszugeben. Durch die Überabtastung sind die gespeicherten Audioinformationen technisch präziser, als nach PCM aufgezeichnete Daten, da noch keine Quantisierung auf die Abtastrate erfolgt. Bei der Reproduktion entsteht hierbei ein Vorteil, da steilflankige Interpolations- und Anti-Aliasing-Filter überflüssig sind, die bislang bei der herkömmlichen CD dazu verwendet werden, Frequenzen oberhalb 20 kHz abzutrennen, um die Samplefrequenz von z.B. 44,1kHz zu unterdrücken.

Stattdessen kann das DSD-Format direkt ausgegeben werden, weil das entstehende Oberwellenspektrum weit im unhörbaren Bereich liegt. Durch die grundsätzlich geringe Dynamik eines Sigma-Delta-Analog-Digital-Wandlers mit nur einem Bit als Quantisierungsstufe entsteht zwar ein enormes Wandlungsrauschen, das allerdings durch den Effekt des Noise Shaping in den hochfrequenten Bereich verschoben ist. Bildlich lässt sich das Signal so begreifen, dass durch rasches Wechseln von Plus und Minus an einem Lautsprecher mit unterschiedlich langen Vorwärts-Rückwärtsphasen letztlich der Verlauf des Tonsignals nachgebildet wird. Durch die Trägheit der Luft und des Gehörs, wird damit nur die Audiowelle wahrnehmnbar. Praktisch erfolgt jedoch schon im Wiedergabesystem - spätestens aber durch die Lautsprecher - eine Bandlimitierung.

Im DSD64-Format ist der Frequenzgang auf etwa 100 kHz ausgeweitet, bei einem Dynamik von etwa 120 dB im hörbaren Frequenzbereich.

Kritik[Bearbeiten | Quelltext bearbeiten]

Die im DSD-Format zu speichernden Datenmengen sind grundsätzlich größer, als beim üblicherweise verwendeten PCM-Format, was jedoch nicht zwangsläufig zu wahrnehmbaren Klangverbesserungen führt. Es existiert bisher kein praktischer Nachweis, dass die von Entwicklern und Anwendern behauptete Klangverbesserung von DSD gegenüber PCM tatsächlich existiert. In einer Studie der Hochschule für Musik Detmold konnten die Teilnehmer bei entsprechenden Blindtests keine statistisch relevanten Unterschiede zwischen den Datenformaten hören. Der Autor der Studie zieht das Fazit, „dass selbst mit hochwertigstem Equipment unter optimalen Abhörbedingungen und unterschiedlichsten Hörfokussierungen bzw. Hörerfahrungen der Probanden in der Regel keine signifikanten Unterschiede zwischen DSD und High Resolution PCM (24 bit/176,4 kHz) hörbar sind, sich demzufolge die These aufstellen ließe, dass sich keines der getesteten Systeme durch klangliche Eigenschaften hervorhebt“ und verweist auf „das hohe Maß an Frustration, das viele Probanden, die in der Mehrzahl professionelles und kritisch-analytisches Hören gewohnt waren, während der Durchführung der Tests empfanden und das sie auf für sie nicht annähernd zu erkennende klangliche Unterschiede zurückführten“.[1]

Als Grund kann angenommen werden, dass die in modernen Audio-Wandlern angewendete Methoden wie Überabtastung und Phasenmodulation (Dithering) sowohl bei Aufnahme und Wiedergabe ausreichend gut sind, um die theoretisch nachteiligen Effekte der frühzeitigen Dezimation der Datenraten auf eine geringe Abtastfrequenz zu kaschieren. Vor allem die Filtertechnologie in den Chips hat in den vergangenen Jahren starke Fortschritte gemacht. Mithin sind von den Rekonstruktionsfiltern erzeugten Ampltituden- und Phasenfehler vorwiegend im Hochtonbereich angesiedelt, der von typischen Audiosignalen nur gering belegt ist.

Mithin kommen heute Abtastraten von 192kHz bei Auflösungen von 24 Bit zur Anwendung, die nicht nur erheblich genauer sind, als das ursprüngliche Format, sondern es auch gestatten, weniger steile Filter mit weniger Fehlern zu verwenden. Man kann mathematisch zeigen, dass ein relativ weich auslaufendes Rekonstruktionsfilter, das mit 192kHz Datenrate angesteuert wird und damit erst bei 96kHz voll sperren muss, ohne weiteres bis weit über 20kHz voll linear übertragen kann und sich damit nur theoretische Verbesserungen ergeben, wenn es mit noch höheren Raten angefahren würde. Letztlich treten also durch die in den Chips integrierte Datenvorfilterung keine nennenswerten Verluste auf.

Richtig ist allerdings, dass es bei Vorhandensein eines solchen DSD-Datenstroms sehr viel einfacher und technisch genauer möglich ist, auf jede beliebige andere Abtastfrequenz umzutasten, als es bei schon herunterdezimierter Abtastfrequenz möglich ist, da dann ein Resampling erfolgen muss. Daher werden in Samplern für die Musikerzeugung teilweise solche Bruttodatenströme verwendet. Auch Sample-Raten-Konverter nutzen das Format, indem sie zunächst von einer geringen Taktfrequenz aus nach oben gehen, dort wie im Analogen filtern um es dann neu abzutasten.

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Thomas Görne: Tontechnik. 1. Auflage, Carl Hanser Verlag, Leipzig 2006, ISBN 3-446-40198-9
  • Hubert Henle: Das Tonstudio-Handbuch. 5. Auflage, GC Carstensen Verlag, München 2001, ISBN 3-910098-19-3

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Dominik Blech, Min-Chi Yang: Hörvergleich DSD gegen High-Resolution-PCM. Diplomarbeit am Erich-Thienhaus-Institut der Hochschule für Musik Detmold. Hrsg.: Erich-Thienhaus-Institut der Hochschule für Musik Detmold. 2003 (http://www.eti.hfm-detmold.de/lehraktiv/diplomarbeiten/untersuchung-zur-differenzierbarkeit-digitaler-aufzeichnungsverfahren-hoervergleich-direct-stream-digital-dsd-und-high-resolution-pcm-24bit-176-4khz Zugriff=2016-01-28).