Direct Stream Digital

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

DSD (Direct Stream Digital) ist eine Methode der hochauflösenden Audiosignalspeicherung, die auf dem Prinzip der Delta-Sigma-Modulation beruht.

Angewendet wird das DSD-Verfahren hauptsächlich bei der Super Audio CD (SACD). Gespeichert wird dabei der direkte Datenstrom eines Delta-Sigma-Modulators (damit ist das Ausgangssignal der Rückkopplungsschleife des Modulators gemeint), der mit 2,8224 MHz arbeitet, was dem 64-fachen (DSD64) der 44,1 kHz Abtastrate der Red-Book-Audio-CD entspricht, welche mit linearen 16-bit-Wandlern arbeiten. Neuere, höher auflösende DSD-Versionen gehen darüber weit hinaus, z. B. bis zum 512-fachen der 44,1 kHz-Rate (DSD512), aber auch DSD128 und DSD256 sind üblich. Als Speichermedien dienen heute Festplatten, SSDs, USB-Sticks und Flash-Speicherkarten.

Funktion[Bearbeiten | Quelltext bearbeiten]

Der so gewonnene hochaufgelöste Ein-Bit-Datenstrom wird direkt aufgezeichnet, statt ihn – wie in klassischen Analog-Digital-Umsetzern üblich – intern zu dezimieren und mit geringerer Rate als Datenwort mit 16, oder 24 Bit Breite als PCM auszugeben. Durch die Überabtastung sind die gespeicherten Audioinformationen technisch präziser als nach PCM aufgezeichnete Daten, da noch keine Quantisierung auf die Abtastrate erfolgt. Bei der Reproduktion entsteht hierbei ein Vorteil, da steilflankige Interpolations- und Anti-Aliasing-Filter überflüssig sind, die bislang bei der herkömmlichen CD dazu verwendet werden, Frequenzen oberhalb 20 kHz abzutrennen, um die Samplefrequenz von z. B. 44,1 kHz zu unterdrücken.

Stattdessen kann das DSD-Format direkt ausgegeben werden, weil das entstehende Oberwellenspektrum weit im unhörbaren Bereich liegt. Durch die grundsätzlich geringe Dynamik eines Sigma-Delta-Analog-Digital-Wandlers mit nur einem Bit als Quantisierungsstufe entsteht zwar ein enormes Wandlungsrauschen, das aber durch den Effekt des Noise Shaping in den hochfrequenten Bereich verschoben ist. Bildlich lässt sich das Signal so begreifen, dass durch rasches Wechseln von Plus und Minus an einem Lautsprecher mit unterschiedlich langen Vorwärts-Rückwärtsphasen letztlich der Verlauf des Tonsignals nachgebildet wird. Durch die Trägheit der Luft und des Gehörs wird damit nur die Audiowelle wahrnehmnbar. Praktisch erfolgt jedoch schon im Wiedergabesystem – spätestens aber durch die Lautsprecher – eine Bandbegrenzung.

Im DSD64-Format ist der Frequenzgang auf etwa 100 kHz ausgeweitet, bei einer Dynamik von etwa 120 dB im hörbaren Frequenzbereich.

Kritik[Bearbeiten | Quelltext bearbeiten]

Die im DSD-Format zu speichernden Datenmengen sind grundsätzlich größer als beim üblicherweise verwendeten PCM-Format, was jedoch nicht zwangsläufig zu wahrnehmbaren Klangverbesserungen führt. Es existiert bisher kein praktischer Nachweis, dass die von Entwicklern und Anwendern behauptete Klangverbesserung von DSD gegenüber PCM tatsächlich existiert. In einer Studie der Hochschule für Musik Detmold konnten die Teilnehmer bei entsprechenden Blindtests keine statistisch relevanten Unterschiede zwischen den Datenformaten hören. Die Autoren der Studie ziehen das Fazit, „dass selbst mit hochwertigstem Equipment unter optimalen Abhörbedingungen und unterschiedlichsten Hörfokussierungen bzw. Hörerfahrungen der Probanden in der Regel keine signifikanten Unterschiede zwischen DSD und High Resolution PCM (24 bit/176,4 kHz) hörbar sind, sich demzufolge die These aufstellen ließe, dass sich keines der getesteten Systeme durch klangliche Eigenschaften hervorhebt“ und verweisen auf „das hohe Maß an Frustration, das viele Probanden, die in der Mehrzahl professionelles und kritisch-analytisches Hören gewohnt waren, während der Durchführung der Tests empfanden und das sie auf für sie nicht annähernd zu erkennende klangliche Unterschiede zurückführten“.[1]

Als Grund kann angenommen werden, dass die in modernen Audio-Wandlern angewendete Methoden wie Überabtastung und Phasenmodulation (engl. "dithering") sowohl bei Aufnahme und Wiedergabe ausreichend gut sind, um die potentiell nachteiligen Auswirkungen der frühzeitigen Dezimierung der Datenrate auf eine geringe Abtastfrequenz nicht hörbar werden zu lassen. Vor allem die Filtertechnik in den Chips hat in den vergangenen Jahren starke Fortschritte gemacht. Dadurch liegen die von den Rekonstruktionsfiltern erzeugten Ampltituden- und Phasenfehler vorwiegend im Hochtonbereich, der von typischen Audiosignalen nur gering belegt ist.

Heute kommen Abtastraten von 192 kHz bei Auflösungen von 24 bit zur Anwendung, die nicht nur erheblich genauer sind als das ursprüngliche Format, sondern es auch ermöglichen, weniger steile Filter mit weniger Fehlern zu verwenden. Man kann mathematisch zeigen, dass ein relativ weich auslaufendes Rekonstruktionsfilter, das mit 192 kHz Abtastrate angesteuert wird und damit erst bei 96 kHz voll sperren muss, ohne weiteres bis weit über 20 kHz voll linear übertragen kann und sich damit nur theoretische Verbesserungen ergeben, wenn es mit noch höheren Raten betrieben würde. Letztlich treten also durch die in den Chips integrierte Datenvorfilterung keine nennenswerten Verluste auf.

Bei Vorhandensein eines DSD-Datenstroms ist es sehr viel einfacher und technisch genauer möglich, auf eine beliebige PCM-Abtastfrequenz zu dezimieren, als dies aus vorhandenen PCM-Daten anderer Abtastfrequenz möglich ist, da dann kein Resampling erfolgen muss. Daher werden in Samplern für die Musikerzeugung bisweilen solche DSD-Daten verwendet. Auch Sampleraten-Konverter nutzen das DSD-Format als Zwischenebene, indem sie zunächst von einer geringen Abtastfrequenz aus nach oben gehen, um dann die DSD-Daten ähnlich wie Analogdaten zu filtern und sie schließlich in der Zielabtastrate neu abzutasten bzw. auf diese zu dezimieren.

Vom technischen Standpunkt ist ein großer Vorteil von DSD die Einfachheit und Eleganz bei der Verarbeitung unterschiedlicher Abtastraten, da es die oben genannten Hilfs-Filterverfahren von PCM nicht benötigt.

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Thomas Görne: Tontechnik. 1. Auflage, Carl Hanser Verlag, Leipzig 2006, ISBN 3-446-40198-9
  • Hubert Henle: Das Tonstudio-Handbuch. 5. Auflage, GC Carstensen Verlag, München 2001, ISBN 3-910098-19-3

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Dominik Blech, Min-Chi Yang: Hörvergleich DSD gegen High-Resolution-PCM. Diplomarbeit am Erich-Thienhaus-Institut der Hochschule für Musik Detmold. Hrsg.: Erich-Thienhaus-Institut der Hochschule für Musik Detmold. 2003 (http://www.eti.hfm-detmold.de/lehraktiv/diplomarbeiten/untersuchung-zur-differenzierbarkeit-digitaler-aufzeichnungsverfahren-hoervergleich-direct-stream-digital-dsd-und-high-resolution-pcm-24bit-176-4khz Zugriff=2016-01-28).