Digital Speech Standard

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der Digital Speech Standard (DSS) ist ein proprietärer (d. h. nicht offener), herstellerübergreifender Audiocodec zur verlustarmen Speicherung von Sprachdaten in Diktiergeräten.

Logo des DSS-Standards
Logo des DSS Pro-Standards

Entstehung[Bearbeiten]

Bereits einige Jahre vor der Markteinführung der ersten digitalen Diktiergeräte entwickelte Grundig in Zusammenarbeit mit der Universität Erlangen-Nürnberg 1994 den ersten DSS-Codec. Der DSS-Standard wurde darauf aufbauend 1997 als Gemeinschaftsentwicklung von Grundig, Olympus und Philips vorgestellt. Zeitgleich gründeten die beteiligten Hersteller ein offenes Standardisierungsgremium - die International Voice Association (IVA) - zur einheitlichen Spezifizierung und Weiterentwicklung des DSS-Standards.

Durch hohe Anforderungen für die Geräteentwicklung und Lizenzgebühren wird DSS nur in den professionellen Geräten der IVA-Mitglieder verwendet.[1]

Eigenschaften[Bearbeiten]

Der DSS-Audiocodec wurde speziell zur Speicherung menschlicher Sprache entwickelt und benutzt wie das weit bekanntere MP3 ein psychoakustisches Modell. So wird eine relativ hohe Komprimierungsrate bei nur geringen Qualitätsverlusten erreicht. Dennoch verschlechtert sich durch die verlustbehaftete Kompression die Erkennungsrate computergestützter Spracherkennung. Diese Schwäche wurde im nachfolgenden Standard "DSS Pro" verbessert.

Neben der Optimierung des Speicherbedarfs der Aufnahmen können weitere Informationen zu den Aufnahmen hinzugefügt werden. So können in den Headerdateien der Aufnahmen z. B. eine Autorenkennung ö.Ä. gespeichert werden.[2]

DSS-Dateien können durch spezielle Software weiterverarbeitet werden, die Hersteller der Diktierlösungen bieten entsprechend leistungsfähige Schreibplatzsoftware und Workflow-Management-Programme. Es existieren aber auch kostenlose Abspielprogramme[3]. Eine Weiterverarbeitung mit anderer Software ist jedoch nicht möglich. Das Demonstrationsprogramm ist nur für Microsoft Betriebssysteme verfügbar. Von Olympus gibt es eine kostenlose Abspielsoftware auch für Mac OS X (DSS-Player Lite), die auf der dortigen Webpage geladen werden kann.

Nach kurzer Untersuchung des DSS-Formats wurden folgende Erkenntnisse gewonnen:[4]

  • DSS ist ein Container, der zur Speicherung von unterschiedlichen Codecs benutzt werden kann.
  • Zurzeit sind zwei Aufnahmemodi bekannt: LP und SP. LP nutzt G.723.1 Codec.

Der Nachfolger DSS Pro[Bearbeiten]

Der Quasi-Standard für professionelle Anwendungen DSS wurde in seiner zweiten Fassung leicht modernisiert: Zum Einen wurde die Abtastrate auf 16 kHz angehoben, um die Sprachqualität weiter zu verbessern und den Anforderungen von Spracherkennungssoftware besser zu genügen. So ist es jetzt mit einem DSS Pro-Diktiergerät möglich, seine Diktate direkt an die Spracherkennung Dragon Naturally Speaking zu übergeben. Die ersten Diktiergeräte mit DSS Pro sind das Philips DPM 9600 bzw. 9620 und das Digta 420 in zwei Schiebeschalter Varianten von Grundig Business Systems. Olympus hat mit dem DS-5000 mittlerweile ebenfalls ein DSS Pro fähiges Diktiergerät auf den Markt gebracht. [5]

Quellen[Bearbeiten]

  1. http://www.grundig-gbs.com/index.php?option=com_content&task=view&id=32&Itemid=48
  2. http://www.diktiertechnik.de/DSS.php
  3. Olympus DSS Lite Player: http://downloads.olympus-europa.com/consumer/VoiceRecorder/631/Dssl211E.exe. 12. Juli 2006
  4. http://bugzilla.libav.org/show_bug.cgi?id=334
  5. http://www.diktiertechnik.de/DSSPRO.php