dd (Unix)

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Das Programm dd ist ein Unix-Befehl, der für das blockorientierte Kopieren oder Konvertieren beliebiger Dateien dient. Die Größe jedes „Datenblocks“ liegt üblicherweise zwischen einem einzigen Byte und Vielfachen der Blockgröße eines Dateisystems.

Geschichte[Bearbeiten]

Das Dienstprogramm dd war schon in den 1970er Jahren im Umlauf und hat sich seitdem unter Unix-Betriebssystemen als unverzichtbar erwiesen.[1] Als wichtiges Standard-Werkzeug ist das Programm Teil der core utilities des GNU-Projekts geworden. Zur Datenrettung stehen verschiedene Weiterentwicklungen unter der GPL wie z. B. gddrescue[2] zur Verfügung, die versuchen trotz auftretender Lesefehler möglichst viele Daten wiederherzustellen.[3] Zur Datensicherung, -Wiederherstellung und -Rettung sowie Aufgaben der Forensik entstanden weitere Programme wie dcfldd[4] und dc3dd[5], die auf dem Konzept von dd aufbauen und es erweitern.[6] Für Microsoft Windows stehen verschiedene Opensource-Portierungen von dd zur Verfügung, bspw. von Cygwin und chrysocome.net[7]

Die Herkunft des Programmnamens dd ist nicht gänzlich geklärt und es finden sich zahlreiche Möglichkeiten in diversen Quellen:

  • In der Job Control Language (JCL) der IBM-Großrechner S/360 gibt es die Anweisung DD für „Dataset Definition“.[8]
  • Ursprünglich soll cc als Abkürzung für „copy and convert“ geplant gewesen sein, diese war aber schon für den C-Compiler vergeben.[9]
  • Darüber hinaus kann dd als „duplicate data“, „disk dump“, „duplicate device“ oder einer anderen Kombinationen von zwei dieser Wörter verstanden werden.[8].
  • Wegen der häufigen Verwendung zum hardwarenahen Zugriff auf die Geräteschnittstellen von Festplatten oder deren Partitionen, wird das Akronym auch als „destroy disk“ oder „delete data“ ausbuchstabiert, weil Tippfehler bei der Angabe der if= und of=Geräte zu vollständigem Datenverlust führen können.[1]

Arbeitsweise[Bearbeiten]

Gemäß dem Unix-Grundsatz everything is a file kann dd sowohl blockorientierte als auch zeichenbasierte Geräte bearbeiten. Die Blockgeräte benutzen zur Ein- und Ausgabe einen Pufferspeicher, der die zu übertragenden Daten in Blöcken fester Größe (engl. chunks) überträgt. Die voreingestellte Blockgröße beträgt üblicherweise 512 Bytes, kann aber über Optionen geändert werden. Alle anderen Geräte, insb. „raw devices“ wie Bandlaufwerke gelten zwar in der hier benutzten Bedeutung als ungepuffert, dies hat auf die Funktion von dd allerdings keinen Einfluss.

Konvertierung[Bearbeiten]

dd kann die Daten beim Kopieren auch Konvertieren, z. B. von ASCII in EBCDIC, in Klein- oder Großbuchstaben, die Byte-Reihenfolge vertauschen oder Datensätze fester Länge in Datensätze variabler Länge umwandeln und umgekehrt.

Statusanzeige[Bearbeiten]

Gemäß POSIX-Standard gibt dd sowohl nach Abschluss der Datei-Operationen als auch bei Empfang des Signals SIGINT eine Statusmeldung auf STDERR aus.[10] Um beim Kopieren großer Datenmengen eine Fortschrittsanzeige zu ermöglichen, wird bei den BSD-[11] und GNU-Varianten[12] von dd das Signal SIGUSR1 (user defined signal 1, vgl. kill) benutzt. Im Beispiel wird dazu in einer Bourne-ähnlichen Shell das dd-Programm im Hintergrund gestartet und die Prozess-ID in einer Variablen gespeichert. Die zweite Zeile gibt dann Statusinformationen aus, ohne das der Kopierprozeß beendet wird.[12]

dd if=/dev/zero of=/dev/null count=10MB & pid=$!
kill -s INFO $pid; wait $pid

Auch dcfldd erweitert dd um eine Statusanzeige.[4]

Beispiele[Bearbeiten]

Dieser Abschnitt bedarf einer Überarbeitung: Erklärende Sätze bei der Verwendung sind hilfreich. Insbesondere das versehentliche Schreiben eines Images auf dieselbe (eingehängte) Partition endet in "destroy data" ... Hilf mit, ihn zu verbessern, und entferne anschließend diese Markierung.

Typische Aufgaben für den Einsatz von dd sind z. B.:

Sichern und Wiederherstellen einer Partition[Bearbeiten]

Von einer Partition lässt sich mit dd eine exakte Kopie als normale Image-Datei im vorhanden Dateisystem ablegen. Zweckmässigerweise ist die Gerätedatei der Partition nicht eingehängt, damit ein versehentliches Vertauschen von if= und of= nicht zu Datenverlust führen kann.

dd if=/dev/sda1 of=/tmp/sda1_image

Danach kann bspw. ein „Undelete“ (undelete) auf einem ext2/ext3/ext4-Dateissystem mit debugfs -w /dev/sda1 versucht werden. Zum Wiederherstellen des Ausgangszustandes vertauscht man Ein- und Ausgabedatei:

dd of=/dev/sda1 if=/tmp/sda1_image

Datenträger unlesbar machen[Bearbeiten]

Unwiderrufliches Löschen einer ganzen Festplatte /dev/sda einschließlich aller Partitionsinformationen mit /dev/urandom unter GNU/Linux:

dd if=/dev/urandom of=/dev/sda

Weblinks[Bearbeiten]

Anmerkungen[Bearbeiten]

  1. a b DD Command. Dr. Nikolai Bezroukov, softpanorama.org, abgerufen am 13. Juni 2014 (englisch): „It is jokingly said that dd stands for "destroy disk" or "delete data", since, being used for low-level operations on hard disks, a small mistake, such as reversing the if and of parameters, may accidentally render the entire disk unusable.“
  2. Ddrescue – Data recovery tool. stack exchange inc, 4. November 2012, abgerufen am 29. Juni 2014 (englisch).
  3. What's the difference between ddrescue, gddrescue, and dd_rescue? Abgerufen am 5. Juli 2014 (englisch).
  4. a b dcfldd. 16. Juni 2014, abgerufen am 29. Juni 2014 (englisch): „An Enhanced version of gnu dd with features useful for forensics and security. Key features include on-the-fly hashing, status output and faster disk wiping.“
  5. dc3dd. 22. April 2013, abgerufen am 29. Juni 2014 (englisch): „A patch to the GNU dd program, this version has several features intended for forensic acquisition of data. Highlights include hashing on-the-fly, split output files, pattern writing, a progress meter, and file verification.“
  6. Linux 'dd' basics. Forensic Focus, abgerufen am 13. Juni 2014 (englisch).
  7. dd for windows. chrysocome.net, 17. Juli 2010, abgerufen am 29. Juni 2014 (englisch).
  8. a b Prof. Jürgen Plate: Vorlesung „UNIX“. Abgerufen am 14. Juni 2014: „Abschnitt 10.3 The UNIX Acrony List: (opinion 1) Dataset Definition (named after the OS/3x0 JCL DD command who's syntax it also ripped off as a joke); (opinion 2) copy and convert (called `dd' because `cc' is the C compiler); (opinions 3-n) data, device, disk, dump in various combinations“
  9. Peter Funk: The Unix Acronym List. Wolfram Rösler, abgerufen am 14. Juni 2014: „Eigentlich `Copy and Convert' und nur zu `dd' umbenannt, weil `cc' schon durch den `C-Compiler' belegt war! Das ist jedenfalls die authentische Auskunft, die ich damals den Man-Pages unseres UNIX-V7 auf unserer Uni PDP-11 entnommen habe.“
  10. dd gemäß Open Group Base Specifications Issue 6, IEEE Std 1003.1, 2004 Edition. The IEEE and The Open Group, 2004, abgerufen am 18. Juni 2014 (englisch).
  11. DD(1) – OpenBSD Reference Manual. OpenBSD.org, abgerufen am 18. Juni 2014 (englisch): „If dd receives a SIGINFO (see the "status" argument for stty(1)]) signal, the current input and output block counts will be written to the standard error output in the same format as the standard completion message.“
  12. a b dd invocation. gnu.org, abgerufen am 18. Juni 2014 (englisch): „Sending an ‘INFO’ signal to a running dd process makes it print I/O statistics to standard error and then resume copying. ... On systems lacking the ‘INFO’ signal dd responds to the ‘USR1’ signal instead, unless the POSIXLY_CORRECT environment variable is set.“