Rust (Programmiersprache)

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Rust
Rust programming language black logo.svg
Basisdaten
Paradigmen: Multiparadigmen (generisch, nebenläufig, funktional, imperativ, strukturiert)
Erscheinungsjahr: 2010; erste stabile Version 2015
Designer: Graydon Hoare
Entwickler: Früher Graydon Hoare, heute Rust Project Developers
Aktuelle Version 1.39.0[1]  (7. November 2019)
Typisierung: stark, statisch, affin[2], Typinferenz
Beeinflusst von: Alef[3], C++, C#, Cyclone, Erlang, Haskell, Limbo, Newsqueak, Objective CAML, Scheme, Standard ML, Swift, Hermes, NIL, Ruby
Betriebssystem: Linux, macOS, Windows, FreeBSD, Android, iOS[4] und weitere[5][6]
Lizenz: Apache License 2.0 und MIT License[7]
rust-lang.org

Rust ist eine Multiparadigmen-Systemprogrammiersprache, die von Mozilla Research entwickelt wurde.[8] Sie wurde mit dem Ziel entwickelt, sicher, nebenläufig und praxisnah zu sein.[9] Sicherheit bezieht sich dabei insbesondere auf die Vermeidung von Programmfehlern, die zu Speicherzugriffsfehlern oder Pufferüberläufen und damit unter Umständen auch zu Sicherheitslücken führen, vor allem auch in nebenläufigen Prozessen. Im Gegensatz zu anderen Programmiersprachen mit automatischer Speicherverwaltung verwendet Rust hierfür keine Garbage Collection, sondern setzt auf ein besonderes Typsystem.

Rust vereint Ansätze aus verschiedenen Programmierparadigmen, unter anderem aus der funktionalen, der objektorientierten und der nebenläufigen Programmierung, und erlaubt so ein hohes Abstraktionsniveau. Beispielsweise gibt es in Rust algebraische Datentypen, Pattern Matching, Traits (ähnlich den Typklassen in Haskell), Closures, sowie Unterstützung für RAII. Die Sprache wurde so entworfen, dass die Kosten der Abstraktionen zur Laufzeit so gering wie möglich bleiben können (zero-cost abstractions), um eine mit C++ vergleichbare Effizienz zu erreichen.[10]

Die Sprache entstand aus einem persönlichen Projekt des Mozilla-Mitarbeiters Graydon Hoare. Mozilla begann das Sponsoring des Projekts im Jahr 2009.[11] Es wurde 2010 zum ersten Mal angekündigt.[12] Im selben Jahr begann der Wechsel von einem (noch in OCaml geschriebenen) ersten Compiler zu einem neuen Compiler, der selbst in Rust geschrieben ist.[13] Dieser rustc genannte Compiler verwendet LLVM als Back-End und kann sich seit 2011 erfolgreich selbst übersetzen.[14] Eine erste stabile Version von Compiler und Standardbibliothek, Rust 1.0, wurde am 15. Mai 2015 veröffentlicht.[15]

Sprachdesign[Bearbeiten | Quelltext bearbeiten]

Syntax, Sprachkonstrukte[Bearbeiten | Quelltext bearbeiten]

Syntaktisch ist die Sprache an C angelehnt. Mehrere aufeinanderfolgende Anweisungen werden durch ein Semikolon getrennt, Blöcke stehen in geschweiften Klammern. In vielen Details weicht die Syntax allerdings davon ab, so werden beispielsweise keine Klammern um die Bedingungen von if- und while-Statements benötigt, stattdessen aber geschweifte Klammern um den dahinterstehenden Block erzwungen, auch wenn dort nur eine Anweisung steht. Das Schlüsselwort for leitet in Rust immer eine Foreach-Schleife ein, die das Iterieren über beliebige (auch benutzerdefinierte) Container und Objekte ermöglicht. Anstelle des switch-Statements gibt es die wesentlich mächtigeren match-Ausdrücke, die nicht nur mit Zahlen und Zeichenketten umgehen können, sondern Pattern Matching auf beliebig verschachtelten Strukturen durchführen können.

Variablen werden normalerweise klein (snake_case) geschrieben, Datentypen mit Ausnahme der primitiven mit großem Anfangsbuchstaben (CamelCase). Typparameter von generischen Typen und Funktionen stehen in spitzen Klammern. Zwei Doppelpunkte drücken aus, dass der Bezeichner auf der rechten Seite aus dem Namensraum des Bezeichners auf der linken Seite entstammen soll. Die Bindung eines Bezeichners x an einen Wert wird

let x: Typ = Wert;

geschrieben, wobei die Angabe des Typs auch entfallen darf, wenn der Typ abgeleitet werden kann. Eine Variablen-Deklaration für die Variable v hat die Form:

let mut v: Typ = Initialwert;

oder allgemeiner:

let mut v: Typ;
v = Wert;

Der Compiler überprüft mittels Datenflussanalyse, ob alle Bindungen und Variablen vor dem Auslesen initialisiert wurden. Verwendung von uninitialisiertem Speicher ist nur über einen speziellen Befehl möglich, welcher zwingend mit unsafe markiert werden muss.

Typsystem[Bearbeiten | Quelltext bearbeiten]

Benutzerdefinierte Datentypen können entweder als struct (Struktur wie in C) oder als enum (tagged-Union) definiert werden. Für beide Arten von Datentypen kann man mittels des impl-Schlüsselswortes Methoden definieren. Die sonst für objektorientierte Programmierung übliche Vererbung gibt es in Rust allerdings nicht, Polymorphie wird stattdessen durch Traits und generische Programmierung ermöglicht. Ein Trait definiert eine Menge von Funktionen und Methoden, die dann jeweils zusammen von Datentypen implementiert werden und bei Typparametern als Einschränkung für die erlaubten Typen dienen können. Dies wird auch für Operatoren verwendet, sodass beispielsweise der Operator + mit jedem Datentyp verwendet werden kann, der den Trait Add implementiert.[16] Alle Funktions-, Methoden- und Operatoraufrufe werden dabei statisch gebunden, wodurch dem Compiler einige Optimierungen ermöglicht werden, allerdings kann über sogenannte Trait-Objects auch mittels dynamischer Bindung auf Trait-Methoden zugegriffen werden. Es ist erlaubt, sowohl existierende Traits aus fremdem Code für benutzerdefinierte Typen, als auch neue, benutzerdefinierte Traits für existierende Typen zu implementieren.

Zeiger, Speicherverwaltung[Bearbeiten | Quelltext bearbeiten]

Rust kennt neben den sogenannten Raw-Pointern, die Zeigern in C entsprechen und nur in explizit als unsafe markiertem Code dereferenziert werden dürfen, auch noch Referenzen. Diese zeigen immer auf gültigen Speicher und dürfen niemals den Wert null annehmen. Es werden zwei verschiedene Arten von Referenzen unterschieden: gemeinsame Referenzen (shared references), eingeleitet durch &, und veränderbare Referenzen (mutable references), eingeleitet durch &mut. Der Rust-Compiler garantiert statisch, dass keine Referenz das von ihr referenzierte Objekt „überlebt“, dass das referenzierte Objekt nicht verändert wird, während eine Referenz (egal ob gemeinsam oder veränderbar) existiert, und dass eine veränderbare Referenz – wenn eine solche existiert – stets die einzige Referenz auf ein Objekt ist, sodass Veränderungen am Objekt vorgenommen werden können, ohne dabei Referenzen zum selben Objekt an anderen Stellen im Code oder sogar in anderen Threads ungültig zu machen.

Das Erstellen von Referenzen wird auch als Borrowing (Ausleihen) bezeichnet, und bildet zusammen mit dem Konzept der Ownership (Besitz) die Grundlage für die sichere Speicherverwaltung ohne Garbage Collection. Ownership bedeutet hier, dass jedes Objekt im Speicher im Besitz derjenigen Variable ist, der es bei der Erstellung zugewiesen wird. Am Ende der Lebensdauer dieser Variable wird der Speicher automatisch freigegeben. Für die meisten komplexeren Datentypen verwendet Rust die sogenannte Move-Semantik, sodass bei Zuweisung eines Objektes zu einer anderen Variablen das Objekt „verschoben“ wird, und ein Zugriff auf die alte Variable daraufhin nicht mehr möglich ist. Auch beim Übergeben von Objekten als Wertparameter an Funktionen (call by value) werden solche Objekte in die Funktion „hineingeschoben“ und sind von außen nicht mehr zugreifbar, wenn sie nicht wieder von der Funktion zurückgegeben werden. Primitive Datentypen verwenden keine Move-Semantik, sondern die sonst übliche Copy-Semantik (Zuweisungen erstellen eine Kopie), und bei benutzerdefinierten Datentypen kann mittels des Copy-Traits selbst entschieden werden, ob Move- oder Copy-Semantik verwendet werden soll.

Zur dynamischen Speicherverwaltung stehen die Smart-Pointer-Typen Box, Rc und der Hilfstyp RefCell zur Verfügung, welche einerseits dem System Ownership-Borrowing-Lifetime-Move unterworfen sind, dieses System andererseits auf die Laufzeitdynamik übertragen. Der Typ Box<T> beschreibt einen besitzenden Zeiger auf einen Wert vom Typ T im dynamisch allozierten Speicher. Der Typ Rc<T> beschreibt über Referenzzählung einen gemeinschaftlichen Besitz auf einen unveränderlichen Wert. Ein unveränderlicher Wert kann jedoch veränderliche innere Daten vom Typ RefCell<T> besitzen, wobei jeweils ein Referenzzähler für einen Zugriff analog zu & und &mut das sichere dynamische Borrowing durch Prüfung zur Laufzeit ermöglicht.

Mit Rc allein ist keine Dynamik zyklischer Datenstrukturen möglich. Hierzu kann wieder RefCell herangezogen werden, wobei die Zyklen manuell aufgebrochen werden müssen, damit es nicht zu einem Speicherleck kommt. Als alternatives Konzept ist der Zeigertyp Weak<T> vorhanden, bei dem die Zeiger analog zu Rc sind, jedoch keinen Besitz am Wert haben. Zur Umsetzung von Weak ist in Rc ein zweiter Referenzzähler implementiert. Ein Zeiger vom Typ Weak verhindert zwar nicht den Destruktor-Aufruf beim Verschwinden aller Zeiger vom Typ Rc, die Deallokation des brach liegenden Knotens geschieht dann allerdings erst beim Verschwinden des letzten Zeigers vom Typ Weak. Die Destruktor-Aufrufe sorgen dabei für ein automatisches Aufbrechen der Zyklen.

Für die nebenläufige Programmierung ist ein Austausch von Rc gegen Arc, und RefCell gegen die analogen Konzepte Mutex oder RwLock notwendig.

Nullzeiger kommen in Rust nicht vor. Abwesenheit eines Werts wird stattdessen durch den Typ Option<T> modelliert, welcher es als enum ermöglicht, zwischen Some(T) (Vorhandensein) und None (Abwesenheit) zu unterscheiden. Die Verwendung von Optionen ist nicht auf Zeiger beschränkt. Möchte man z. B. einen großen Teil einer struct zunächst uninitialisiert lassen, dann kann man diesen als innere struct hinter einer Option verbergen und mit None initialisieren.

Fehlerbehandlung[Bearbeiten | Quelltext bearbeiten]

Rust unterscheidet zwischen behebbaren (recoverable) und nicht behebbaren (unrecoverable) Fehlern. Tritt ein nicht behebbarer Fehler auf, wird das panic!-Makro ausgeführt: Das Programm gibt eine Fehlermeldung aus, räumt den Stack auf (unwinding) und beendet sich. Für behebbare Fehler gibt es in Rust die in vielen Sprachen vorhandene Ausnahmebehandlung mit automatischem Stack-Unwinding nicht. Stattdessen werden behebbare Fehler als gewöhnliche Rückgabewerte von Funktionen modelliert. Zur strengen Typisierung dienen dabei die Typen Result<T,E> und Option<T>. Beide Typen sind als enum formuliert, Result unterscheidet hierbei zwischen Ok(T) (normale Werte) und Err(E) (Fehlerwerte), Option definiert hingegen Some(T) (normale Werte) und None (kein Wert).[17]

Ein Laufzeitnachteil entsteht bei der Rückgabe von enum bzw. struct in vielen Fällen nicht, da der Compiler in der Lage ist, für größere Objekte automatisch Zeiger zu erzeugen und Nullzeiger-Optimierungen durchzuführen.

Beispiele[Bearbeiten | Quelltext bearbeiten]

Hello-World-Funktion[Bearbeiten | Quelltext bearbeiten]

fn main() {
    println!("Hello, world!");
}

Das obige Beispiel gibt den Text Hello, world! am Ausgabemedium aus. println!() ist hierbei keine gewöhnliche Funktion, sondern ein Makro. Die Funktionsdeklaration erfolgt in Rust mit dem Schlüsselwort fn.

Fakultäts-Funktion[Bearbeiten | Quelltext bearbeiten]

Bei der Fakultät geht es darum, für ein gegebenes die Fakultät, also zu berechnen. Dies kann auf mehreren Wege geschehen, es gibt insbesondere einen rekursiven wie auch iterativen Lösungsweg. Beide Wege sind in Rust umsetzbar.

Iterativ[Bearbeiten | Quelltext bearbeiten]

1 fn fakultaet(i: u64) -> u64 {
2     let mut acc = 1;
3     for num in 2..=i {
4         acc *= num;
5     }
6     acc
7 }

Da die Fakultät für alle natürlichen Zahlen definiert ist, kann als Datentyp auf u64, eine vorzeichenunbehaftete 64-Bit-Ganzzahl[18], zurückgegriffen werden. In dieser Variante wird die Fakultät nach obiger Definition umgesetzt. Auffällig ist das Schlüsselwort mut in Zeile 2, das in der Deklaration der Variable acc vorkommt, um diese als veränderlich (mutable) zu kennzeichnen, da im Schleifenkörper in Zeile 4 eine erneute Wertzuweisung vorgenommen wird. Eine explizite return-Anweisung wird in Rust nicht benötigt, weil der letzte Ausdruck (der aufgrund des fehlenden Semikolons keine Anweisung ist) als Rückgabewert gilt.[19] Dieser Ausdruck muss dem Rückgabetypen aus dem Funktionskopf entsprechen.

Alternativ erlaubt es Rust, das Problem im Sinne der funktionalen Programmierung anzugehen. Sogenannte Iterators bieten eine Möglichkeit, iterierbare Objekte zu verarbeiten. So lässt sich die Fakultät mit Hilfe des Iterators (1..=i) und dessen Methode product()[20] wie folgt darstellen:

1 fn fakultaet(i: u64) -> u64 {
2     (1..=i).product()
3 }

Rekursiv[Bearbeiten | Quelltext bearbeiten]

1 fn fakultaet(i: u64) -> u64 {
2     match i {
3         0 => 1,
4         n => n * fakultaet(n-1)
5     }
6 }

Bei dieser Variante liegt der Kern in einer Fallunterscheidung, mit der die Fakultät ebenfalls definiert werden kann:

Dieser Ausdruck lässt sich in Rust mittels Pattern Matching und rekursivem Funktionsaufruf implementieren.

Verwendung[Bearbeiten | Quelltext bearbeiten]

Der Rust-Compiler wird standardmäßig mit Cargo, einer Paketverwaltung für Rust-Software, ausgeliefert, die verwendete Bibliotheken automatisch herunterlädt und Abhängigkeiten auflöst. Jedes Paket beinhaltet eine Konfigurationsdatei im TOML-Format, die als Cargo.toml im Paketverzeichnis abgelegt wird. In dieser werden neben allgemeinen Informationen zum Paket (u. a. Name, Version und Autoren) auch die benötigten Abhängigkeiten angegeben.[21]

Eine Vielzahl wiederverwendbarer Open-Source-Komponenten stehen im offiziellen Paket-Repository crates.io[22] zur Verfügung. Seit der Version 1.34.0 stable ist es zudem möglich, andere Paket-Repositories zu nutzen. Dies ermöglicht beispielsweise, dass Firmen eigene, firmeninterne Paket-Repositories erstellen und für Closed-Source-Komponenten nutzen.

Rust findet darüber hinaus unter anderem in folgenden Projekten Verwendung:

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. blog.rust-lang.org.
  2. Alexis Beingessner: The Pain Of Real Linear Types in Rust. In Beingessners Blog, 8. Mai 2017, abgerufen am 10. Oktober 2019.
  3. Appendix: Influences - The Rust Reference. (abgerufen am 28. Januar 2018).
  4. Doc building for ios. Abgerufen am 4. Januar 2015.
  5. Rust Platform Support (englisch) Abgerufen am 3. Juni 2019.
  6. Frequently Asked Questions (englisch) Abgerufen am 3. Juni 2019.
  7. COPYRIGHT. Rust compiler source repository. Abgerufen am 17. Dezember 2012.
  8. Rust. Mozilla Research. Abgerufen am 3. Mai 2019.
  9. The Rust Programming Language. Abgerufen am 21. Oktober 2012.
  10. The Rust Project Developers: The Rust Language FAQ: How fast is Rust? Abgerufen am 8. Juli 2018 (englisch).
  11. Project FAQ. 14. September 2010. Abgerufen am 11. Januar 2012.
  12. Future Tense. 29. April 2011. Abgerufen am 6. Februar 2012: „At Mozilla Summit 2010, we launched Rust, a new programming language motivated by safety and concurrency for parallel hardware, the “manycore” future which is upon us.“
  13. Graydon Hoare: Rust Progress. In: Graydon’s work on Mozilla. 2. Oktober 2010, archiviert vom Original am 19. März 2012; abgerufen am 3. April 2016 (englisch).
  14. Graydon Hoare: [rust-dev] stage1/rustc builds. 20. April 2011. Abgerufen am 20. April 2011: „After that last change fixing the logging scope context bug, looks like stage1/rustc builds. Just shy of midnight :)“
  15. Announcing Rust 1.0
  16. Dokumentation des „Add“-Traits
  17. Recoverable Errors with Result - The Rust Programming Language. Abgerufen am 23. April 2019.
  18. u64 - Rust. Abgerufen am 21. April 2019.
  19. Functions - Rust By Example. Abgerufen am 21. April 2019.
  20. std::iter::Product - Rust Documentation. Abgerufen am 21. April 2019.
  21. The Manifest Format - The Cargo Book. Abgerufen am 19. April 2019.
  22. The Rust community’s crate host. Abgerufen am 3. April 2017 (englisch).
  23. Dave Herman: Shipping Rust in Firefox. In: Mozilla Hacks. 12. Juli 2016, abgerufen am 2. April 2017 (englisch).
  24. Quantum. In: Mozilla Wiki. Abgerufen am 3. April 2017 (englisch).
  25. Rainald Menge-Sonnentag: Mozilla veröffentlicht erste Preview der neuen Browser-Engine Servo. In: Heise Newsticker. 4. Juli 2016, abgerufen am 4. Juli 2016.
  26. Rust’s Redox OS could show Linux a few new tricks (englisch), infoworld. Abgerufen am 21. März 2016. 
  27. Redox OS: Wer nicht rustet, rostet - Golem.de. (golem.de [abgerufen am 12. Februar 2018]).
  28. Cade Metz: The Epic Story of Dropbox’s Exodus From the Amazon Cloud Empire. Wired, 14. März 2016, abgerufen am 3. April 2017 (englisch).
  29. Denis Frank: Using HyperLogLog to Detect Malware Faster Than Ever. Abgerufen am 19. März 2016.
  30. Frank Denis: ZeroMQ: Helping us Block Malicious Domains in Real Time. Abgerufen am 19. März 2016.
  31. MesaLink – A memory-safe and OpenSSL-compatible TLS library. Abgerufen am 2. September 2018 (englisch).
  32. Andrew Gallant: ripgrep is faster than {grep, ag, git grep, ucg, pt, sift}. In: Andrew Gallant’s Blog. 23. September 2016, abgerufen am 3. April 2017 (englisch).
  33. Fuchsia - Rust. Abgerufen am 5. März 2019.
  34. Open wiki documentation for Grin and MimbleWimble. Contribute to mimblewimble/docs development by creating an account on GitHub. mimblewimble, 5. April 2019, abgerufen am 5. April 2019.