grep

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

grep [gɹɛp] ist ein Programm, das unter den Betriebssystemen Unix und Unix-Derivaten der Suche und Filterung definierter Zeichenketten aus Dateien dient. Es wurde ursprünglich von Ken Thompson entwickelt.[1]

Der Begriff grep steht für global/regular expression/print[2][3] oder auch global search for a regular expression and print out matched lines,[4] also etwa „globale Suche nach einem regulären Ausdruck und Ausgabe übereinstimmender Zeilen“. Historisch entwickelte sich der Name aus dem Kommando g/re/p des Unix-Standardeditors ed.

Es existieren zahlreiche Varianten wie egrep, fgrep und agrep, die eine unscharfe Suche nach Textstrings ermöglichen.

Anwendung[Bearbeiten | Quelltext bearbeiten]

In der Kommandozeile wird grep meist zur Suche in Dateien eingesetzt. Der Aufruf hat die prinzipielle Form:

  grep [optionen] Suchstring [Datei(-liste)]

Der Befehl kann auch in Shell-Skripten, beispielsweise in Pipes, eingesetzt werden.

Durch Kommandozeilenschalter kann die Arbeitsweise von grep geändert werden, so ist es beispielsweise möglich,

  • alle Zeilen herauszusuchen, die den angegebenen Text nicht enthalten,
  • nur Zeilen herauszusuchen, in denen das Suchmuster als ganzes Wort enthalten ist,
  • die Zeilennummern, in denen der Text enthalten ist, auszugeben sowie
  • den Dateinamen aller Dateien auszugeben, die den angegebenen Text enthalten.

Die GNU-Variante bietet darüber hinaus die Möglichkeit, nicht die komplette Zeile auszugeben, in der ein Ausdruck vorkommt, sondern lediglich alle Vorkommen des Ausdrucks selbst.

Einsatzgebiete[Bearbeiten | Quelltext bearbeiten]

grep wird in erster Linie dann eingesetzt, wenn Dateien durchsucht werden müssen, zum Beispiel die Quelldateien eines Computerprogramms oder Logdateien. In Zusammenarbeit mit find kann ein ganzer Dateibaum gelesen werden.

$ find /home/benutzername -exec grep -H "Passwort" {} \;

Dieses Kommando durchsucht alle Dateien des Quellverzeichnisses des Benutzers benutzername nach der Zeichenkette Passwort und zeigt die gefundenen Zeilen zusammen mit dem Dateinamen an, wobei die Anzeige des Dateinamens durch die Option -H ausgelöst wird.

Manche grep-Versionen ermöglichen eine kürzere Formulierung mit Hilfe der Option -r:

$ grep -r "Passwort" /home/benutzername

Ein zweites Einsatzgebiet ist die Verwendung als Zeilen-Filter innerhalb einer Kette von Befehlen, z. B.:

$ tail -1000 /var/log/mail | grep "Mailadresse"

agrep[Bearbeiten | Quelltext bearbeiten]

agrep (Approximate GREP) ist ein Programm, das nicht aus der Familie der UNIX-grep-Programme stammt. Im Gegensatz zu den Programmen der UNIX-grep-Familie ermöglicht es eine unscharfe (fuzzy) Textstringsuche.

agrep wurde in den Jahren 1988–1991 von Udi Manber[5] und Sun Wu[6] an der Universität von Arizona entwickelt und bildet den Kern der Suchmaschine GLIMPSE bzw. HARVEST. Das Programm benutzt aus einer Vielzahl von eingebauten Suchalgorithmen denjenigen, der dem regulären Ausdruck der Benutzereingabe (Suchstring) am besten angepasst ist und die schnellste Suche ermöglicht.

Um 1996 wurde es erstmals nach OS/2 und DOS, später nach Windows portiert, und nach weiteren Verbesserungen wieder nach Linux.[7]

Während agrep früher nur unter einer eingeschränkten Lizenz benutzen werden konnte, die im Konflikt mit Absatz 1 der Open-Source-Definition stand, erreichten es die Entwickler, agrep am 18. September 2014 unter die freie ISC-Lizenz zu stellen.[8]

Tre-agrep[Bearbeiten | Quelltext bearbeiten]

Mit Tre-agrep steht eine Neuimplementierung von agrep zur Verfügung, die unter der liberaleren BSD-Lizenz steht.[9][10]

egrep[Bearbeiten | Quelltext bearbeiten]

egrep (Extended grep) ist zur einfacheren Suche mit erweiterten regulären Ausdrücken geeignet. So haben die Zeichen ? + { } | ( ) bei egrep eine besondere Bedeutung für den Ausdruck, und müssen mit einem umgekehrten Schrägstrich (engl.: backslash) geschützt werden, wenn sie als Text gefunden werden sollen.

fgrep[Bearbeiten | Quelltext bearbeiten]

fgrep kann immer anstelle von grep verwendet werden, falls das zu suchende Muster keine regulären Ausdrücke enthält. Alle Sonderzeichen in der Musterzeichenkette verlieren ihre Sonderbedeutung und werden als Bestandteil des Musters verstanden. Fgrep arbeitet dadurch etwas schneller als grep und ist vor allem beim Durchsuchen großer Datenmengen nützlich. Man benutzt hierfür den Aho-Corasick-Algorithmus, der auch der Originalversion diente.

Microsoft Windows[Bearbeiten | Quelltext bearbeiten]

Wie von vielen Programmen gibt es auch Portierungen von grep auf die Windows-Plattform. Als eingebauten Befehl kennt Windows die Befehle find und findstr, die eine ähnliche Funktion wie grep erbringen. In den Resource Kit Tools ist QGREP.EXE enthalten.[11][12]

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Brian Kernighan: A Regular Expression Matcher.
  2. grep Manual Punkt 14
  3. J. Plate: unix5 FH München
  4. Linuxfibel
  5. Udi Manber in der englischsprachigen Wikipedia
  6. Sun Wu in der englischsprachigen Wikipedia
  7. agrep Source code aller Versionen
  8. Details und weitere Informationen im englischsprachigen agrep-Artikel
  9. Nimm zwei: Aus dem Alltag eines Sysadmin: Biabam und Tre-agrep. linux-magazin.de, Ausgabe 10/201, S. 61
  10. laurikari.net/tre Informationen zu Tre-agrep
  11. Resource Kit Tools zu Windows 98
  12. Resource Kit Tools Windows Server 2003 (auch für Windows XP)