Doppel-Hashing

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Beim Doppelstreuwertverfahren oder Doppel-Hashing (englisch double hashing) handelt es sich um eine Methode zur Realisierung eines geschlossenen Hash-Verfahrens. In geschlossenen Hash-Verfahren wird versucht, Überläufer in der Hash-Tabelle unterzubringen, anstatt sie innerhalb der Zelle (z. B. als Liste) zu speichern. (Offene Hash-Verfahren können Einträge doppelt belegen und benötigen daher keine Sondierung.) Achtung: Wie es im Artikel Hashtabelle unter „Varianten des Hashverfahrens“ steht, werden die Bezeichnungen „offenes“ bzw. „geschlossenes Hashing“ auch in genau umgekehrter Bedeutung verwendet.

Um dies umzusetzen, verwendet man beim Doppel-Hashing eine Sondierungsfunktion, die eine sekundäre Hash-Funktion beinhaltet, z. B. , und die angewendet wird, falls der durch die primäre Hash-Funktion berechnete Index bereits besetzt ist.

Die vollständige Hash-Funktion lautet dann: , wobei j die Anzahl bereits „ausprobierter“ Indizes ist, d. h., dass j jedes mal um 1 erhöht wird, wenn ein Index bereits belegt ist.

Die Sondierungsfunktion soll dabei eine Permutation der Indizes der Hash-Tabelle bilden.

Die Folge von Hash-Funktionen, die nun mittels und gebildet werden, sieht so aus:

Die Kosten für diese Methode sind nahe den Kosten für ein ideales Hashing.

Unabhängigkeit der Hashfunktionen[Bearbeiten | Quelltext bearbeiten]

Beim Doppel-Hashing werden zwei unabhängige Hash-Funktionen und angewandt. Diese heißen unabhängig, wenn die Wahrscheinlichkeit für eine sogenannte Doppelkollision, d. h. gleich und damit minimal ist.

Beispiele[Bearbeiten | Quelltext bearbeiten]

Beispielfunktionen[Bearbeiten | Quelltext bearbeiten]

Größe des Arrays: m

Indizes: {0; m-1}

Primäre Hash-Funktion: (Divisions-Rest-Methode)

Sekundäre Hash-Funktion:

Sondierungsfunktion:

Vollständige Doppel-Hash-Funktion:

Berechnungsbeispiel[Bearbeiten | Quelltext bearbeiten]

Größe des Arrays: m = 7

Hashfunktionen
Sondierungsfunktion 

Hashtabelle:

k 10 19 31 22 14 16
h1 3 5 3 1 0 2
h2 1 5 2 3 5 2

Das mit Hilfe von Hashtabelle und Sondierungsfunktion gefüllte Array:

0 1 2 3 4 5 6
31 22 16 10 - 19 14

Erklärung am Beispiel 31: Warum bekommt die 31 den Index 0? Die 10 und die 19 brauchen keine zweite Hash-Funktion (i=0), und der Index von h1 kann direkt genommen werden, da das Array an den Stellen 3 und 5 noch frei ist. Mit tritt eine Kollision auf, denn die 3 ist schon belegt. Nun nimmt man die zweite Hash-Funktion:

Die Stelle 5 ist aber auch schon belegt, also geht es weiter mit i=2:

Die Stelle 0 ist frei und somit bekommt die 31 den Index 0.

Weblinks[Bearbeiten | Quelltext bearbeiten]