Hubs und Authorities

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Als Hubs und Authorities lassen sich in der Netzwerktheorie herausragende Knoten anhand ihrer Verlinkung einteilen. Vereinfacht gesagt sind Hubs und Authorities dabei Knoten, die mit vielen anderen Knoten verbunden sind – beispielsweise bekannte Persönlichkeiten in sozialen Netzwerken und Linkverzeichnisse im World Wide Web.

Berechnung[Bearbeiten]

Das Konzept der Hubs und Authorities liefert ähnlich wie der PageRank-Algorithmus ein Konzept zur automatischen Beurteilung von Webseiten anhand ihrer Verlinkung, mit dem sich ein Ranking-Verfahren angeben lässt. Es wurde 1999 von Jon Kleinberg vorgeschlagen und ist unter dem Namen hypertext-induced topic selection (HITS) bekannt.

Dabei wird jede Seite nach zwei Kategorien bewertet:

  • Hubs sind Seiten, die auf viele inhaltlich wertvolle Dokumente zeigen.
  • Authorities sind Seiten, deren Inhalt als besonders gut angesehen wird.

Der Algorithmus geht davon aus, dass gute Hubs Hyperlinks zu vielen Authorities haben und Authorities von vielen Hubs aus erreichbar sind.

Zur Bewertung wird jeder Seite i aus einer Grundmenge von i=1,\ldots, n Seiten ein Hub-Gewicht h_i und ein Authority-Gewicht a_i zugeordnet. Die Grundmenge wird aus der Suchanfrage generiert. Dazu werden Seiten, die auf die Suchbegriffe zutreffen, um eine gewisse Anzahl an Seiten, die aus der Grundmenge verlinkt sind oder die auf die Grundmenge zeigen, erweitert. Danach werden die Gewichte wie folgt aktualisiert bis eine Konvergenz festzustellen ist:

h_i \leftarrow \delta \sum_{j=1}^n A_{ij} \,a_j
a_i \leftarrow \lambda \sum_{k=1}^n {A^T}\!_{ik} \,h_k

Dabei ist A die Verlinkungsmatrix, in der A_{ij}=1, falls die Seite i einen Link auf die Seite j besitzt, und A_{ij}=0, falls dies nicht der Fall ist. A^T ist die transponierte Matrix von A, d. h. {A^T}\!_{ij}=A_{ji}. Es gilt also:

  • Der Hub-Wert einer Seite i ergibt sich aus der Summe aller Authority-Werte der Seiten, die von i verlinkt sind.
  • Der Authority-Wert einer Seite i ergibt sich aus der Summe aller Hub-Werte der Seiten, die auf i verlinken.

Durch gegenseitiges Einsetzen der Definitionen erhält man die Abhängigkeiten:

h\leftarrow\delta\,\lambda\, A A^T \,h\,
a\leftarrow\delta\,\lambda\, A^T\!\!A \,a\,

Dabei konvergieren h und a gegen einen der Eigenvektoren zum größten Eigenwert von A A^T bzw. A^T A.

\delta und \lambda sind dabei meist Normierungen auf den Einheitskreis. Außerdem sind A A^T bzw. A^T A jeweils symmetrisch und positiv semidefinit. Daraus ergibt sich, dass beide Matrizen diagonalisierbar sind und damit eine Orthonormalbasis haben. Die wiederholte Multiplikation konvergiert damit gegen den größten Eigenvektor.


Siehe auch: Skalenfreies Netzwerk

Literatur[Bearbeiten]

Weblinks[Bearbeiten]