Bewertung der Verlinkung von Webseiten

Bewertung mit einem Simulationsverfahren

Ziel ist es, eine Webseite danach zu bewerten, wie viele andere auf sie verlinken und wie stark verlinkt diese anderen Seiten wiederum sind. Links von Webseiten, auf die selbst viele Links verweisen, werden dabei stärker berücksichtigt als Links, die ihren Ursprung auf Webseiten haben, auf die nur wenige oder gar keine Links verweisen.

Um diese Verlinkungsstruktur zahlenmäßig zu erfassen, spielen wir das Surfverhalten von Webseitenbesuchern durch, die sich (eher ziellos) anhand der Links durch das Netz von Webseiten bewegen. Webseiten, auf die viele bedeutende Links verweisen, werden bei der Simulation daran zu erkennen sein, dass dort viele Besucher durch das ziellose Surfen landen.

Um die Funktionsweise dieses Ansatzes zu verstehen, muss man (zum Glück) nicht die Gesamtheit aller verlinkten Webseiten betrachten. Es reicht, wenn man eine "kleine Welt" vernetzter Webseiten betrachtet.

Graph - Webseiten

Ein erstes Surfmodell

Wir gehen von folgenden vereinfachenden Annahmen aus:

(A1) Zu Beginn verteilen sich alle Besucher gleichmäßig auf die Webseiten.

(A2) Alle Besucher ("Surfer") folgen jeweils im gleichen Takt einem Link auf eine weitere Webseite. Wenn auf einer Webseite mehrere Links vorkommen, dann verteilen sich die Besucher gleichmäßig auf die verschiedenen Links.

Graph - Webseiten

Aufgabe 1

(a) Wie viele Nutzer besuchen in der gezeigten Situation nach einem Takt die verschiedenen Webseiten?

(b) Welche Schwierigkeit ergibt sich bei der Webseite F?

Ein verbessertes Surfmodell

Wenn ein Nutzer die Webseite F besucht, dann kommt er/sie nicht mehr weiter. In der Realität kann ein Nutzer jetzt auf verschiedene Weisen reagieren, z.B.: zurück auf die zuletzt besuchte Seite gehen; die Adresse einer neuen Seite eingeben; ganz mit dem Surfen aufhören. Wir gehen in unserem Modell von folgendem Verhalten aus:

(A3) Besucher, die in eine Sackgasse geraten (d.h. Webseiten besuchen, die keine Links auf weitere Seiten enthalten), besuchen im nächsten Schritt irgend eine der gegebenen Webseiten. Wir nennen sie ab jetzt "Sackgassenjumper". Sie teilen sich dabei gleichmäßig auf alle zur Verfügung stehenden Webseiten auf.

Graph - Webseiten

Aufgabe 2

Wie viele Nutzer besuchen unter den veränderten Annahmen nach einem Takt die verschiedenen Webseiten?

Ein weiter verfeinertes Surfmodell

In der Regel folgen nicht alle Nutzer immer nur den auf Webseiten vorgegebenen Links. Manche Nutzer springen auch von Zeit zu Zeit auf eine andere Webseite, indem sie die Adresse dieser Webseite eingeben. Wir nennen sie hier "Gelegenheitsjumper" und modellieren ihr wie folgt.

(A4) Ein bestimmter Prozentsatz der Nutzer (z.B. 20%) springt in jedem Takt zu einer beliebigen Webseite. Sie teilen sich dabei gleichmäßig auf alle zur Verfügung stehenden Webseiten auf.

Graph - Webseiten

Aufgabe 3

(a) Erkläre, wie die in der Abbildung gezeigten Zahlen gemäß Annahmen zustande kommen.

(b) Führe die Berechnungen für mehrere Takte durch. Benutze (gerundete) Dezimalzahlen, wenn die Divisionen nicht aufgehen - auch, wenn das der Wirklichkeit nicht mehr entspricht.

A B C D E F
300 300 300 300 300 300
180 460     100  
           
246.5 254.5 619.8 340.9 91.8 246.5
           

Grenzen von Modellen

Wir haben oben Modelle entwickelt, um das Surfverhalten von Nutzern im Internet zu beschreiben. Modelle vereinfachen dabei sehr häufig die zu beschreibende Realität.

Aufgabe 4

(a) Mache dir klar, welche Vereinfachungen bei der Beschreibung des realen Surfverhaltens von Nutzern getroffen wurden.

(b) Sind diese Vereinfachungen akzeptabel?

X

Fehler melden

X

Suche