i

Wahl des Parameters k

Hinweis: Die Daten sind fiktiv.

Aufgabe 1 - Die Wahl des Parameters k

Betrachte die durch den blauen Punkt gekennzeichnete Verbindung mit einer geplanten Reisezeit von 350 Minuten und einer geplanten kürzesten Umstiegszeit von 22 Minuten. Bestimme mit Hilfe der K-Nächste-Nachbar-Klassifikation für
  1. k=1
  2. k=3
  3. k=8
  4. k=9
  5. k=10
ob die blaue Verbindung püntlich oder unpünktlich sein wird. Über den Schieberegler "Skalierung" kannst du den Bereich so verändern, dass sich die k nächsten Nachbarn innerhalb des Bereichs befinden. Erläutere, welche Schwierigkeiten hier bei der Wahl des Parameters k auftreten.



Wir sehen, dass die Wahl von k einen großen Einfluss darauf hat, wie gut die Vorhersage der K-Nächste-Nachbar-Klassifikation ist und ob wir überhaupt eine eindeutige Vorhersage geben können. Insbesondere sehr kleine und große Werte für k sollten vermieden werden. Bei sehr kleinen Werten von k kann es passieren, dass 'Ausreißer' in unseren Daten die Vorhersage zu stark beeinflussen. Bei großen Werten von k kann der Fall auftreten, dass Datenpunkte betrachtet werden, die eigentlich weit weg von unserem neuen Punkt liegen und daher kaum noch ähnlich zu diesem sind. In beiden Fällen entstehen schlechte Vorhersagen.
Beim Overfitting (deutsch:Überanpassung) ist die Klassifikation der Daten zu stark von den Einzeldaten des Datensatzes abhängig. Es tritt auf, wenn k zu klein gewählt wird. Im Fall des Underfittings (deutsch:Unteranpassung) werden Strukturen in den Daten nicht mehr beachtet. Dies tritt auf, wenn k zu groß gewählt wird.

Aufgabe 2 - Overfitting und Underfitting

Finde je mindestens eine Beispielverbindung, anhand der Overfitting bzw. Underfitting besonders deutlich wird. Bewege dazu den blauen Punkt in der Grafik. Über den Schieberegler "Skalierung" kannst du beeinflussen, wie viele Nachbarn betrachtet werden.



Aufgabe 3 - Overfitting und Underfitting (eigenes Beispiel)

  1. Entwerfe ein Punktdiagramm, anhand dessen das Phänomen des Overfittings besonders deutlich wird.
  2. Entwerfe ein Punktdiagramm, anhand dessen das Phänomen des Underfittings besonders deutlich wird.

Suche

v
14.5.1.3.2.2
www.inf-schule.de/projekte/datascience/projekt_empfehlungssysteme/modellentwicklung/knn_erlernen/overfitting_underfitting
www.inf-schule.de/14.5.1.3.2.2
www.inf-schule.de/@/page/zNPMlZXqQvBKYI9i

Rückmeldung geben