i

Inhaltsbasiertes Empfehlungssystem mit KNN-Klassifikation

Aufgabe 1 - Punktdiagramm anfertigen: Trainingsphase

Fertige für den Datensatz ein Punktdiagramm an. Überlege dir dafür zunächst, was die erklärenden Attribute und was die Klassen sind. Die Werte Witz und Spannung geben auf einer Skala von 1 bis 10 an, wie viel Witz und Spannung ein Film objektiv beinhaltet.
Film Witz Spannung Bewertung
A 1 10 nicht gefallen
B 2 6 nicht gefallen
C 3 7 nicht gefallen
D 3 2 nicht gefallen
E 4 4 gefallen
F 5 5 gefallen
G 5 9 nicht gefallen
H 6 1 gefallen
I 7 3 gefallen
J 7 8 nicht gefallen
K 8 5 gefallen
L 8 1 gefallen
M 9 7 nicht gefallen
N 10 3 gefallen
O 1 2 nicht gefallen

Aufgabe 2 - Punktdiagramm nutzen: Anwendungsphase

Bestimme mit der Nächste-Nachbar-Klassifikation die Klassen der Filme.
Film Witz Spannung Bewertung
P 1 4
Q 6 4
R 6 6
S 9 8
T 9 2

Aufgabe 3 - Erweiterung der Klassen

Die Klassen wurden genauer spezifiziert. Übertrage die genaueren Klassen in dein Punktdiagramm aus Aufgabe 1 und bestimmte die Klassen für den Anwendungsdatensatz aus Aufgabe 2 erneut.
Film Witz Spannung Bewertung
A 1 10 1
B 2 6 2
C 3 7 2
D 3 2 3
E 4 4 4
F 5 5 4
G 5 9 1
H 6 1 5
I 7 3 5
J 7 8 1
K 8 5 5
L 8 1 5
M 9 7 1
N 10 3 5
O 1 2 2

Aufgabe 4 - Erweiterung der erklärenden Attribute

Die erklärenden Attribute wurden ebenso erweitert. Betrachte das Punktdiagramm in Geogebra 3D und die untenstehenden Datensätze.
  1. Finde heraus, welche erklärenden Attribute an welcher Achse abgetragen sind. Kannst du das Punktdiagramm so drehen, dass es aussieht wie das aus Aufgabe 2?
  2. Bestimme mit der Nächste-Nachbar-Klassifikation die Klassen der Filme P, Q, R, S und T.
  3. Vergleiche deine Klassifikation zu deinen Ergebnissen aus Aufgabe 2.
Film Witz Spannung Romantik Bewertung
A 1 10 6 1
B 2 6 3 2
C 3 7 2 2
D 3 2 9 3
E 4 4 7 4
F 5 5 5 4
G 5 9 9 1
H 6 1 2 5
I 7 3 2 5
J 7 8 7 1
K 8 5 3 5
L 8 1 1 5
M 9 7 9 1
N 10 3 2 5
O 1 2 3 2

Film Witz Spannung Romantik Bewertung
P 1 4 7
Q 6 4 5
R 6 6 8
S 9 8 1
T 9 2 3

Aufgabe 5 - Inhaltsbasierte K-Nächste-Nachbar-Klassifikation

Unser ursprüngliche Filmdatensatz hat nach der Datenvorbereitung die folgende Form:
movieID Comedy Crime Drama Thriller Romance War rating Nutzer 1
1 1 0 1 0 1 1 4
2 1 1 0 0 0 0 5
3 1 0 1 0 0 0 3
4 0 1 1 1 0 0 5
5 0 0 1 0 1 0 2
6 1 1 1 0 0 0 5
  1. Bestimme, welche Spalte der Klasse und welche Spalten den Attributen entsprechen.
    Punktdiagramm
  2. Argumentiere, warum wir mehr als zwei erklärende Attribute betrachten sollten, um sinnvolle Vorhersagen zu machen.

Suche

v
14.5.1.3.3.1
www.inf-schule.de/projekte/datascience/projekt_empfehlungssysteme/modellentwicklung/knn_fuer_empfehlungssyssteme/knn_inhaltsbasiert
www.inf-schule.de/14.5.1.3.3.1
www.inf-schule.de/@/page/MIrJBlnkoyumbEyX

Rückmeldung geben