Prüfung vom 24.6.2008 Es war(en) jeweils die richtig(en) Aussagen anzukreuzen 1. k-fold cross-validation * jeder Datenpunkt kommt 1x im Testset vor * es kommen k Datenpunkte im Testset vor * jeder Punkt kommt mit der Wahrscheinlichkeit seines Auftretens im Testset vor * ??? 2. Support Vector Machines * Aussage mit "maximiert den Abstand zu den Punkten" * ??? * ??? * ??? 3. Decision Tree Beispiel - Ein gegebener Decision Tree soll mit (rain, 25, 80, TRUE) abgefragt werden. - Gegeben: (weather, temperature, humidity, windy) - Root Node war Weather? -> rain,sunny,... von rain gehts zu Windy? -> true or false bei true war "No Play 2" und "Play 0" - Ankreuzen, ob "Play | No Play" 4. gegeben vier Quadrate mit folgender Datenpunkteverteilung: - Quadrat 1: unübersichtlich viele, keine Relation zw. weißen und schwarzen Punkten - Quadrat 2: 3 weiße, 3 schwarze - Quadrat 3: 6 weiße, 6 schwarze (sie waren auf jedenfall ein Vielfaches von Q2) - Quadrat 4: ausschließlich weiße * Entropie in Q3 und Q2 gleich * Entropie in Q4 so gering wie möglich * Entropie in Q2 so groß wie möglich * ??? 5. k-nearest neighbor mit Abbildung - gegeben 2 Klassen (Kreis und Quadrat) - Diamantförmiger Punkt irgendwo zwischen den Klassen - Frage: zu welchen der Klassen gehört der Diamant, wenn k = 1, 2, 3 - Schwierigkeit: Diamant lag genau zwischen einem Kreis und einem Quadrat, für k=2 wusste ich keine richtige Antwort 6. knn Fragen * knn ist Lazy learning? * knn hat kein Training, es entscheidet während der Klassifizierung * zero-mean-unit-Standardisierung spielt keine bzw. kaum eine Rolle * ??? 7. Kernelfragen * eine Aussage mit Dimensionsreduktion * gängige Kernels sind: (3 Aufzählungen) * eine Aussage mit Kernelmatrix * ??? 8. Die Kappa Statistik sagt aus: * Qualität des Trainingsverfahrens * die Verbesserung gegenüber der Zufallsklassifizierung * ??? * ??? 9. Gegeben: eine Prioritätsmatrix; Single Linkage anwenden * welche Punkte werden zusammengefasst? (einige Beispiele gegeben) 10. Die Auswahl der Centroiden im k-Means erfolgt: * zufällig * ??? * ??? * ???