Uni Wien:Recent Developments in Knowledge Discovery in Databases VU (Böhm)
Daten[Bearbeiten | Quelltext bearbeiten]
Vortragende | Christian Böhm, Anna Beer, Katerina Schindlerova |
---|---|
ECTS | 6,00 / 4,00 |
Aufgezeichnet | <Bitte ergänzen>„“ ist kein Wahrheitswert (wahr/falsch). |
Letzte Abhaltung | 2024S |
Sprache | Deutsch |
Links | ufind:052321 |
Bachelor Informatik | Modul Data Analysis (Gebundenes Wahlfach) |
Master Informatik | Modul Data Analysis (Gebundenes Wahlfach) |
Inhalt[Bearbeiten | Quelltext bearbeiten]
Der Kurs besteht aus zwei Teilen.
Teil 1 (Katerina Schindlerova): Granger Causality
- Granger Causality in verschiedenen Varianten (bi- und multivariat, non-linear), inklusive Penalization
- Minimum message / description principle
- Additive Noise Models
Teil 2 (Anna Beer): moderne Clustering-Methoden
- Evaluation of Clustering
- Spectral Clustering
- SCAR
- Verschiedene Varianten von Density-Based Clustering (HDBSCAN, DC-Distance)
- Fairness in Clustering
- Hierarchical Clustering
- High-Dimensional Clustering
Ablauf[Bearbeiten | Quelltext bearbeiten]
Teil 1:
Primär gibt es einen Vortragsteil, in dem man Granger Causality in verschiedenen Varianten kennen lernt.
Am Anfang sucht man sich außerdem ein Paper aus, das man später präsentiert.
Es gibt eine Hausübung, für die man etwa zwei Wochen Zeit hat.
Am Ende des Teils gibt es eine Prüfung.
Zusätzlich gab es eine "Causality Challenge", eine eher offene Aufgabenstellung, wobei es gewirkt hat als würde diese Aufgabe sich jedes Semester ändern.
Teil 2:
Ein Vorlesungsteil, in dem die verschiedenen Themen vorgetragen werden.
Man entscheidet sich auch hier für ein Thema, das man bearbeiten möchte. Sie dazu den Punkt "Übungen".
Am Ende dieses Teils gibt es ebenfalls eine Prüfung.
Benötigte/Empfehlenswerte Vorkenntnisse[Bearbeiten | Quelltext bearbeiten]
Anmeldevoraussetzungen:
Voraussetzungen für Wahlfächer (PR2, MOD, THI, ADS1, MGI)
Gatekeeper: Foundations of Data Analysis
Empfohlen:
Lineare Regression, Eigenwerte/-vektoren, Analysis, DBSCAN, K-Means
Vortrag[Bearbeiten | Quelltext bearbeiten]
In beiden Teilen prinzipiell ein Frontalvortrag, aber beide Professorinnen sind sehr interessiert am Austausch mit den Studenten, und freuen sich über Fragen und Kommentare. Beide sind auch offensichtlich sehr an ihren Gebieten interessiert.
Es gibt keine Anwesenheitspflicht bei den normalen Vortragseinheiten, aber gerade bei Prof. Beer ist es sinnvoll in die Einheiten zu gehen, da die Folien nicht besonders ausgiebig sind. Man kommt damit zurecht, aber es ist wesentlich einfacher, wenn man vor Ort ist und zuhört bzw. Notizen macht.
Bei Einheiten in denen Studenten präsentieren, ist Anwesenheitspflicht.
Übungen[Bearbeiten | Quelltext bearbeiten]
Teil 1:
Wie erwähnt gibt es eine Hausübung. Es sind wenige Aufgaben, darunter die Überprüfung nach Granger Causality mit einem kleinen Datenset, sowie weniger offenen Fragen. Die Antworten werden in einer Einheit dann präsentiert.
Sehr früh kann man sich eines von verschiedenen Papers aussuchen, welches man präsentiert. Nach der Präsentation werden Fragen von der Professorin, und potenziell auch von den Studenten gestellt. Es wird benotet wie gut man vorträgt, wie frei (nicht alles ablesen) und wie gut man das Thema versteht.
Bei der Causality Challenge sollte man sich zwei Faktoren aussuchen, und schauen ob diese sich gegenseitig im Kontext von Granger Causality beeinflussen.
Teil 2:
Hier suchte man sich eine von verschiedenen Challenges aus. Dabei gab es verschieden Varianten, z.B. das Erstellen eines Tutorials zu einem Paper in Blog-Form, ein kleines Seminarpaper, Erstellen eines Benchmark-Datasets oder Challenges aus offiziellen Wettbewerben (SISAP, KDD-Cup).
Prüfung, Benotung[Bearbeiten | Quelltext bearbeiten]
Wie erwähnt gibt es bei beiden Teilen jeweils eine Prüfung am Ende.
In der ersten Hälfte war die Aufteilung:
Exercise Sheet - 10 Punkte
Causal Challenge - 10 Punkte
Paper Presentation - 10 Punkte
Test - 20 Punkte
Die Beurteilung war recht milde. Man benötigte 50% der Gesamtpunkte, wenn man also im ersten Teil alle 50 Punkte bekommen hat, wäre man schon positiv, unabhängig von der zweiten Hälfte.
Dauer der Zeugnisausstellung[Bearbeiten | Quelltext bearbeiten]
noch offen
Zeitaufwand[Bearbeiten | Quelltext bearbeiten]
Für eine positive Note ist der Aufwand sehr gering, da man eben nur 50% braucht, ohne Nebenbedingungen, wie 50% aus beiden Teilen, oder so. Und weil die Beurteilung eben relativ milde ist. Dazu gibt es auch keine Anwesenheitspflicht. Auch die Aufgaben nehmen nicht besonders viel Zeit in Anspruch, gerade im ersten Teil sollte alles in jeweils ein oder zwei Tagen machbar sein. Für die Aufgabe im zweiten Teil sollte man vielleicht drei oder vier Tage einplanen.
Wenn man bei den Vorlesungseinheiten war, sollten die Tests kein Problem sein, und der Lernaufwand sich stark in Grenzen halten.
Unterlagen[Bearbeiten | Quelltext bearbeiten]
Foliensätze
Vor allem im zweiten Teil eher beschränkt nützlich (was auch von Prof. Beer so kommuniziert wird), aber es wird immer zu entsprechenden Foliensätzen oder den relevanten Papers verlinkt, so dass man die Materialen die man braucht leicht findet.
Tipps[Bearbeiten | Quelltext bearbeiten]
- Im zweiten Teil vor allem die Einheiten besuchen, spart viel Lernzeit
- Im ersten Teil möglichst viele Punkte holen, um im zweiten Teil schon nahezu positiv zu sein
- Die Übungsaufgaben sind nicht enorm viel Aufwand, aber gerade im zweiten Teil sollte man nicht extrem spät anfangen, da sie doch ein paar Tage benötigen werden
- Vor allem wenn einen die Themen interessieren: Zu den Einheiten gehen und mitarbeiten. Wie erwaähnt sind beide Profs sehr an Interaktivität und Mitarbeit interessiert. Nicht wegen der Note, sondern einfach weil sie gern über die Themen reden, die sie vortragen.
Highlights / Lob[Bearbeiten | Quelltext bearbeiten]
Äußerst motivierte Vortragende, bei denen man merkt, dass der Stoff sie interessiert. Gerade im zweiten Teil war die Aufgabenstellung auch nach der Wahl sehr frei, man hat bei der Umsetzung Spielraum.
Verbesserungsvorschläge / Kritik[Bearbeiten | Quelltext bearbeiten]
noch offen