Uni Wien:Recent Developments in Knowledge Discovery in Databases VU (Böhm)

Aus VoWi
Zur Navigation springen Zur Suche springen

Daten[Bearbeiten | Quelltext bearbeiten]

Vortragende Christian Böhm, Anna Beer, Katerina Schindlerova
ECTS 6,00 / 4,00
Aufgezeichnet <Bitte ergänzen>„“ ist kein Wahrheitswert (wahr/falsch).
Letzte Abhaltung 2024S
Sprache Deutsch
Links ufind:052321
Zuordnungen
Bachelor Informatik Modul Data Analysis (Gebundenes Wahlfach)
Master Informatik Modul Data Analysis (Gebundenes Wahlfach)


Inhalt[Bearbeiten | Quelltext bearbeiten]

Der Kurs besteht aus zwei Teilen.

Teil 1 (Katerina Schindlerova): Granger Causality

- Granger Causality in verschiedenen Varianten (bi- und multivariat, non-linear), inklusive Penalization

- Minimum message / description principle

- Additive Noise Models

Teil 2 (Anna Beer): moderne Clustering-Methoden

- Evaluation of Clustering

- Spectral Clustering

- SCAR

- Verschiedene Varianten von Density-Based Clustering (HDBSCAN, DC-Distance)

- Fairness in Clustering

- Hierarchical Clustering

- High-Dimensional Clustering

Ablauf[Bearbeiten | Quelltext bearbeiten]

Teil 1:

Primär gibt es einen Vortragsteil, in dem man Granger Causality in verschiedenen Varianten kennen lernt.

Am Anfang sucht man sich außerdem ein Paper aus, das man später präsentiert.

Es gibt eine Hausübung, für die man etwa zwei Wochen Zeit hat.

Am Ende des Teils gibt es eine Prüfung.

Zusätzlich gab es eine "Causality Challenge", eine eher offene Aufgabenstellung, wobei es gewirkt hat als würde diese Aufgabe sich jedes Semester ändern.

Teil 2:

Ein Vorlesungsteil, in dem die verschiedenen Themen vorgetragen werden.

Man entscheidet sich auch hier für ein Thema, das man bearbeiten möchte. Sie dazu den Punkt "Übungen".

Am Ende dieses Teils gibt es ebenfalls eine Prüfung.

Benötigte/Empfehlenswerte Vorkenntnisse[Bearbeiten | Quelltext bearbeiten]

Anmeldevoraussetzungen:

Voraussetzungen für Wahlfächer (PR2, MOD, THI, ADS1, MGI)

Gatekeeper: Foundations of Data Analysis


Empfohlen:

Lineare Regression, Eigenwerte/-vektoren, Analysis, DBSCAN, K-Means

Vortrag[Bearbeiten | Quelltext bearbeiten]

In beiden Teilen prinzipiell ein Frontalvortrag, aber beide Professorinnen sind sehr interessiert am Austausch mit den Studenten, und freuen sich über Fragen und Kommentare. Beide sind auch offensichtlich sehr an ihren Gebieten interessiert.

Es gibt keine Anwesenheitspflicht bei den normalen Vortragseinheiten, aber gerade bei Prof. Beer ist es sinnvoll in die Einheiten zu gehen, da die Folien nicht besonders ausgiebig sind. Man kommt damit zurecht, aber es ist wesentlich einfacher, wenn man vor Ort ist und zuhört bzw. Notizen macht.

Bei Einheiten in denen Studenten präsentieren, ist Anwesenheitspflicht.

Übungen[Bearbeiten | Quelltext bearbeiten]

Teil 1:

Wie erwähnt gibt es eine Hausübung. Es sind wenige Aufgaben, darunter die Überprüfung nach Granger Causality mit einem kleinen Datenset, sowie weniger offenen Fragen. Die Antworten werden in einer Einheit dann präsentiert.

Sehr früh kann man sich eines von verschiedenen Papers aussuchen, welches man präsentiert. Nach der Präsentation werden Fragen von der Professorin, und potenziell auch von den Studenten gestellt. Es wird benotet wie gut man vorträgt, wie frei (nicht alles ablesen) und wie gut man das Thema versteht.

Bei der Causality Challenge sollte man sich zwei Faktoren aussuchen, und schauen ob diese sich gegenseitig im Kontext von Granger Causality beeinflussen.

Teil 2:

Hier suchte man sich eine von verschiedenen Challenges aus. Dabei gab es verschieden Varianten, z.B. das Erstellen eines Tutorials zu einem Paper in Blog-Form, ein kleines Seminarpaper, Erstellen eines Benchmark-Datasets oder Challenges aus offiziellen Wettbewerben (SISAP, KDD-Cup).

Prüfung, Benotung[Bearbeiten | Quelltext bearbeiten]

Wie erwähnt gibt es bei beiden Teilen jeweils eine Prüfung am Ende.

In der ersten Hälfte war die Aufteilung:

Exercise Sheet - 10 Punkte

Causal Challenge - 10 Punkte

Paper Presentation - 10 Punkte

Test - 20 Punkte

Die Beurteilung war recht milde. Man benötigte 50% der Gesamtpunkte, wenn man also im ersten Teil alle 50 Punkte bekommen hat, wäre man schon positiv, unabhängig von der zweiten Hälfte.

Dauer der Zeugnisausstellung[Bearbeiten | Quelltext bearbeiten]

noch offen

Zeitaufwand[Bearbeiten | Quelltext bearbeiten]

Für eine positive Note ist der Aufwand sehr gering, da man eben nur 50% braucht, ohne Nebenbedingungen, wie 50% aus beiden Teilen, oder so. Und weil die Beurteilung eben relativ milde ist. Dazu gibt es auch keine Anwesenheitspflicht. Auch die Aufgaben nehmen nicht besonders viel Zeit in Anspruch, gerade im ersten Teil sollte alles in jeweils ein oder zwei Tagen machbar sein. Für die Aufgabe im zweiten Teil sollte man vielleicht drei oder vier Tage einplanen.

Wenn man bei den Vorlesungseinheiten war, sollten die Tests kein Problem sein, und der Lernaufwand sich stark in Grenzen halten.

Unterlagen[Bearbeiten | Quelltext bearbeiten]

Foliensätze

Vor allem im zweiten Teil eher beschränkt nützlich (was auch von Prof. Beer so kommuniziert wird), aber es wird immer zu entsprechenden Foliensätzen oder den relevanten Papers verlinkt, so dass man die Materialen die man braucht leicht findet.

Tipps[Bearbeiten | Quelltext bearbeiten]

- Im zweiten Teil vor allem die Einheiten besuchen, spart viel Lernzeit

- Im ersten Teil möglichst viele Punkte holen, um im zweiten Teil schon nahezu positiv zu sein

- Die Übungsaufgaben sind nicht enorm viel Aufwand, aber gerade im zweiten Teil sollte man nicht extrem spät anfangen, da sie doch ein paar Tage benötigen werden

- Vor allem wenn einen die Themen interessieren: Zu den Einheiten gehen und mitarbeiten. Wie erwaähnt sind beide Profs sehr an Interaktivität und Mitarbeit interessiert. Nicht wegen der Note, sondern einfach weil sie gern über die Themen reden, die sie vortragen.

Highlights / Lob[Bearbeiten | Quelltext bearbeiten]

Äußerst motivierte Vortragende, bei denen man merkt, dass der Stoff sie interessiert. Gerade im zweiten Teil war die Aufgabenstellung auch nach der Wahl sehr frei, man hat bei der Umsetzung Spielraum.

Verbesserungsvorschläge / Kritik[Bearbeiten | Quelltext bearbeiten]

noch offen

Materialien

Diese Seite hat noch keine Anhänge, du kannst aber neue hinzufügen.