Uni Wien:Scientific Data Management VU (Kriege)
Daten[Bearbeiten | Quelltext bearbeiten]
Vortragende | Nils Morten Kriege, Claudia Plant, Ylli Sadikaj, Anastasiia Sedova, Andreas Stephan |
---|---|
ECTS | 6,00 / 4,00 |
Aufgezeichnet | Ja |
Sprache | English |
Links | ufind:052813 |
Inhalt[Bearbeiten | Quelltext bearbeiten]
Diese Lehrveranstaltung vertieft quasi die Inhalte von Uni_Wien:Foundations_of_Data_Analysis_VU_(Plant). Es geht unter anderem um:
- Metriken
- Clustering, insbesondere:
- Hierarchical Clustering
- K-Means Clustering
- DBSCAN
- Spark und MapReduce
- Index-Data-Structures
- Page Rank
- Graph Isomorphism Problems und Suchen in Graph-Datenbanken (mit Graph-Edit-Distance)
- Min-Hashing (Similarity of Sets, Locally Sensitive Hashing)
Ablauf[Bearbeiten | Quelltext bearbeiten]
Es gibt 2x wöchentliche Vorlesungen, die (zumindest während Corona) hybrid abgehalten werden. Dh. man kann sowohl vor Ort sein, als auch online via BigBlueButton teilnehmen. Prof. Kriege schafft es wirklich, sowohl das Online- als auch das Offline-Publikum voll einzubinden.
Außerdem gibt es drei Gruppenarbeiten (Programmierprojekte) mit 3-5 Personen pro Gruppe. Im Sommersemester 2020 waren das
- Hierarchical Clustering implementieren
- Anomaly Detection in Network Traffic with K-Means Clustering via Google Cloud
- PageRank and Network Alignment
Die Programmiersprache ist grundsätzlich frei wählbar, man sollte halt eine Sprache wählen, wo die entsprechenden Libraries vorhanden sind.
Beinahe jede Woche gibt es außerdem Arbeitsblätter, die in Einzelarbeit auszuarbeiten sind. Teilweise sind das Multiple-Choice-Fragen, teilweise (mehr oder weniger formale) Beweise, teilweise zB. Clustering anwenden etc. Man sollte möglichst viele dieser Beispiele machen. Alles, was man abgegeben hat, sollte man außerdem präsentieren können, denn unter den Leuten, die ein entsprechendes Beispiel abgegeben haben, wird eine Person ausgewählt, die dieses dann präsentieren muss. Bei den Präsentationen der Arbeitsblätter und Projekte besteht Anwesenheitspflicht, bei den Vorlesungseinheiten nicht.
Am Ende des Semesters gibt es noch einen Test über den gesamten Stoff.
Benötigte/Empfehlenswerte Vorkenntnisse[Bearbeiten | Quelltext bearbeiten]
Laut u:find wird empfohlen, Uni_Wien:Datenbanksysteme_VU_(Schikuta), Uni_Wien:Algorithmen_und_Datenstrukturen_1_VU_(Wanek), Uni_Wien:Software_Engineering_1_VU_(Böhmer) und Uni_Wien:Netzwerktechnologien_VO_(Rafetseder) bereits absolviert zu haben. Tatsächlich denke ich aber, dass Uni_Wien:Algorithmen_und_Datenstrukturen_1_VU_(Wanek) (was im Bachelor sowieso im 2. Semester vorgesehen ist) vollkommen ausreichend ist.
Wer Uni_Wien:Foundations_of_Data_Analysis_VU_(Plant) bereits absolviert hat, dem werden einige Dinge bekanntvorkommen, es werden aber alle Dinge gut erklärt, sodass der Stoff von FDA vielleicht empfehlenswert, aber nicht unbedingt notwendig ist.
Vortrag[Bearbeiten | Quelltext bearbeiten]
Herr Prof. Kriege ist wirklich großartig. Er erklärt extrem gut; es empfiehlt sich, die Vorlesungen anzuschauen. Diese werden auch aufgezeichnet.
Übungen[Bearbeiten | Quelltext bearbeiten]
siehe Ablauf
Prüfung, Benotung[Bearbeiten | Quelltext bearbeiten]
Wie unter Ablauf beschrieben, besteht die Benotung aus 3 Teilen:
- Arbeitsblätter (Exercise sheets; Einzelarbeit) - 30% der Gesamtnote
- Gruppen-Programmierprojekte (Programming assignments) - 30% der Gesamtnote
- Abschlusstest (Final exam) - 40% der Gesamtnote
Man kann also durchaus an sich mit zwei der 3 Teilleistungen positiv werden. Allerdings sollte man sich damit besser nicht spielen, denn man braucht die Punkte der Arbeitsblätter und Projekte ggf., wenns beim Abschlusstest nicht so gut läuft.
Dauer der Zeugnisausstellung[Bearbeiten | Quelltext bearbeiten]
Semester | Letzte Leistung | Zeugnis | |
---|---|---|---|
SS22 | 29.06.2022 | 14.07.2022 | 2 Wochen |
Zeitaufwand[Bearbeiten | Quelltext bearbeiten]
Pro Woche gibt es 3 Stunden Vorlesung/Präsentationen. Außerdem gibt es die wöchentlichen Arbeitsblätter. Dort variiert der Aufwand je nach Arbeitsblatt, aber man kann schon je nach Woche mit 2-4 Stunden rechnen. Auch mit den Programmieraufgaben sollte man nicht zu spät beginnen.
Insgesamt ist der Aufwand schon hoch, aber die Lehrveranstaltung ist extrem gut gemacht. Man lernt extrem viel dabei; sie ist den Aufwand definitiv wert!
Unterlagen[Bearbeiten | Quelltext bearbeiten]
noch offen
Tipps[Bearbeiten | Quelltext bearbeiten]
noch offen
Verbesserungsvorschläge / Kritik[Bearbeiten | Quelltext bearbeiten]
noch offen