Uni Wien:Scientific Data Management VU (Kriege)

Aus VoWi
Zur Navigation springen Zur Suche springen

Daten[Bearbeiten | Quelltext bearbeiten]

Vortragende Nils Morten Kriege, Claudia Plant, Ylli Sadikaj, Anastasiia Sedova, Andreas Stephan
ECTS 6,00 / 4,00
Aufgezeichnet Ja
Sprache English
Links ufind:052813
Zuordnungen
Master Business Analytics Modul Data Science Electives (Gebundenes Wahlfach)
Bachelor Informatik Modul Parallel Computing (Gebundenes Wahlfach)
Master Informatik Modul Parallel Computing (Gebundenes Wahlfach)
Bachelor Informatik Modul Data Analysis (Gebundenes Wahlfach)
Master Informatik Modul Data Analysis (Gebundenes Wahlfach)
Master Informatik Modul Information Management & Systems Engineering (Gebundenes Wahlfach)
Bachelor Informatik Modul Information Management & Systems Engineering (Gebundenes Wahlfach)
Master Data Science Modul Specialisation (Gebundenes Wahlfach)


Inhalt[Bearbeiten | Quelltext bearbeiten]

Diese Lehrveranstaltung vertieft quasi die Inhalte von Uni_Wien:Foundations_of_Data_Analysis_VU_(Plant). Es geht unter anderem um:

  • Metriken
  • Clustering, insbesondere:
    • Hierarchical Clustering
    • K-Means Clustering
    • DBSCAN
  • Spark und MapReduce
  • Index-Data-Structures
  • Page Rank
  • Graph Isomorphism Problems und Suchen in Graph-Datenbanken (mit Graph-Edit-Distance)
  • Min-Hashing (Similarity of Sets, Locally Sensitive Hashing)

Ablauf[Bearbeiten | Quelltext bearbeiten]

Es gibt 2x wöchentliche Vorlesungen, die (zumindest während Corona) hybrid abgehalten werden. Dh. man kann sowohl vor Ort sein, als auch online via BigBlueButton teilnehmen. Prof. Kriege schafft es wirklich, sowohl das Online- als auch das Offline-Publikum voll einzubinden.

Außerdem gibt es drei Gruppenarbeiten (Programmierprojekte) mit 3-5 Personen pro Gruppe. Im Sommersemester 2020 waren das

  1. Hierarchical Clustering implementieren
  2. Anomaly Detection in Network Traffic with K-Means Clustering via Google Cloud
  3. PageRank and Network Alignment

Die Programmiersprache ist grundsätzlich frei wählbar, man sollte halt eine Sprache wählen, wo die entsprechenden Libraries vorhanden sind.

Beinahe jede Woche gibt es außerdem Arbeitsblätter, die in Einzelarbeit auszuarbeiten sind. Teilweise sind das Multiple-Choice-Fragen, teilweise (mehr oder weniger formale) Beweise, teilweise zB. Clustering anwenden etc. Man sollte möglichst viele dieser Beispiele machen. Alles, was man abgegeben hat, sollte man außerdem präsentieren können, denn unter den Leuten, die ein entsprechendes Beispiel abgegeben haben, wird eine Person ausgewählt, die dieses dann präsentieren muss. Bei den Präsentationen der Arbeitsblätter und Projekte besteht Anwesenheitspflicht, bei den Vorlesungseinheiten nicht.

Am Ende des Semesters gibt es noch einen Test über den gesamten Stoff.

Benötigte/Empfehlenswerte Vorkenntnisse[Bearbeiten | Quelltext bearbeiten]

Laut u:find wird empfohlen, Uni_Wien:Datenbanksysteme_VU_(Schikuta), Uni_Wien:Algorithmen_und_Datenstrukturen_1_VU_(Wanek), Uni_Wien:Software_Engineering_1_VU_(Böhmer) und Uni_Wien:Netzwerktechnologien_VO_(Rafetseder) bereits absolviert zu haben. Tatsächlich denke ich aber, dass Uni_Wien:Algorithmen_und_Datenstrukturen_1_VU_(Wanek) (was im Bachelor sowieso im 2. Semester vorgesehen ist) vollkommen ausreichend ist.

Wer Uni_Wien:Foundations_of_Data_Analysis_VU_(Plant) bereits absolviert hat, dem werden einige Dinge bekanntvorkommen, es werden aber alle Dinge gut erklärt, sodass der Stoff von FDA vielleicht empfehlenswert, aber nicht unbedingt notwendig ist.

Vortrag[Bearbeiten | Quelltext bearbeiten]

Herr Prof. Kriege ist wirklich großartig. Er erklärt extrem gut; es empfiehlt sich, die Vorlesungen anzuschauen. Diese werden auch aufgezeichnet.

Übungen[Bearbeiten | Quelltext bearbeiten]

siehe Ablauf

Prüfung, Benotung[Bearbeiten | Quelltext bearbeiten]

Wie unter Ablauf beschrieben, besteht die Benotung aus 3 Teilen:

  1. Arbeitsblätter (Exercise sheets; Einzelarbeit) - 30% der Gesamtnote
  2. Gruppen-Programmierprojekte (Programming assignments) - 30% der Gesamtnote
  3. Abschlusstest (Final exam) - 40% der Gesamtnote

Man kann also durchaus an sich mit zwei der 3 Teilleistungen positiv werden. Allerdings sollte man sich damit besser nicht spielen, denn man braucht die Punkte der Arbeitsblätter und Projekte ggf., wenns beim Abschlusstest nicht so gut läuft.

Dauer der Zeugnisausstellung[Bearbeiten | Quelltext bearbeiten]

Semester Letzte Leistung Zeugnis
SS22 29.06.2022 14.07.2022 2 Wochen

Zeitaufwand[Bearbeiten | Quelltext bearbeiten]

Pro Woche gibt es 3 Stunden Vorlesung/Präsentationen. Außerdem gibt es die wöchentlichen Arbeitsblätter. Dort variiert der Aufwand je nach Arbeitsblatt, aber man kann schon je nach Woche mit 2-4 Stunden rechnen. Auch mit den Programmieraufgaben sollte man nicht zu spät beginnen.

Insgesamt ist der Aufwand schon hoch, aber die Lehrveranstaltung ist extrem gut gemacht. Man lernt extrem viel dabei; sie ist den Aufwand definitiv wert!

Unterlagen[Bearbeiten | Quelltext bearbeiten]

noch offen

Tipps[Bearbeiten | Quelltext bearbeiten]

noch offen

Verbesserungsvorschläge / Kritik[Bearbeiten | Quelltext bearbeiten]

noch offen

Materialien

Diese Seite hat noch keine Anhänge, du kannst aber neue hinzufügen.