TU Wien:Business Intelligence VU (Rauber)
- Business Intelligence VU (Rauber) (TU Wien, 0 Materialien)
- Business Intelligence I VU (Leitner) (Uni Wien, 0 Materialien)
- Business Intelligence II VU (Leitner) (Uni Wien, 0 Materialien)
- Business Intelligence VU (Tjoa) (TU Wien, veraltet, 12 Materialien)
Daten[Bearbeiten | Quelltext bearbeiten]
Vortragende | Katja Hose• Andreas Rauber |
---|---|
ECTS | 6,0 |
Letzte Abhaltung | 2024W |
Sprache | English |
Mattermost | business-intelligence • Register • Mattermost-Infos |
Links | tiss:188429 |
Inhalt[Bearbeiten | Quelltext bearbeiten]
Die VO war in zwei Teile aufgeteilt: Der erste Part wurde von Prof. Winkler gehalten (Einführung BI, Data Warehousing, Big Data), der zweite Teil wurde von Prof. Rauber gehalten (Data Mining, Machine Learning). Im ersten Teil wurde mehr auf klassische Vorlesung gesetzt, die im WS22 aber remote stattfand (es gab aufgezeichnete Videos). Im zweiten Teil wurde erwartet, dass die Studierenden vorher bereitgestellte Links vor der VO Einheit selbstständig bearbeiten, die dann in der jeweiligen Einheit diskutiert bzw. präsentiert werden. Wie konkret das passiert ist, kann ich aber nicht sagen, da ich den zweiten VO Teil nicht selbst besucht habe.
- Einführung in BI
- Historischer Kontext
- Definitionen und Beispiele
- Ziele, Fragestellungen, Use-Cases
- Grundkonzepte
- Typen der Analyse
- Information Integration
- Data Warehousing
- Was ist ein Data Warehouse?
- Charakteristika
- Theorie, Motivation, Beispiele
- OLTP, OLAP
- Referenzarchitektur
- Data Lakes
- Unterschiede zu DWH
- Vor- & Nachteile
- Der ETL Prozess
- Preprocessing, etc.
- Dimensional Modeling & OLAP
- Star- vs. Snowflake Schema
- DWH Design-Entscheidungen
- Kimball's Lifecycle Process
- Was ist ein Data Warehouse?
- Big Data
- Einleitung und Use-Cases
- Challenges
- Scalability
- Variability
- Big Data Processing
- Apache Hadoop
- Data-Mining
- Introduction, Data-Driven Business
- Data-Analytics
- Pre-Processing
- CRISP-DM
- Machine Learning
- Intro
- Supervised vs. Unsupervised Learning
- Ethics, Regulation, Reproduzierbarkeit
Ablauf[Bearbeiten | Quelltext bearbeiten]
Zwei VO Blöcke zu je drei Einheiten (je zwei Stunden). Der erste Teil bestand aus klassischen VO Einheiten, der zweite Teil war als flipped classroom konzipiert, wie stark das genau angewandt wurde, bleibt jedoch offen.
Benötigte/Empfehlenswerte Vorkenntnisse[Bearbeiten | Quelltext bearbeiten]
- Grundlagen in Datenbanken und SQL
- Projektmanagement basics von Vorteil (erleichtert das Lernen und Argumentieren der Design-Entscheidungen bei den Übungsaufgaben)
- Latex Grundlagen
Vortrag[Bearbeiten | Quelltext bearbeiten]
noch offen
Übungen[Bearbeiten | Quelltext bearbeiten]
Die Übungen waren gut, aber zum Teil extrem langwierig. Ich hatte echt das Gefühl, bei den Übungen was gelernt zu haben, besonders bei der zweiten, bei der ein eigenes DWH nach genauen Vorgaben umgesetzt werden musste. Die erste Übung war rein theoretisch, und es musste ein Report abgegeben werden. Die Aufgabe war relativ frei formuliert (es wurde einem also viel Spielraum bei der Bearbeitung der Fragen gelassen). Im Grunde ging es hier darum, das Grundwissen über den Stoff der VO abzufragen. Die zweite Aufgabe war zu 95% praktisch. Hier musste (nach strikten Vorgaben) eine Datenbank erstellt und befüllt werden. Aus diesen Daten wurde dann ein DWH gebaut und Abfragen durchgeführt. Wenn man sich mit SQL auskennt, war diese Aufgabe extrem einfach und schnell erledigt. Die Aufgabenstellung war dabei sehr viel weniger frei als in der ersten Aufgabe, was gut war. Es wurde auch ein Tutorial mitgegeben, das alle Schritte im Detail erklärt hat, was auch gut war, wenn man sich nicht mit SQL auskennt. Abgegeben werden musste der Code und ein Dokument mit Antworten zu gestellten Fragen. Die dritte Aufgabe bestand aus verschiedenen ML tasks und der Beantwortung von Fragen. Abzugeben war wieder ein Report in einem fix definierten Format.
Insgesamt war ich mit dem Übungsteil zufrieden. Die Bewertungen waren fair und es stand meiner Meinung nach auch immer genug Zeit zur Verfügung. Mehrmals wurde die Abgabe sogar auf Wunsch der Studierenden nach Hinten verschoben. Die Organisation der Aufgaben war dann aber doch eine Katastrophe, und man musste zum Teil monatelang auf die Bewertungen warten. Fragen im Forum wurden oft gar nicht oder erst extrem spät (ein, zwei Wochen später) beantwortet. Die letzte Aufgabe wurde erst in der zweiten Woche des nächsten Semesters (2023S) bewertet.
Prüfung, Benotung[Bearbeiten | Quelltext bearbeiten]
Die Prüfung bestand im WS2022 aus zwei Teilen: Ein Single-Choice Teil mit 30 Fragen (wahr/falsch) und ein Freitext Teil mit 4 offenen Fragen. Die Fragen wurden zwar alle in der VO behandelt, es schien aber eher auf auswendig Gelerntes Wert gelegt worden zu sein, als auf Verständnisfragen. So waren gefühlt 40-50% der Punkte nur zu erreichen, wenn man die Details von Apache Hadoop und EU Artificial Intelligence Regulationen kennt (und z.B. fünf Arten von Bias aufzählen kann), was meiner Meinung nach etwas viel ist, da sich Implementierungen und Gesetze schnell ändern können bzw. diese leicht nachgeschlagen werden können. Eine Überprüfung des allgemeinen Verständnisses der Grundlagen wäre sicher besser gewesen.
Dauer der Zeugnisausstellung[Bearbeiten | Quelltext bearbeiten]
WS22: Viel zu spät -- Erst nach Beginn des Folgesemesters
Prüfung am 17.03.2023 - Zeugnis am 27.03.2023
Zeitaufwand[Bearbeiten | Quelltext bearbeiten]
Geht sich meiner Meinung nach in den 6 ECTS aus, sofern man einen guten Lab Partner hat und sich die Arbeit entsprechend aufteilt.
Unterlagen[Bearbeiten | Quelltext bearbeiten]
Ausnahmsweise gab es im WS2022 Aufzeichnungen von alten VOs im ersten Block. Sonst nur Folien, die nicht wirklich hilfreich beim Lernen sind (also ohne VO Besuch). Es werden aber zu jedem Kapitel auch PDFs verlinkt, die zum Lernen für die Prüfung genutzt werden können. Das in der VO erwähnte Buch ist dabei sehr gut und hilfreich (die relevanten Kapitel sind auch als PDF in TUWEL verlinkt).
Tipps[Bearbeiten | Quelltext bearbeiten]
- Rechtzeitig mit den Aufgaben beginnen
- Genug Zeit für Probleme einplanen, besonders bei Task 2
- Ergebnisse der Abfragen aus Task 2 mit anderen Studierenden vergleichen. Diese müssten für alle gleich sein (da fix vorgegebene Daten verwendet werden)
- Wer die Machine Learning VU besucht hat, hat im zweiten Teil einen klaren Vorteil
Highlights / Lob[Bearbeiten | Quelltext bearbeiten]
noch offen
Verbesserungsvorschläge / Kritik[Bearbeiten | Quelltext bearbeiten]
- Organisation verbessern
- Zeitraum für Bewertungen einhalten