TU Wien:Computer Vision VU (Sablatnig)

From VoWi
Jump to navigation Jump to search
Similarly named LVAs (Resources):

Daten[edit]

Lecturers Robert Sablatnig, Roxane Licandro
ECTS 4,5
Department Forschungsbereich Computer Vision
When winter semester
Links tiss:183585, Homepage, Mattermost-Channel
Zuordnungen
Master Visual Computing Pflichtmodul Computer Vision
Master Media and Human-Centered Computing Wahlmodul Computer Vision
Master Media and Human-Centered Computing Wahlmodul Image Processing & Visualization
Master Medizinische Informatik Wahlmodul Biosignal- und Bildverarbeitung

Mattermost: Channel "computer-vision"RegisterMattermost-Infos

Inhalt[edit]

Überblick über mehrere Bereiche der Computer Vision. Konkret

  • Geschichte und Anwendungen von CV
  • Digitalkamera: Parameter, Mathematisches Modell
  • Filter: Kantenfilter, Eckenfilter
  • Transformationen: DFT, Gabor-wavelets, Haar-Transform
  • Features: SIFT, Bag of Words
  • Algorithmen: RANSAC, k-Means
  • Projektive Geometrie
  • Stereo Vision: Epipolargeometrie, Essential Matrix
  • Korrespondenzanalyse, Multi-View Geometry

Ablauf[edit]

Wöchentliche Vorlesung und zwei Python Übungsbeispiele übers Semester.

Benötigte/Empfehlenswerte Vorkenntnisse[edit]

Eventuell Computer Vision-Teil aus "Einführung in Visual Computing" aber das wichtigste wird hier wiederholt. Basiswissen zu Python kann für die Übung nicht schaden.

Vortrag[edit]

Der Vortrag ist sehr frei, es wird stofflich viel aus EVC Bekanntes wiederholt, vor allem in der ersten Hälfte der Vorlesung. Da die Folien zum Lernen ungeeignet sind, zahlt sich Anwesenheit zum Verständnis des Stoffs allerdings aus.

Übungen[edit]

WS20[edit]

Es gibt zwei Übungsbeispiele, die in 3er Gruppen in Python implementiert werden müssen. Dazu gibt es ein Framework von der LVA-Leitung (mit Jupyter Notebooks), in der die Methoden größtenteils vorgegeben sind und deren Funktionsweise implementiert werden muss. Innerhalb der Jupyter Notebooks gibt es Blöcke, in denen Theoriefragen beantwortet werden müssen. Die Abgabegespräche dauern eine halbe Stunde und finden über Zoom statt. Beim Abgabegespräch wird ein/e Studierende/r zufällig ausgewählt und muss den Code und die Theorie dahinter erklären können. Zusätzlich gibt es vor der Deadline Tutorien für Fragen zur Übung.
UE1: Es gab drei Aufgaben: Image Alignment (4 Punkte), Blob Detection (7 Punkte), Parameter Stiching (14 Punkte).
UE2: Es gab zwei Aufgaben sowie eine Bonusaufgabe: Scene recognition with Bag of Words (7 Punkte), Scene recognition with CNN (8 Punkte), Transfer Learning (5 Bonuspunkte)

Andere Meinung:
Die Übungen wurden dieses Semester zum ersten Mal in Python durchgeführt. Es gab vorbereitete Jupyter Notebooks, in denen die zentralen Teile der gefragten Algorithmen zu ergänzen waren. Zugleich fand die Dokumentation und Beantwortung von Fragen ebenfalls im Notebook statt, wofür die Fragen und Platz für die Antworten bereits vorbereitet waren. So möchte man sich das Übungsmaterial wünschen. ;)

WS13[edit]

Während des Semesters sind zwei Übungen in 3er Gruppen zu absolvieren. Es handelt sich um jeweils 2-3 Beispiele die in Matlab zu programmieren sind. Konkret mussten wir im Wintersemester 2013 Aufgaben zu den Themen Image alignment, Image Segmentation by k-means, Scale-Invariant Blob Detection, Image Stitching und Scene Recognition mit Bag of Words lösen.

Der Programmieraufwand ist dabei sehr gering (1 Tag pro Übung pro Person) aber es wird sehr viel Wert auf die Dokumentation gelegt.

2. Meinung dazu: dass der Programmieraufwand sehr gering ist, kann ich absolut nicht bestätigen. Für MATLAB Gurus trifft das vielleicht zu, aber die Implementierung und mühsame Fehlersuche haben bei uns deutlich mehr Aufwand gebraucht. Dabei haben wir jeweils schon mindestens einen Tag pro Übung und Person für das sorgfältige Ausarbeiten der Doku benötigt.

Beim Abgabegespräch werden alle Gruppenmitglieder zu jedem Thema genau befragt, theoretische Hintergründe müssen wiedergegeben werden. Außerdem liegt dem Assistent beim Abgabegespräch eine Checkliste für die Dokumentation vor, in der genau vermerkt ist welche Punkte dort behandelt sein sollen. Es zahlt sich also aus, in die Dokumentation Parametervergleiche etc. einzubauen, auch wenn dies nicht explizit verlangt ist.

Prüfung, Benotung[edit]

Schriftliche Prüfung, Endnote ergibt sich aus 40% Übungsteil (40 Punkte) + 60% VO Prüfung (60 Punkte). Sowohl auf die Übung als auch auf die Prüfung müssen mindestens 50% der Punkte erreicht werden. Es gibt vier Antritte zur Prüfung, wobei auch zu allen Terminen angetreten werden kann. Die Note ergibt sich dann folgendermaßen:
< 50 Punkte - Nicht Genügend
50-61 Punkte - Genügend
62-74 Punkte - Befriedigend
75-88 Punkte - Gut
> 88 Punkte - Sehr Gut

WS20:
Es gab 10 Fragen, wobei eine eine MC-Frage war. Die Prüfung fand online statt, die Identitätsfeststellung und "Überwachung" wurde via Zoom durchgeführt. Prüfungszeit waren 90 Minuten.

Dauer der Zeugnisausstellung[edit]

Semester Letzte Leistung Zeugnis
2011WS ca 6 Wochen
2013WS 2 Tage
2020WS 12.03.2021 04.05.2021 7,5 Wochen

Zeitaufwand[edit]

Normal. Wenn man die Aufgaben auf 3 aufteilt und für die Prüfung nur den Fragenkatalog lernt, recht geringer Aufwand für eine 4.5 ECTS Veranstaltung.

Unterlagen[edit]

Tipps[edit]

  • Am besten vor der Prüfung auch die Altprüfungen anschauen, da einige Fragen aus den vorherigen Jahren übernommen werden.

Verbesserungsvorschläge / Kritik[edit]

noch offen