TU Wien:Computer Vision VU (Sablatnig)

Aus VoWi
Zur Navigation springen Zur Suche springen
Ähnlich benannte LVAs (Materialien):

Daten[Bearbeiten | Quelltext bearbeiten]

Vortragende Marco PeerRobert Sablatnig
ECTS 4,5
Letzte Abhaltung 2024W
Sprache „bei bedarf in englisch“ ist kein zulässiger Sprachcode.
Mattermost computer-visionRegisterMattermost-Infos
Links tiss:183585, eLearning, Homepage
Zuordnungen
Masterstudium Visual Computing Modul Computer Vision (Pflichtfach)
Masterstudium Media and Human-Centered Computing Modul Computer Vision
Masterstudium Media and Human-Centered Computing Modul Image Processing & Visualization * (Gebundenes Wahlfach)
Masterstudium Medizinische Informatik Modul Biosignal- und Bildverarbeitung (Gebundenes Wahlfach)
Masterstudium Technische Informatik Modul Verbreiterung (Gebundenes Wahlfach)


Inhalt[Bearbeiten | Quelltext bearbeiten]

Überblick über mehrere Bereiche der Computer Vision. Konkret

  • Geschichte und Anwendungen von CV
  • Digitalkamera: Parameter, Mathematisches Modell
  • Filter: Kantenfilter, Eckenfilter
  • Transformationen: DFT, Gabor-wavelets, Haar-Transform
  • Features: SIFT, Bag of Words
  • Algorithmen: RANSAC, k-Means
  • Projektive Geometrie
  • Stereo Vision: Epipolargeometrie, Essential Matrix
  • Korrespondenzanalyse, Multi-View Geometry

Ablauf[Bearbeiten | Quelltext bearbeiten]

Wöchentliche Vorlesung und zwei Python Übungsbeispiele übers Semester.

Benötigte/Empfehlenswerte Vorkenntnisse[Bearbeiten | Quelltext bearbeiten]

Eventuell Computer Vision-Teil aus "Einführung in Visual Computing" aber das wichtigste wird hier wiederholt. Basiswissen zu Python kann für die Übung nicht schaden.

Vortrag[Bearbeiten | Quelltext bearbeiten]

Der Vortrag ist sehr frei, es wird stofflich viel aus EVC Bekanntes wiederholt, vor allem in der ersten Hälfte der Vorlesung. Da die Folien zum Lernen ungeeignet sind, zahlt sich Anwesenheit zum Verständnis des Stoffs allerdings aus.

Übungen[Bearbeiten | Quelltext bearbeiten]

WS20[Bearbeiten | Quelltext bearbeiten]

Es gibt zwei Übungsbeispiele, die in 3er Gruppen in Python implementiert werden müssen. Dazu gibt es ein Framework von der LVA-Leitung (mit Jupyter Notebooks), in der die Methoden größtenteils vorgegeben sind und deren Funktionsweise implementiert werden muss. Innerhalb der Jupyter Notebooks gibt es Blöcke, in denen Theoriefragen beantwortet werden müssen. Die Abgabegespräche dauern eine halbe Stunde und finden über Zoom statt. Beim Abgabegespräch wird ein/e Studierende/r zufällig ausgewählt und muss den Code und die Theorie dahinter erklären können. Zusätzlich gibt es vor der Deadline Tutorien für Fragen zur Übung.
UE1: Es gab drei Aufgaben: Image Alignment (4 Punkte), Blob Detection (7 Punkte), Parameter Stiching (14 Punkte).
UE2: Es gab zwei Aufgaben sowie eine Bonusaufgabe: Scene recognition with Bag of Words (7 Punkte), Scene recognition with CNN (8 Punkte), Transfer Learning (5 Bonuspunkte)

Andere Meinung:
Die Übungen wurden dieses Semester zum ersten Mal in Python durchgeführt. Es gab vorbereitete Jupyter Notebooks, in denen die zentralen Teile der gefragten Algorithmen zu ergänzen waren. Zugleich fand die Dokumentation und Beantwortung von Fragen ebenfalls im Notebook statt, wofür die Fragen und Platz für die Antworten bereits vorbereitet waren. So möchte man sich das Übungsmaterial wünschen. ;)

WS13[Bearbeiten | Quelltext bearbeiten]

Während des Semesters sind zwei Übungen in 3er Gruppen zu absolvieren. Es handelt sich um jeweils 2-3 Beispiele die in Matlab zu programmieren sind. Konkret mussten wir im Wintersemester 2013 Aufgaben zu den Themen Image alignment, Image Segmentation by k-means, Scale-Invariant Blob Detection, Image Stitching und Scene Recognition mit Bag of Words lösen.

Der Programmieraufwand ist dabei sehr gering (1 Tag pro Übung pro Person) aber es wird sehr viel Wert auf die Dokumentation gelegt.

2. Meinung dazu: dass der Programmieraufwand sehr gering ist, kann ich absolut nicht bestätigen. Für MATLAB Gurus trifft das vielleicht zu, aber die Implementierung und mühsame Fehlersuche haben bei uns deutlich mehr Aufwand gebraucht. Dabei haben wir jeweils schon mindestens einen Tag pro Übung und Person für das sorgfältige Ausarbeiten der Doku benötigt.

Beim Abgabegespräch werden alle Gruppenmitglieder zu jedem Thema genau befragt, theoretische Hintergründe müssen wiedergegeben werden. Außerdem liegt dem Assistent beim Abgabegespräch eine Checkliste für die Dokumentation vor, in der genau vermerkt ist welche Punkte dort behandelt sein sollen. Es zahlt sich also aus, in die Dokumentation Parametervergleiche etc. einzubauen, auch wenn dies nicht explizit verlangt ist.

Prüfung, Benotung[Bearbeiten | Quelltext bearbeiten]

Schriftliche Prüfung, Endnote ergibt sich aus 40% Übungsteil (40 Punkte) + 60% VO Prüfung (60 Punkte). Sowohl auf die Übung als auch auf die Prüfung müssen mindestens 50% der Punkte erreicht werden. Es gibt vier Antritte zur Prüfung, wobei auch zu allen Terminen angetreten werden kann. Die Note ergibt sich dann folgendermaßen:
< 50 Punkte - Nicht Genügend
50-61 Punkte - Genügend
62-74 Punkte - Befriedigend
75-88 Punkte - Gut
> 88 Punkte - Sehr Gut

WS20:
Es gab 10 Fragen, wobei eine eine MC-Frage war. Die Prüfung fand online statt, die Identitätsfeststellung und "Überwachung" wurde via Zoom durchgeführt. Prüfungszeit waren 90 Minuten.

Dauer der Zeugnisausstellung[Bearbeiten | Quelltext bearbeiten]

Semester Letzte Leistung Zeugnis
2011WS ca 6 Wochen
2013WS 2 Tage
2020WS 12.03.2021 04.05.2021 7,5 Wochen

Zeitaufwand[Bearbeiten | Quelltext bearbeiten]

Normal. Wenn man die Aufgaben auf 3 aufteilt und für die Prüfung nur den Fragenkatalog lernt, recht geringer Aufwand für eine 4.5 ECTS Veranstaltung.

Unterlagen[Bearbeiten | Quelltext bearbeiten]

Tipps[Bearbeiten | Quelltext bearbeiten]

  • Am besten vor der Prüfung auch die Altprüfungen anschauen, da einige Fragen aus den vorherigen Jahren übernommen werden.

Highlights / Lob[Bearbeiten | Quelltext bearbeiten]

noch offen

Verbesserungsvorschläge / Kritik[Bearbeiten | Quelltext bearbeiten]

noch offen