TU Wien:Document Analysis VU (Sablatnig)

Aus VoWi
Zur Navigation springen Zur Suche springen

Daten[Bearbeiten | Quelltext bearbeiten]

Vortragende Florian KleberMarco PeerRobert Sablatnig
ECTS 3,0
Letzte Abhaltung 2024S
Sprache „bei bedarf in englisch“ ist kein zulässiger Sprachcode.
Mattermost document-analysisRegisterMattermost-Infos
Links tiss:183628, tiss:183.628 , Homepage
Zuordnungen
Masterstudium Data Science Modul VAST/EX - Visual Analytics and Semantic Technologies - Extension (Gebundenes Wahlfach)
Masterstudium Visual Computing Modul Applications of Computer Vision (Gebundenes Wahlfach)


Inhalt[Bearbeiten | Quelltext bearbeiten]

Je eine Vorlesung zu

  • Image Acquisition
  • Document Preprocessing
  • OCR & NLP
  • Layout Analysis und Handwritten Text Recognition
  • Writer Retrieval

Ablauf[Bearbeiten | Quelltext bearbeiten]

SS21[Bearbeiten | Quelltext bearbeiten]

Von Anfang April bis Mitte Mai gab es zirka wöchentlich eine Vorlesung zu einem der Themen. Zustätzlich waren zwei Übungen zu den Themen Layout Analysis & OCR sowie Natural Language Processing (NLP) abzugeben, die nach der Abgabe in einer Präsentation vorzustellen sind. Am Ende gibt es eine mündliche Prüfung.

Benötigte/Empfehlenswerte Vorkenntnisse[Bearbeiten | Quelltext bearbeiten]

Es werden zwar einige Themen wiederholt, dennoch kann es nicht schaden, vorher bereits Computer Vision abgeschlossen zu haben.

Vortrag[Bearbeiten | Quelltext bearbeiten]

SS21[Bearbeiten | Quelltext bearbeiten]

Die Vorlesungen werden von unterschiedlichen Personen gehalten, dementsprechend sind auch die Stile unterschiedlich. Durch die geringe Teilnehmerzahl waren die Vorlesungen jedoch allgemein sehr entspannt und auf Fragen wurde sofort eingegangen.

Übungen[Bearbeiten | Quelltext bearbeiten]

SS21[Bearbeiten | Quelltext bearbeiten]

1. Übung: In der ersten Übung sollten Bilder von Comics analysiert und Sprechblasen sowie Textzeilen extrahiert werden. Dabei wird den Studierenden freie Wahl bezüglich der Vorgangsweise gelassen. Die Sprechblasen sollen mit dem Jaccard Index, die Textzeilen mit der Character Error Rate und der Word Error Rate evaluiert werden.
2. Übung: In der zweiten Übung soll Spacy (spacy.io) angewendet werden, um Natural Language Processing auf Text anzuwenden. Dazu sollen Word Vectors erstellt und t-SNE verwendet werden und ähnliche Wörter gefunden bzw. evaluiert werden. Hier werden viele Freiheiten bezüglich der Vorgehensweise gelassen.

Prüfung, Benotung[Bearbeiten | Quelltext bearbeiten]

Benotet wird anhand der abgegebenen Ausarbeitungen der Übung sowie der Prüfung. Die Prüfung findet mündlich statt und dauert zirka 20 Minuten.

Dauer der Zeugnisausstellung[Bearbeiten | Quelltext bearbeiten]

Semester Letzte Leistung Zeugnis
SS21 02.07.2021 02.07.2021 6 Stunden

Zeitaufwand[Bearbeiten | Quelltext bearbeiten]

noch offen

Unterlagen[Bearbeiten | Quelltext bearbeiten]

Die Vorlesungsfolien werden in Tuwel zur Verfügung gestellt.

Tipps[Bearbeiten | Quelltext bearbeiten]

  • Fangt mit den Übungen früh genug an, sodass auch Zeit für ein wenig Experimentieren mit den Methoden bleibt.

Highlights / Lob[Bearbeiten | Quelltext bearbeiten]

noch offen

Verbesserungsvorschläge / Kritik[Bearbeiten | Quelltext bearbeiten]

noch offen