TU Wien:Grundlagen des Information Retrieval VU (Rauber)

From VoWi
Jump to navigation Jump to search

Daten[edit]

Lecturers Andreas Rauber, Allan Hanbury, Sebastian Hofstätter
ECTS 3
Department Information Systems Engineering
When winter semester
Abbreviation GIR
Links tiss:188977
Zuordnungen
Bachelor Wirtschaftsinformatik Wahlmodul SPF/INT - Schwerpunkt Informationstechnologie
Master Visual Computing Wahlmodul Media Understanding
Master Media and Human-Centered Computing Wahlmodul Media Understanding
Master Medizinische Informatik Wahlmodul Informationsverarbeitung
Master Software Engineering & Internet Computing Wahlmodul Informationssysteme

Mattermost: Channel "grundlagen-des-information-retrieval"Team invite & account creation linkMattermost-Infos

Inhalt[edit]

  • Textretrieval (Indizierung, Retrieval-Modelle, Web-Suche)
  • Music-Retrieval (Merkmalsextraktion, Anwendungen von MR)

Ablauf[edit]

Es gibt etwa 7 Block-Vorlesungen zu je 2 Stunden bis Anfang Dezember. Parallel dazu gibt es 2 Übungsbeispiele, die in Gruppen zu zweit gelöst werden.

Benötigte/Empfehlenswerte Vorkenntnisse[edit]

Keine besonderen, abgesehen von allgemeinen Programmierkenntnissen.

Vortrag[edit]

  • Vorträge waren eher uninteressiert und uninteressant vorgetragen. Man ist nachher deswegen ohnehin auf Eigenstudium angewiesen. Bei den Voträgen wurde teilweise bei sehr trivialen Themen schmerzhaft und lange ins Detail gegangen während dann aber gleichzeitig die relevanten schweren Themen nur überflogen wurden und nicht ausreichend erklärt wurden.
  • Gut waren hier einzig die Music Retrieval - Vorträge.

WS2019:

  • Vorträge waren nicht so uninteressant wie beschrieben, sind auch sehr in die Richtung wie Implementiert man die Features korrekt, was sind häufige Fehlerstellen gegangen.
  • Musik IR ist sehr in den Hintergrund gewichen, es gibt nur eine Vorlesung zusammen mit Video IR wo das Thema vorgestellt wird und kurz auf die klein gehaltenen Übung eingegangen wird.

Übungen[edit]

WS2019:

  • Zweiteilige Übung, 50 Punkte für Ex1, 10 Punkte für Ex2, Prüfung 40 Punkte
  • Ex1: Ein Datenset von Wikipedia (2.2GB) indizieren und interaktiv querien. Zusätzlich noch eine standardisierte Evaluation drüber laufen zu lassen.
  • Code Repository auf GitHub Classrooms wird zur Verfügung gestellt und als Abgabe genutzt.
  • Indexer und co musste alles selbst geschrieben werden, Programmiersprache war frei zu wählen, Ausnahme ist Python (laut VO Leitung zu langsam). Man wurde ermutigt eine neue Sprache zu probieren, wir haben Rust getestet und war auch kein Problem.
  • Es wird vor allem Wert auf andauerndes Benchmarken und Profiling Wert gelegt. Dadurch findet man recht gut Schwachstellen wo man nachbessern kann und kann Bonuspunkte einheimsen ;)
  • VO ging in 1, 2 Vorlesungen auf Implementierungsdetails ein, die sehr wertvoll beim eigentlichen Programmieren waren.
  • Benotung der Übung war sehr nett, für geforderte Grundfeatures gab es bis zu 100%. Falls das Programm in annehmbarer Zeit das ganze Set indizieren kann gabs Bonuspunkte. Auch für andere Features gabs weitere Bonuspunkte (e.g. Anzeigen des Textes mit Highlighting des gesuchten Begriffes usw.). Abgabegespräch war sehr casual und freundlich, mir kam es so vor als würde drauf wert gelegt Spaß zu haben und einfach rumzuspielen.
  • Ex2: Musik IR

Prüfung, Benotung[edit]

Prüfung WS2019: Fragen waren sehr entgegenkommend, wenn man die Übung sauber gemacht hat und einmal über die Folien drüber liest reicht das vollkommen. Viel mehr Fokus auf den Übungsteil als auf die Prüfung.

Zeitaufwand[edit]

WS 2019: Recht exakt dem ECTS-Breakdown entsprechend (50 Stunden für die Beispiele, ca. 2 Tage Testvorbereitung).

Unterlagen[edit]

Tipps[edit]

  • Wie bei jeder Gruppenarbeit: Arbeitet wenn möglich mit jemandem zusammen, den ihr kennt und der verlässlich ist.
  • Die LVA besteht eigentlich großteils (Bewertung und Aufwand) aus dem ersten Projekt, bei dem es auch Bonuspunkte gibt. Für den Test muss man nicht viel lernen.
  • In die Vorlesung zu Music Retrieval gehen: Gerade bei diesem Thema ist lernen nach den Folien eher mühsam (kam im WS 2019/20 allerdings gar nicht zum Test).
  • Wie immer, nicht zu spät anfangen für die eigentliche Übung (Ex1) haut richtig rein wenn man sich viel vornimmt.

Verbesserungsvorschläge / Kritik[edit]

noch offen