MU Wien:Korpusbasierte Sprachverarbeitung VU (Krenn)
Daten[Bearbeiten | Quelltext bearbeiten]
- VortragendeR/LVA-LeiterIn: Brigitte Krenn
- Semesterwochenstunden: 2
- HP der LVA: http://www.ai.univie.ac.at/imkai/lv/current/509.233.html
- Institut: Institut für medizinische Kybernetik und Artificial Intelligence
- Vorlage:934-W
Inhalt[Bearbeiten | Quelltext bearbeiten]
In der Lehrveranstaltung werden verschiedene Teilbereiche der statistischen NLP vorgestellt, u.a. Methoden, Techniken und Werkzeuge, die es ermöglichen, aus den annotierten Korpora strukturelle wie auch lexikalische Informationen automatisch zu extrahieren und die gelernte Information wiederum in der maschinellen Verarbeitung einzusetzen. Des weiteren werden Beispiele für einzelne Anwendungen besprochen.
Ablauf[Bearbeiten | Quelltext bearbeiten]
Es herrscht keine Anwesenheitspflicht. 4 Übungsblätter sind zu lösen und Frau Prof. Krenn via e-mail oder ausgedruckt abzugeben. Diese berechtigen zum Prüfungsantritt. Besonders gelungene Übungen können dabei die Prüfungsnote verbessern.
Benötigt/Empfehlenswerte Vorkenntnisse[Bearbeiten | Quelltext bearbeiten]
Keine.
Vortrag[Bearbeiten | Quelltext bearbeiten]
Frau Prof. Krenn trägt ganz gut vor. Sie erzählt, wie computerlinguistische Problemstellungen in der Praxis behandelt werden.
Übungen[Bearbeiten | Quelltext bearbeiten]
Die Übungen sind nicht besonders schwer. Ein kleiner Teil davon ist auf Papier zu lösen, die meisten aber unter UNIX. Dennoch werden keine UNIX-Kenntnisse benötigt, denn die erste Übung ist zugleich eine Einführung in die wichtigsten Befehle, die man für die Übung braucht.
Prüfung[Bearbeiten | Quelltext bearbeiten]
Die Prüfung ist sehr einfach, im Grunde genommen kommen genau die Fragen, die Frau Prof. Krenn in der Vorbereitungsstunde eine Woche zuvor nennt (und jene, die auf ihrer HP als Beispiele stehen). Viel mehr kommt nicht.
Literatur[Bearbeiten | Quelltext bearbeiten]
Das Standardwerk der statistischen Sprachverarbeitung:
Christopher D. Manning and Hinrich Schütze: Foundations of Statistical Natural Language Processing.
MIT Press, Cambridge, MA. 1999.
Zeitaufwand[Bearbeiten | Quelltext bearbeiten]
Ist man in UNIX nicht ganz sattelfest, kann man pro Übungsblatt ruhig einen Tag einplanen, vielleicht etwas weniger. Zum Lernen für die Prüfung reichen 1-2 Tage.
hilfreiche Links[Bearbeiten | Quelltext bearbeiten]
Eine Ausarbeitung der Prüfungsfragen wurde bereits ans MTB-Projekt geschickt und steht bereits online:
Wo gibts Mitschriften, Skripten, Folien...[Bearbeiten | Quelltext bearbeiten]
Folien gibt es auf der LVA-HP
Tipps[Bearbeiten | Quelltext bearbeiten]
- Habt ihr kein UNIX-System installiert, könnt ihr, wenn ihr euch einen Studentenaccount am IMKAI anlegt, mittels SSH auf deren System zugreifen und so die Übung auf deren Rechner von zuhause aus lösen. So braucht ihr auch nicht die Programme installieren, die für die Übungen benötigt werden - auf den IMKAI-Rechnern ist alles bereits installiert. Einziges Problem: Die .div files lassen sich so nicht öffnen. Diese muss man eben auf den Heimrechner kopieren.