MU Wien:Korpusbasierte Sprachverarbeitung VU (Krenn)

Aus VoWi
Wechseln zu: Navigation, Suche

Daten[Bearbeiten]

|Wahlmodul Unbekannt oder "Prä-Modul-Ära" - EDIT ME |-

Inhalt[Bearbeiten]

In der Lehrveranstaltung werden verschiedene Teilbereiche der statistischen NLP vorgestellt, u.a. Methoden, Techniken und Werkzeuge, die es ermöglichen, aus den annotierten Korpora strukturelle wie auch lexikalische Informationen automatisch zu extrahieren und die gelernte Information wiederum in der maschinellen Verarbeitung einzusetzen. Des weiteren werden Beispiele für einzelne Anwendungen besprochen.

Ablauf[Bearbeiten]

Es herrscht keine Anwesenheitspflicht. 4 Übungsblätter sind zu lösen und Frau Prof. Krenn via e-mail oder ausgedruckt abzugeben. Diese berechtigen zum Prüfungsantritt. Besonders gelungene Übungen können dabei die Prüfungsnote verbessern.

Benötigt/Empfehlenswerte Vorkenntnisse[Bearbeiten]

Keine.

Vortrag[Bearbeiten]

Frau Prof. Krenn trägt ganz gut vor. Sie erzählt, wie computerlinguistische Problemstellungen in der Praxis behandelt werden.

Übungen[Bearbeiten]

Die Übungen sind nicht besonders schwer. Ein kleiner Teil davon ist auf Papier zu lösen, die meisten aber unter UNIX. Dennoch werden keine UNIX-Kenntnisse benötigt, denn die erste Übung ist zugleich eine Einführung in die wichtigsten Befehle, die man für die Übung braucht.

Prüfung[Bearbeiten]

Die Prüfung ist sehr einfach, im Grunde genommen kommen genau die Fragen, die Frau Prof. Krenn in der Vorbereitungsstunde eine Woche zuvor nennt (und jene, die auf ihrer HP als Beispiele stehen). Viel mehr kommt nicht.

Literatur[Bearbeiten]

Das Standardwerk der statistischen Sprachverarbeitung:

Christopher D. Manning and Hinrich Schütze: Foundations of Statistical Natural Language Processing.

MIT Press, Cambridge, MA. 1999.

Zeitaufwand[Bearbeiten]

Ist man in UNIX nicht ganz sattelfest, kann man pro Übungsblatt ruhig einen Tag einplanen, vielleicht etwas weniger. Zum Lernen für die Prüfung reichen 1-2 Tage.

hilfreiche Links[Bearbeiten]

Eine Ausarbeitung der Prüfungsfragen wurde bereits ans MTB-Projekt geschickt und steht bereits online:

Wo gibts Mitschriften, Skripten, Folien...[Bearbeiten]

Folien gibt es auf der LVA-HP

Tipps[Bearbeiten]

  • Habt ihr kein UNIX-System installiert, könnt ihr, wenn ihr euch einen Studentenaccount am IMKAI anlegt, mittels SSH auf deren System zugreifen und so die Übung auf deren Rechner von zuhause aus lösen. So braucht ihr auch nicht die Programme installieren, die für die Übungen benötigt werden - auf den IMKAI-Rechnern ist alles bereits installiert. Einziges Problem: Die .div files lassen sich so nicht öffnen. Diese muss man eben auf den Heimrechner kopieren.