TU Wien:Web Data Extraction and Integration VU (Baumgartner)

From VoWi
Jump to navigation Jump to search
Diese LVA wird nicht mehr von dieser Person angeboten, ist ausgelaufen, oder läuft aus und befindet sich daher nur noch zu historischen Zwecken im VoWi.

Daten[edit | edit source]

Lecturers Robert Baumgartner, Alexander Fischl
ECTS 3
Department Forschungsbereich Databases and Artificial Intelligence
Links Homepage
Zuordnungen
E033531 Wahlmodul Unbekannt oder "Prä-Modul-Ära" - EDIT ME
Bachelor Software & Information Engineering Wahlmodul Unbekannt oder "Prä-Modul-Ära" - EDIT ME
Master Information & Knowledge Management Wahlmodul Unbekannt oder "Prä-Modul-Ära" - EDIT ME
Master Software Engineering & Internet Computing Wahlmodul Unbekannt oder "Prä-Modul-Ära" - EDIT ME


Inhalt[edit | edit source]

Gemäß TUWIS und LVA-Webseite:

  • Information Extraction: Setting, History, IE vs. IR
  • Structured Data Extraction and Wrapping
  • XML Transformation and Query Languages
  • Web Wrapper Languages
  • Wrapper Generation Tools
  • Web Wrappers for Mashups, SOA and BI
  • Inductive Wrapper Generation
  • Automatic Data Extraction / Web Data Mining
  • Supervised Wrapper Generation
  • Deep Web Navigation Approaches
  • Data Extraction from PDF documents
  • Mediation and Integration Approaches
  • Web Data Cleaning
  • Lixto Visual Wrapper and Transformation Server

Ablauf[edit | edit source]

Es gibt eine ca. wöchentliche, einstündige Vorlesung. Daneben gibt es Übungsbeispiele, die teilweise in Einzelarbeit, teilweise in Gruppen (4-5 Personen) ausgearbeitet werden. Als Abschluss der Übung ist in der Gruppe ein bestimmtes Thema auszuarbeiten und anschließend zu präsentieren.

Benötigte/Empfehlenswerte Vorkenntnisse[edit | edit source]

Vortrag[edit | edit source]

Interessant und kurzweilig. Da die Vorlesungseinheiten nur jeweils 60 Minuten dauern, verliert man kaum das Interesse.

Übungen[edit | edit source]

Alle ein bis zwei Wochen gibt es Übungsbeispiele, die in Einzelarbeit (am Anfang) oder in Gruppenarbeit (die späteren Beispiele) auszuarbeiten und in den Übungseinheiten zu präsentieren sind. Nach einigen Beispielen zu XSLT geht es meistens darum, Informationen aus Webseiten zu extrahieren und aufzubereiten.

Am Ende der Übung ist in der Gruppe ein Thema schriftlich auszuarbeiten (ca. 2 Seiten pro Gruppenmitglied) und zu präsentieren.

Prüfung, Benotung[edit | edit source]

Es gibt keine abschließende Prüfung, die Beurteilung erfolgt anhand der Übungbeispiele, der Seminararbeit und der abschließenden Präsentation.

Dauer der Zeugnisaustellung[edit | edit source]

  • Abgabe der schriftlichen Arbeit und Präsentation des Themas am 30.1.2009, bis dato weder Beurteilung noch Ergebnisse.
  • Paper deadline: 31.1.2014, Zeugnis am 14.2.2014 (2 Wochen)

Zeitaufwand[edit | edit source]

Hält sich in Grenzen. Die einzelnen Übungsbeispiele sind recht rasch gelöst (jeweil nicht mehr als ein Nachmittag), die Seminararbeit nimmt naturgemäß etwas mehr Zeit in Anspruch.

Unterlagen[edit | edit source]

Verbesserungsvorschläge / Kritik[edit | edit source]

noch offen

Attachments

This page has no attachments yet but you can add some.