TU Wien:Web Data Extraction and Integration VU (Baumgartner)

Aus VoWi
Zur Navigation springen Zur Suche springen
Diese LVA wird nicht mehr von dieser Person angeboten, ist ausgelaufen, oder läuft aus und befindet sich daher nur noch zu historischen Zwecken im VoWi.

Daten[Bearbeiten | Quelltext bearbeiten]

Diese LVA wird nicht mehr von dieser Person angeboten, ist ausgelaufen, oder läuft aus und befindet sich daher nur noch zu historischen Zwecken im VoWi.
Vortragende Robert Baumgartner, Alexander Fischl
ECTS 3
Links Homepage
Zuordnungen
Bachelorstudium Data Engineering & Statistics
Bachelorstudium Software & Information Engineering
E066933
Masterstudium Software Engineering & Internet Computing


Inhalt[Bearbeiten | Quelltext bearbeiten]

Gemäß TUWIS und LVA-Webseite:

  • Information Extraction: Setting, History, IE vs. IR
  • Structured Data Extraction and Wrapping
  • XML Transformation and Query Languages
  • Web Wrapper Languages
  • Wrapper Generation Tools
  • Web Wrappers for Mashups, SOA and BI
  • Inductive Wrapper Generation
  • Automatic Data Extraction / Web Data Mining
  • Supervised Wrapper Generation
  • Deep Web Navigation Approaches
  • Data Extraction from PDF documents
  • Mediation and Integration Approaches
  • Web Data Cleaning
  • Lixto Visual Wrapper and Transformation Server

Ablauf[Bearbeiten | Quelltext bearbeiten]

Es gibt eine ca. wöchentliche, einstündige Vorlesung. Daneben gibt es Übungsbeispiele, die teilweise in Einzelarbeit, teilweise in Gruppen (4-5 Personen) ausgearbeitet werden. Als Abschluss der Übung ist in der Gruppe ein bestimmtes Thema auszuarbeiten und anschließend zu präsentieren.

Benötigte/Empfehlenswerte Vorkenntnisse[Bearbeiten | Quelltext bearbeiten]

Vortrag[Bearbeiten | Quelltext bearbeiten]

Interessant und kurzweilig. Da die Vorlesungseinheiten nur jeweils 60 Minuten dauern, verliert man kaum das Interesse.

Übungen[Bearbeiten | Quelltext bearbeiten]

Alle ein bis zwei Wochen gibt es Übungsbeispiele, die in Einzelarbeit (am Anfang) oder in Gruppenarbeit (die späteren Beispiele) auszuarbeiten und in den Übungseinheiten zu präsentieren sind. Nach einigen Beispielen zu XSLT geht es meistens darum, Informationen aus Webseiten zu extrahieren und aufzubereiten.

Am Ende der Übung ist in der Gruppe ein Thema schriftlich auszuarbeiten (ca. 2 Seiten pro Gruppenmitglied) und zu präsentieren.

Prüfung, Benotung[Bearbeiten | Quelltext bearbeiten]

Es gibt keine abschließende Prüfung, die Beurteilung erfolgt anhand der Übungbeispiele, der Seminararbeit und der abschließenden Präsentation.

Dauer der Zeugnisaustellung[Bearbeiten | Quelltext bearbeiten]

  • Abgabe der schriftlichen Arbeit und Präsentation des Themas am 30.1.2009, bis dato weder Beurteilung noch Ergebnisse.
  • Paper deadline: 31.1.2014, Zeugnis am 14.2.2014 (2 Wochen)

Zeitaufwand[Bearbeiten | Quelltext bearbeiten]

Hält sich in Grenzen. Die einzelnen Übungsbeispiele sind recht rasch gelöst (jeweil nicht mehr als ein Nachmittag), die Seminararbeit nimmt naturgemäß etwas mehr Zeit in Anspruch.

Unterlagen[Bearbeiten | Quelltext bearbeiten]

Verbesserungsvorschläge / Kritik[Bearbeiten | Quelltext bearbeiten]

noch offen

Materialien

Diese Seite hat noch keine Anhänge, du kannst aber neue hinzufügen.