TU Wien:Web Data Extraction and Integration VU (Baumgartner)
Daten[Bearbeiten | Quelltext bearbeiten]
Vortragende | Robert Baumgartner, Alexander Fischl |
---|---|
ECTS | 3 |
Links | Homepage |
Bachelorstudium Data Engineering & Statistics | |
Bachelorstudium Software & Information Engineering | |
E066933 | |
Masterstudium Software Engineering & Internet Computing |
Inhalt[Bearbeiten | Quelltext bearbeiten]
Gemäß TUWIS und LVA-Webseite:
- Information Extraction: Setting, History, IE vs. IR
- Structured Data Extraction and Wrapping
- XML Transformation and Query Languages
- Web Wrapper Languages
- Wrapper Generation Tools
- Web Wrappers for Mashups, SOA and BI
- Inductive Wrapper Generation
- Automatic Data Extraction / Web Data Mining
- Supervised Wrapper Generation
- Deep Web Navigation Approaches
- Data Extraction from PDF documents
- Mediation and Integration Approaches
- Web Data Cleaning
- Lixto Visual Wrapper and Transformation Server
Ablauf[Bearbeiten | Quelltext bearbeiten]
Es gibt eine ca. wöchentliche, einstündige Vorlesung. Daneben gibt es Übungsbeispiele, die teilweise in Einzelarbeit, teilweise in Gruppen (4-5 Personen) ausgearbeitet werden. Als Abschluss der Übung ist in der Gruppe ein bestimmtes Thema auszuarbeiten und anschließend zu präsentieren.
Benötigte/Empfehlenswerte Vorkenntnisse[Bearbeiten | Quelltext bearbeiten]
- Programmierkenntnisse
- XML, XPath, XSLT (Semistrukturierte Daten)
Vortrag[Bearbeiten | Quelltext bearbeiten]
Interessant und kurzweilig. Da die Vorlesungseinheiten nur jeweils 60 Minuten dauern, verliert man kaum das Interesse.
Übungen[Bearbeiten | Quelltext bearbeiten]
Alle ein bis zwei Wochen gibt es Übungsbeispiele, die in Einzelarbeit (am Anfang) oder in Gruppenarbeit (die späteren Beispiele) auszuarbeiten und in den Übungseinheiten zu präsentieren sind. Nach einigen Beispielen zu XSLT geht es meistens darum, Informationen aus Webseiten zu extrahieren und aufzubereiten.
Am Ende der Übung ist in der Gruppe ein Thema schriftlich auszuarbeiten (ca. 2 Seiten pro Gruppenmitglied) und zu präsentieren.
Prüfung, Benotung[Bearbeiten | Quelltext bearbeiten]
Es gibt keine abschließende Prüfung, die Beurteilung erfolgt anhand der Übungbeispiele, der Seminararbeit und der abschließenden Präsentation.
Dauer der Zeugnisaustellung[Bearbeiten | Quelltext bearbeiten]
- Abgabe der schriftlichen Arbeit und Präsentation des Themas am 30.1.2009, bis dato weder Beurteilung noch Ergebnisse.
- Paper deadline: 31.1.2014, Zeugnis am 14.2.2014 (2 Wochen)
Zeitaufwand[Bearbeiten | Quelltext bearbeiten]
Hält sich in Grenzen. Die einzelnen Übungsbeispiele sind recht rasch gelöst (jeweil nicht mehr als ein Nachmittag), die Seminararbeit nimmt naturgemäß etwas mehr Zeit in Anspruch.
Unterlagen[Bearbeiten | Quelltext bearbeiten]
- Vorlesungsfolien
- Materialien
Verbesserungsvorschläge / Kritik[Bearbeiten | Quelltext bearbeiten]
noch offen