TU Wien:Digital Preservation UE (Rauber)

Aus VoWi
Wechseln zu: Navigation, Suche

Daten[Bearbeiten]

Inhalt[Bearbeiten]

Praktische Übungen zur zugehörigen VO. Beschäftigung mit verschiedenen Dateiformaten, deren Eignung und eventuelle Maßnahmen zur Langzeitarchivierung.

Ablauf[Bearbeiten]

3 Übungsbeispiele verteilt übers Semester, die entweder alleine oder in Gruppen bis zu 3 Personen gemacht werden können. Man hat jeweils etwa einen Monat Zeit, und kann sie gemütlich zuhause erledigen. Abzugeben dann jeweils ein Bericht (so ca. 5-7 Seiten) sowie die erstellten Profile/Modelle/etc.

Die Datensammlungen, die dabei analysiert wurden, waren im SS2014 nach freier Wahl (eigenes Home Directory, eigene Dokumente). Man kann sich also mit seinen eigenen Dateien beschäftigen und auch persönlich von der Übung profitieren, indem man problematische Formate aufspürt und sich geeignete Präservationsmaßnahmen überlegt bzw. durchführt.

1. Collection Profiling[Bearbeiten]

Die beiden Tools fits und c3po verwenden, um mindestens 5000 Files zu analyisere und ein Collection Profile zu erstellen -- häufigste Mimetypen, Formate, Histogram der Dateigrößen...

2. Preservation Planning[Bearbeiten]

Das insitutseigene Web-Tool plato verwenden, um ein Collection Profile zu importieren (zb von der vorigen Übung) und einen Preservation Plan zu erstellen.

3. Process Preservation[Bearbeiten]

Zweiteiliges Beispiel, das nur lose mit den bisherigen Beispielen zu tun hat. Dabei soll man sich einen Workflow überlegen, der etwa ein Experiment durchführt oder eine Business Aktivität darstellt. Er soll mindestens einen externen Service, eine IO-Operation sowie ein Script beinhalten.

Der Workflow soll dann einmal in Taverna Workbench modelliert werden, einmal in der Archimate modelling language. Nach einer Zwischenabgabe soll ein institutseigenes Tool verwendet werden, um einen Taverna Workflow in Archimate automatisch abzubilden, und das Ergebnis mit dem manuell erstellten Modell verglichen werden.

Benötigte/Empfehlenswerte Vorkenntnisse[Bearbeiten]

Keine

Vortrag[Bearbeiten]

Gibt es als eigenständige Lehrveranstaltung, siehe TU Wien:Digital Preservation VO (Rauber).

Früherer oder paralleler Besuch der Vorlesung ist empfehlenswert.

Prüfung, Benotung[Bearbeiten]

Kurzes Abgabegespräch bzw. Präsentation für jedes Beispiel.

Dauer der Zeugnisausstellung[Bearbeiten]

SS2014: Letztes Abgabegespräch am 24.06., Zeugnis erhalten am 01.08. (ca. 5 Wochen)

Zeitaufwand[Bearbeiten]

Nicht überragend, sollte aber auch nicht unterschätzt werden.

Da man die jeweiligen Tools suchen, zum laufen bringen und sich etwas einarbeiten sollte, würde ich so 12 Stunden pro Beispiel als ziemliches Minimum sehen, mein Aufwand war eher bei 24-30 Stunden für eine recht ordentliche Abgabe.

Unterlagen[Bearbeiten]

Verwendete Tools[Bearbeiten]

Tipps[Bearbeiten]

  • Sich die analysierenden Files etwas überlegen. IMHO werden die interessantesten Ergebnisse mit klassischen Dokumenten erzielt (LibreOffice, MS Office, Fotos), mit Codefiles oder etwa git-Repos können die Tools nicht umgehen bzw. keine sinnvollen Profile extrahieren.
  • Die Tools laufen zwar auf allen Platformen, es ist (je nach System) aber etwas Aufwand, sie zum laufen zu bringen und die Funktionsweise (bzw. Einschränkungen) zu verstehen, sowie die Elemente der beiden Modelling Sprachen. Ich würde das also nicht auf knapp vor den Abgabetermin verschieben.

Verbesserungsvorschläge / Kritik[Bearbeiten]

  • Inhaltlich ist die Übung okay, der eigentliche Ablauf ist gut organisiert, die LVA-Leitung macht isch aber schwer erreichbar.
  • Feedback auf die Abgaben gabs prinzipiell keines bis zur Zeugnisausstellung, und auf Fragen beim Abgabegespräch wurde nur ungenau mit "das passt in etwa, genaueres wissen wir noch nicht" geantwortet.
  • Organisatorische Anfragen (vorallem "wann folgt endlich die Bewertung?") wurden im TUWEL-Forum monatelang nicht beantwortet. Auch nicht, wenn sich bereits 4 weitere Studenten der Frage angeschlossen hatten.
  • Ich kann mich dem ersten Kommentar nicht zur Gänze anschließen: Die Organisation ist schrecklich. Im TUWEL wird wochenlang (tlw. monatelang) nicht geantwortet. Die Übungen werden tlw. so spät korrigiert, dass weitere Übungsfristen aufgeschoben werden müssen (da diese voneinander abhängen). Die Übungen an sich erscheinen (!) interessant, jedoch haben die Tools, welche verpflichtend eingesetzt werden müssen (da tlw. von der LVA Leitung entwickelt) einige Probleme: Sie funktionieren nahezu überhaupt nicht, sind komplett undokumentiert, oder man braucht 3 (Hausnummer) verschiedene Versionen um einen simplen Vorgang auszuführen (zB C3PO, welches manche Features nur im WebInterface absturzfrei ausführt und andere Features wiederum nur über die shell -> ansonsten werden zahlreiche Exceptions geworfen).