Skip to the content.

Nutzung von eScriptorium

Die Anleitung basiert auf dem Blogbeitrag von Lectaurep: https://lectaurep.hypotheses.org/documentation/escriptorium-tutorial-en

Eine ausführlichere und aktualisierte Dokumentation zu eScriptorium in englischer Sprache finden Sie unter: https://escriptorium.readthedocs.io/

1. Schritt für Schritt

1.1. Einloggen in eScriptorium

Sie loggen sich bei eScriptorium mit einem individuellen Konto ein, das aus einem Login, einem Passwort und einer E-Mail-Adresse besteht. Ein Konto wird vom Benutzer nach Erhalt einer Einladung oder vom Administrator der Website erstellt:

grafik

Sobald Sie eingeloggt sind, sehen Sie das Dashboard, welches Ihnen alle Dokumente, die Sie selbst erstellt haben und die mit ihnen geteilt wurden, anzeigt. Beim ersten Login ist das Dashboard leer.

grafik

1.2. Ein neues Projekt anlegen

1.2.1. Terminologie

1.2.2. Instruktionen

Um ein neues Projekt zu erstellen, klicken Sie auf den Button „Erzeuge neues Projekt“, dadurch öffnet sich eine neue Seite auf der Sie den Namen des Projektes angeben müssen. Anschließend erscheint Ihr neues Projekt in Ihrem Dashboard.

grafik

1.3. Ein neues Dokument anlegen

1.3.1. Terminologie

1.3.2.Instruktionen

Um ein Dokument zu erstellen, klicken Sie innerhalb eines Projektes auf den Button „Neues Dokument anlegen“, dadurch öffnet sich eine neue Seite sowie ein Eingabeformular:

grafik

Das Feld „Name“ muss ausgefüllt werden. Alle anderen Felder sind optional und können später ergänzt werden.

Nach der Eingabe der Informationen, klicken Sie auf „Erzeugen“, um das Dokument zu erstellen. Anschließend wird die Meldung „Document created successfully!“ angezeigt. Die eingegebenen Daten können später immer noch angepasst werden: der „Erzeugen“-Button wird durch einen „Aktualisieren“-Button ersetzt.

grafik

Um vom Dashboard wieder auf das Eingabeformular bzw. das zuletzt bearbeitete Element zu kommen, müssen Sie auf das „Edit“-Icon klicken, welches sich neben dem Dokument befindet oder auf den Namen.

1.4. Bilder hochladen

1.4.1. Zugriff auf das Interface

Unter der Schnittstelle „Bilder“ werden alle Anwendungen hinsichtlich der automatischen Bildverarbeitung sowie der Importe und Exporte verwaltet. Um auf diese Schnittstelle zuzugreifen, klicken Sie innerhalb eines Dokumentes einfach auf den Tab „Bilder“.

grafik

Es gibt mehrere Möglichkeiten Bilder auf die Plattform hochzuladen, die im Folgenden erläutert werden.

1.4.2. Lokale Dateien importieren

Die Bilder können einfach per „Drag and Drop“ hochgeladen werden oder durch Auswählen der Bilder im File Explorer, mittels eines Klicks in die Box.

grafik

Hinweis: Bevor die Seite neugeladen werden kann, muss der Import aller Bilder abgeschlossen sein. eScriptorium bietet momentan keine Möglichkeit Bilder automatisch zu sortieren, daher sollte beim Upload darauf geachtet werden, alle Bilder in der richtigen Reihenfolge auszuwählen sowie auf eine entsprechende Benennung zu achten ansonsten müssen die Bilder händisch sortiert werden.

1.4.3. Bilder aus einer PDF Datei importieren

Klicken Sie auf den „Import“-Button und dann auf „Images (PDF)“ nun können sie eine PDF-Datei hochladen. Aus dieser werden automatisch Bilder extrahiert. Bitte beachten Sie, dass ausschließlich Bilder importiert werden. Sollte das PDF eine Textebene enthalten entsprechend der Transkription, wird diese nicht importiert.

1.4.4. Verwendung eines IIIF-Manifests

Klicken Sie auf den „Import“-Button, dann auf die Option „Images (IIIF)“und geben anschließend die URL des IIIF-Manifests ein. Alle Bilder werden lokal kopiert, so wie auch deren Metadaten (falls vorhanden), welche im Tab „Beschreibung“ sichtbar sind. Beispiel-Link: https://gallica.bnf.fr/iiif/ark:/12148/btv1b53026595r/manifest.json

1.5. Dokumente manuell mit Annotationen versehen

1.5.1. Zugriff auf das Interface

Manuelle Annotationen sind nötig, um Ground-Truth-Daten zu generieren und damit Modelle zu trainieren oder um Ergebnisse dieser Operationen zu korrigieren. Es kann auch als Teil einer Annotation Campaign (gemeinsames Bearbeiten eines Dokumentes innerhalb einer Gruppe) verwendet werden, die nicht auf Kraken-Modelle zurückgreift (eScriptorium ist nur eine Input-Umgebung).

Unter dem Tab „Bearbeiten“ können Sie Annotationen manuell erstellen und modifizieren. Diesen Button finden Sie am Seitenanfang sowie auf jedem einzelnen Bild in der Übersicht des Tabs „Bilder“. Es gibt mehrere Bearbeitungsbereiche in diesem Tab passend zu den möglichen Editierungsoptionen (v.l.n.r.).

grafik

1.5.2. Segmente und Bereiche auf dem Bild mit Annotationen versehen

Im Segmentbearbeitungsfenster können Sie mehrere wesentliche Operationen durchführen:

Baselines:

Masken:

Textbereiche:
In diesem Fenster können Bereiche (oder Zonen) erstellt werden und Segmente/Zeilen mit diesen verbunden werden. Ein Segment, das sich innerhalb eines Bereichs befindet, ist daher nicht automatisch mit diesem verbunden.

Zusätzliche Hinweise:
Sie können jederzeit mit Strg + Z (Rückgängig machen) und Strg + Y (Wiederherstellen) Aktionen rückgängig machen bzw. wiederherstellen oder mit den entsprechenden Schaltflächen durch Ihren Änderungsverlauf gehen.
All diese Operationen, die in diesem Bereich genutzt werden können, finden Sie in einem Hilfsfenster, welches sich hinter dem ?-Button befindet.

1.5.3. Annotieren der Transkription

Nur wenn Baselines und Masken auf dem Bild festgelegt sind, gibt es die Möglichkeit die Funktionalitäten der Buttons „Transcription“ and „Text“ zu nutzen.
Um eine einer Zeile zugeordnete Transkription hinzuzufügen oder zu ändern, klicken Sie im Bereich “Transcription” auf die entsprechende Zeile. Ein Eingabefenster wird angezeigt. Um eine Transkription aufzunehmen, drücken Sie „Enter“: es wird automatisch das Eingabefeld für die nächste Zeile angezeigt.
Während Sie im Fenster “Transcription” tippen, werden die mit Zeilen versehenen Bereiche durch Text ersetzt und der Inhalt des Fensters “Text” ändert sich. Es ist also möglich den Text im Textfenster zu modifizieren, zu kopieren und mehrere Zeilen auf einmal einzufügen.

grafik

1.5.4. Eine Anmerkung zur Gliederung von Baselines, Polygonen und Transkriptionen

Die „Baseline“ ist ein zentrales Element, um Informationen in der eScriptorium Database zu speichern. Also:

grafik

Bildquelle: https://lectaurep.hypotheses.org/documentation/prendre-en-main-escriptorium

Während des Trainings der Kraken-Modelle, kann die Berechnung der Polygone zurückgesetzt werden: Für den User ist es daher von Vorteil, nicht in die Polygone einzugreifen und im Gegenteil dafür zu sorgen, dass die Baselines so gezeichnet werden, dass die automatisch erzeugten Polygone korrekt sind. Falls manuell Ground-Truth-Daten eingegeben werden, sollte darauf geachtet werden nur zu transkribieren was innerhalb des Polygons steht.

1.5.5. Die Reihenfolge der Zeilen ändern

Die Wiedergabereihenfolge der Zeilen erfolgt automatisch. Sie können sich die Ordnungsnummer jeder Zeile im Fenster „Segmentation“ anzeigen lassen, indem sie auf “Toggle ordering display (L)” klicken, oder im Fenster „Text“, wo die Zeilen in der folgenden Reihenfolge angezeigt werden.
Es ist möglich die Reihenfolge im „Text“-Fenster durch das Klicken von “Toggle sorting mode” zu ändern. Durch einfaches „Drag and Drop“ der Zeilen kann die Änderung durchgeführt werden.

Hinweis: Es ist empfehlenswert, die Qualität der Segmentierung sicherzustellen, bevor die Reihenfolge der Zeilen geändert wird, weil das Hinzufügen und Entfernen von Zeilen die Berechnung dieser Reihenfolge systematisch neustartet und dabei manuelle Modifikationen überschreibt.

grafik

1.5.6. Semantische Annotationen

Es ist möglich, den Zeilen und Bereichen Etiketten (oder Tags) zuzuordnen, indem man einer vom User auf der Registerkarte „Beschreibung“ vordefinierten Ontologie folgt. Es gibt Standard-Tags, aber es ist auch möglich welche über das Eingabefeld hinzuzufügen (Klicken Sie auf „+“ , dann „Aktualisieren“ und anschließend fügen Sie den neuen Tag zur Liste hinzu) oder zu löschen (entfernen sie Die Haken von den Boxen vor dem Tag und klicken Sie anschließend auf „Aktualisieren“).

Wählen Sie im Bereich „Segmentation“ einen Bereich oder eine Zeile aus, klicken Sie auf „Set the type on all selected lines / regions (T)” und wählen Sie das entsprechende Tag aus. Die Farben des Bereichs oder Zeile ändern sich. Es ist möglich ein Tag auf mehrere Bereiche oder Zeilen auf einmal anzuwenden: dafür wählen Sie alle gewünschten Bereiche aus (STRG+ Klick und Ziehen oder STRG gedrückt halten und die gewünschten Zeilen/Bereiche anklicken).

grafik

1.6. Annotationen Importieren

1.6.1. Strukturierte Annotationen als XML importieren

Es gibt die Möglichkeit Segmentierungen oder Transkriptionen, die außerhalb von eScriptorium erstellt wurden zu importieren. Dafür klicken Sie unter dem Tab „Bilder“ auf „Import“ und wählen dann die Option „Transcription (XML)“ aus.
Anschließend öffnet sich ein Formular und Sie können einen Namen für die importierte Version festlegen, und eine Datei für den Import hochladen. Dies kann eine ALTO XML Datei, eine PAGE XML Datei oder eine ZIP-Datei, die ALTO oder PAGE Dateien beinhaltet, sein.
Es ist nicht notwendig vorher auszuwählen, welche Teile des Dokuments vom Import betroffen sind: die Verbindung wird automatisch hergestellt durch die Informationen aus den XML Dateien.

grafik

Bitte beachten Sie, nachdem Segmentierungen importiert wurden, die nicht mit Kraken/eScriptorium erzeugt wurden, ist es wichtig die Polygone (Masken) zurückzusetzen bevor mit diesen Dokumenten Modelle trainiert werden.

1.6.2. Importieren von Annotationen aus einfachem Text

Es ist möglich manuell eine Transkription von einem einfachen Text zu importieren im Fenster „Text“ innerhalb des Tabs „Bearbeiten“. Jeder Zeilenumbruch zeigt dann den Übergang zu einem neuen Abschnitt an. Es ist daher darauf zu achten, dass die Lesereihenfolge der Zeilen übereinstimmt.

1.7. Dokumente automatisch mit Annotationen versehen

1.7.1. Anleitung

Automatische Dokumentannotationen werden über den Tab „Bilder“ verwaltet.

1.7.2. Einrichten der Segmentierung

grafik

1.7.3. Vergleich verschiedener Transkriptionen

grafik

1.8. Modelle trainieren

1.8.1. Ein Training starten

Das Training von Kraken-Modellen startet man innerhalb des Tabs „Bilder“. Es wird über den Tab „Modelle“ verfolgt (inaktiv solange noch kein anderes Modell als das Standardmodell mit dem Dokument verknüpft ist).
Der Zugang zu den Trainingsfunktionen hängt von der Autorisierung ab. Dies kann über die Administrationsschnittstelle verwaltet werden.
Um ein Modell zu trainieren müssen sich alle Bilder/Annotationen im gleichen Dokument befinden.

1.8.2. Ein Modell verfeinern oder von Grund auf neu trainieren?

Das Formular für die Trainingskonfiguration ermöglicht Ihnen folgende Auswahl:

1.9. Annotationen exportieren

Das Exportieren von Annotationen funktioniert über den Tab „Bilder“.

2. Verwalten einer kollaborativen Annotation Campaign

2.1. Erstellen einer Usergruppe (Admin)

Es ist möglich eine Nutzergruppe im Administrator-Dashboard (Vorausgesetzt Sie haben die erforderlichen Rechte) zu erstellen. Diese Gruppen dienen dazu Arbeitsgruppen zu definieren oder um ausgewählten Usern bestimmte Rechte zu erteilen.
Auch unter „Profil“ -> „Teams“ können Gruppen erstellt werden. Zudem werden hier auch die eigenen Gruppenzugehörigkeiten aufgelistet.

grafik

2.2. Teilen eines Dokumentes mit einem anderen User oder einer Gruppe

Ein User kann ein Dokument mit mehreren anderen Usern teilen, auch mit denjenigen, die nicht Teil der Gruppe sind, welcher das Dokument angehört. Dies geht über den Tab „Beschreibung“:

grafik

2.3. Ein Modell mit einem anderen User oder einer Gruppe teilen

Ein Modell ist mit einem Dokument verknüpft und nicht mit einem User. Um ein Modell mit anderen Usern zu teilen, gibt es zwei Möglichkeiten:

3. Sonstiges