Liebe Kitodo-Community,
wir testen derzeit Software für OCR & Transkriptionen, deren Implementierung in unseren zukünftigen Digitalisierungsworkflow mit Hilfe von kitodo.pro und letztlich deren Präsentation in kitodo.pre.
- Bisher gibt es kein softwarebasiertes OCR bzw. Transkriptions-Verfahren in der AdK für Archivalien, wir testen deshalb derzeit tesseract, transkribus und (vermutlich bald) abby.
- Anders als in Bibliotheken wird unser Digitalisierungs-Output jedoch wesentlich geringer sein, wir rechnen mit 3000-5000 Seiten pro Jahr, die für OCR/Transkriptionen in Frage kommen.
- Vermutlich auch anders als in den meisten Bibliotheken werden in der AdK vor allem Handschriften, unterschiedliche Frakturschriften sowie existierende Transkriptionen (Word-Dateien…)
basisbildend sein.
- „Transkribus“ scheint für das, was wir vorhaben und generieren– automatisierbare Frakturschrift/Handschrifterkennung, manuelle Transkription, GUI für die Bearbeitung, ALTO/TEI-Export
– zunächst ganz gut geeignet zu sein.
- Gibt es Erfahrungen von Ihrer Seite mit der Software, die Sie mit uns teilen könnten bzw. würden?
- Da wir im Workflow Anforderungen der Editionswissenschaften (z.B. Textauszeichnung,) berücksichtigen wollen, möchten wir TEI gegenüber ALTO zumindest in bestimmten Projekten im Workflow
vorziehen.
- Gibt es in der Community bereits einen TEI-basierten Workflow für kitodo.pro + kitodo.pre?
Euch/Ihnen viele Grüße
Volkmar Ernst
Volkmar Ernst M.A.
Digitale Langzeitarchivierung
Akademie der Künste
Robert-Koch-Platz 10
10115 Berlin
Tel. +49(0)30 200 57-32 14
Tel. +49(0)171 709 33 20
Fax +49(0)30 200 57-31 02
ernst@adk.de
www.adk.de