Liebe Kitodo-Community,
wir testen derzeit Software für OCR & Transkriptionen, deren Implementierung in
unseren zukünftigen Digitalisierungsworkflow mit Hilfe von kitodo.pro und letztlich deren
Präsentation in kitodo.pre.
* Bisher gibt es kein softwarebasiertes OCR bzw. Transkriptions-Verfahren in der AdK
für Archivalien, wir testen deshalb derzeit tesseract, transkribus und (vermutlich bald)
abby.
* Anders als in Bibliotheken wird unser Digitalisierungs-Output jedoch wesentlich
geringer sein, wir rechnen mit 3000-5000 Seiten pro Jahr, die für OCR/Transkriptionen in
Frage kommen.
* Vermutlich auch anders als in den meisten Bibliotheken werden in der AdK vor
allem Handschriften, unterschiedliche Frakturschriften sowie existierende Transkriptionen
(Word-Dateien...) basisbildend sein.
* "Transkribus" scheint für das, was wir vorhaben und generieren-
automatisierbare Frakturschrift/Handschrifterkennung, manuelle Transkription, GUI für die
Bearbeitung, ALTO/TEI-Export - zunächst ganz gut geeignet zu sein.
* Gibt es Erfahrungen von Ihrer Seite mit der Software, die Sie mit uns teilen
könnten bzw. würden?
* Da wir im Workflow Anforderungen der Editionswissenschaften (z.B. Textauszeichnung,)
berücksichtigen wollen, möchten wir TEI gegenüber ALTO zumindest in bestimmten Projekten
im Workflow vorziehen.
* Gibt es in der Community bereits einen TEI-basierten Workflow für kitodo.pro +
kitodo.pre?
Euch/Ihnen viele Grüße
Volkmar Ernst
Volkmar Ernst M.A.
Digitale Langzeitarchivierung
Akademie der Künste
Robert-Koch-Platz 10
10115 Berlin
Tel. +49(0)30 200 57-32 14
Tel. +49(0)171 709 33 20
Fax +49(0)30 200 57-31 02
ernst@adk.de<mailto:ernst@adk.de>
www.adk.de<http://www.adk.de/>