Liebe Community, lieber Herr Hartwig,
Kitodo.Production 2.x bringt selbst keine Werkzeuge mit, um eine
Texterkennung direkt durchzuführen und ist auf externe Dienste
angewiesen. Ein solcher Dienst versteckt sich hinter dem "OCR" Button,
der eine nicht näher spezifizierte Schnittstelle anspricht und von
dieser nicht näher spezifizierte Daten zurück bekommt. Damit soll man
dann wohl die Ergebnisse im Metadateneditor von Kitodo.Production sehen
können. Ich selbst habe in den vielen Jahren der Nutzung von
Kitodo.Production 1.x und 2.x niemals eine solche Einbindung gesehen und
/ oder erlebt.
An der SLUB wird die OCR selbst als eigenständiger Schritt / Aufgabe
nach der Metadaten-Bearbeitung ausgeführt. Über unseren externen OCR
Dienstleister werden die Ergebnisse als ALTO-XML zurückgeliefert und im
jeweiligen Vorgangsverzeichnis abgelegt. Beim Export werden neben den
Bild- und Metadaten auch die vorhandenen OCR Daten exportiert und an die
Präsentation auf Basis von Kitodo.Presentation übergeben.
Kitodo.Presentation stellt dann die OCR Ergebnisse dar.
Viele Grüße
Henning Gerhardt
On 10/30/19 11:10 AM, Uwe Hartwig wrote:
Liebe Community,
mal allgemein in die Runde gefragt: Wer hat Erfahrungen mit den
Texterkennungsfunktionalitäten mit Kitodo gesammelt?
Und wenn ja, mit welcher Kitodo-Version?
Da wir bei der ULB Sachsen-Anhalt auf ALTO-XML setzen, interessiert uns
natürlich, ob Kitodo mit diesem Format etwas anfangen kann. Dazu zählt,
z.B. ob der "OCR"-Button in der Strukturierungsansicht diese Daten
entsprechend darstellen kann und ob dieses Format auch von
nachgelagerten Prozessen Richtung DMS-Export (zedExporter) verarbeitet
werden kann.
Danke!
--
Henning Gerhardt
Sächsische Landesbibliothek -
Staats- und Universitätsbibliothek Dresden (SLUB)
Abt. Informationstechnologie (IT), Ref. 2.5 - Digitale Objekte
01054 Dresden
Besucheradresse: Zellescher Weg 18, 01069 Dresden
Tel.: +49 351 4677 227
E-Mail: henning.gerhardt(a)slub-dresden.de
www.slub-dresden.de