Liebe Kolleginnen und Kollegen,
im Digitalisierungsprozess ist die OCR-Bearbeitung ein wichtiger
Workflowschritt. Eine optimale Einbindung in den Prozess ist daher ein
gemeinsames Interesse von Kitodo e.V. und dem DFG-Projekt OCR-D.
Seit Jahren kooperieren Kitodo und OCR-D in verschiedenen Bereichen. Um
diese Zusammenarbeit auf solide und nachhaltige Füße zu stellen, haben
beide eine Vereinbarung zur Kooperation bei der koordinierten und
nachhaltigen Entwicklung und Bereitstellung von OCR-Softwarelösungen zur
Massenvolltextdigitalisierung geschlossen.
Grundlegendes Ziel der Kooperation ist es, inhaltliche und
konzeptionelle Überschneidungen zwischen Kitodo und OCR-D zum Erzielen
von Synergien in technischer und organisatorischer Hinsicht zu nutzen.
Es wird perspektivisch angestrebt, OCR-D als eigenen Funktionsbereich in
Kitodo.Production aufzunehmen. OCR-D beabsichtigt in den kommenden
Jahren, die entstandene Softwarelösung zu einer stabil lauffähigen,
breit eingesetzten sowie ausführlich dokumentierten Softwarelösung
auszubauen. Im gegenseitigen Einverständnis und vor dem Hintergrund der
anstehenden Implementierungsphase von OCR-D tauschen sich die
Kooperationspartner dazu vor allem über Schnittstellen zu
Kitodo.Production und aktuelle sowie kommende Entwicklungen der
OCR-Massenvolltextdigitalisierung aus. Mit Blick auf die technische
Integration von OCR-D in Kitodo.Production, wird Kitodo e.V. die
koordinierenden Einrichtungen des OCR-D-Projektes und die
Implementierungspartner mit seinen Erfahrungen umfassend unterstützen.
Wir sind sehr optimistisch, dass wir als Community und Verein von dieser
Kooperation zukünftig profitieren werden.
Mit besten Grüßen im Namen des Kitodo-Vorstands
Robert Strötgen
--
Robert Strötgen
Technische Universität Braunschweig
Stellv. Direktor der Universitätsbibliothek
Leiter der Abteilung IT und forschungsnahe Services
Universitätsplatz 1, 38106 Braunschweig
+49 (0)531-391-5012
r.stroetgen(a)tu-braunschweig.de
www.ub.tu-braunschweig.de
Liebe Kollegen,
in Vorbereitung auf ein Digitalisierungsprojekt von Tonträgern würde uns interessieren, ob hier bereits in einer Einrichtung Erfahrungen mit Kitodo vorliegen. Wer war/ ist hier bereits aktiv? Prinzipiell sieht das ZVDD-Profil ja derlei vor (METS-Profil S. 8, 15, 18). Kitodo war jedoch bisher hinsichtlich der physischen Struktur recht unflexibel ...
Mit freundlichen Grüßen
Maria Federbusch
Wissenschaftliche Referentin
Abteilung Historische Drucke
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz
Unter den Linden 8
10117 Berlin
Tel.: +49 30 266-43 66 01
Fax: +49 30 266-33 65 01
maria.federbusch(a)sbb.spk-berlin.de
www.staatsbibliothek-berlin.de
Liebe Kolleginnen und Kollegen,
hiermit darf ich Ihnen nun endlich die Veröffentlichung der runderneuerten Version 3.0 von Kitodo.Presentation verkünden. Sie finden das Release wie üblich auf GitHub: https://github.com/kitodo/kitodo-presentation/releases/tag/v3.0.0 sowie im TYPO3 Extension Repository: https://extensions.typo3.org/extension/dlf/
Die Dokumentation, die auch eine Installationsanleitung enthält, finden Sie ebenfalls über TYPO3.org: https://docs.typo3.org/p/kitodo/presentation/master/en-us/
Achtung: Diese Version erfordert TYPO3 8.7 und unterstützt keine älteren TYPO3-Versionen mehr. Mit einem Update der Extension geht also zwingend auch eine Aktualisierung des zugrundeliegenden TYPO3-Systems einher!
Die funktionalen Neuerungen im Einzelnen:
1. Kitodo.Presentation unterstützt nun auch IIIF! Die IIIF Image API, also das dynamische Ausliefern von Bildderivaten über einen Image Server, wurde ja bereits in früheren Versionen unterstützt, nun ist aber auch die Unterstützung für die IIIF Presentation API hinzugekommen. Sie können ab Version 3 also neben den altbekannten METS-Dateien auch IIIF-Manifeste zur Präsentation Ihrer Digitalisate verwenden. Lediglich Kalenderansichten und die OAI-Schnittstelle werden bislang für IIIF-Manifeste (noch) nicht unterstützt, da es schlicht noch keinen Kodierungsstandard für kalendarische Strukturen in IIIF gibt, an dem wir uns bei der Implementierung orientieren könnten, und IIIF keine XML-Repräsentation besitzt, die per OAI-PMH ausgetauscht werden könnte. Struktur- und Metadaten, Volltexte, sämtliche Bildfunktionen, etc. funktionieren jedoch genauso wie für METS-Dateien. Sie können innerhalb Ihrer Digitalen Sammlungen sogar beliebig METS- und IIIF-Dokumente vermischen, ohne dass Ihre NutzerInnen einen Unterschied feststellen werden.
Dieses Feature stellt einen Meilenstein in der Entwicklung von Kitodo.Presentation dar, da es den Anschluss an die sehr aktive internationale IIIF-Community ermöglicht und erstmals eine Erweiterung der unterstützten Basisformate demonstriert. Gleichfalls tritt Kitodo.Presentation damit nun allerdings auch in direkte Konkurrenz zu anderen etablierten IIIF-Viewern wie Mirador, die ebenfalls über einen großen Funktionsumfang und hohen Bedienkomfort verfügen (allerdings wiederum keine METS-Digitalisate präsentieren können).
Besonderer Dank gebührt Lutz Helm, der im Rahmen des EFRE-Projekts „Cross Media Repository“ an der UB Leipzig die IIIF-Unterstützung für Kitodo.Presentation entwickelt hat!
2. Die Kalenderansicht wurde im Sinne des fortgeschriebenen DFG-Anwendungsprofils erweitert und unterstützt nun auch saisonale Publikationen, deren „Jahrgänge“ unterjährig beginnen/enden und Jahreswechsel beinhalten. Damit können nun also Konzertprogramme, Theaterzettel, etc. noch besser präsentiert werden. Voraussetzung ist die Einhaltung des überarbeiteten DFG-Anwendungsprofils in der aktuellen Version 2.3.1, das jedoch ohnehin auch vom DFG-Viewer verlangt wird.
3. Die auf Solr basierende Metadaten- und Volltextsuche wurde grundlegend überarbeitet und verbessert. Insgesamt wurde die Suche damit präziser und schneller, zahlreiche Fehler wurden bereinigt (beispielsweise funktioniert die trunkierte Suche endlich wie erwartet) und der Suchindex wird zur Steigerung der Performance nun auch für die Listengenerierung etwa in der OAI-Schnittstelle oder der Kollektionsansicht verwendet. Ein Nebeneffekt ist jedoch, dass der Einsatz von Apache Solr nicht mehr länger optional ist, sondern für die meisten Funktionen inzwischen zwingend vorausgesetzt wird. Da inzwischen jedoch auch aktuellere Solr-Versionen ab 7.4 unterstützt werden, sind Installation und Betrieb ebenfalls einfacher geworden.
4. Die Verwendung des Suchindex für Kollektionen ermöglicht nun auch die Erzeugung dynamischer Kollektionen, d. h. statt wie bisher eine festgelegte Auswahl von Digitalisaten zu einer Kollektion zusammenzufassen, können Sie alternativ auch eine Suchabfrage hinterlegen. Diese Abfrage wird dann beim Aufruf der Kollektion dynamisch ausgeführt und ihre Treffermenge als Inhalt der Kollektion herangezogen. So sind etwa thematische Kollektionen möglich, die mit der Neu-Veröffentlichung von relevanten Digitalisaten automatisch wachsen, ohne dass Sie die Digitalisate manuell oder bereits in Kitodo.Production der Kollektion zuordnen müssen. Dies macht auch den Einsatz der Kollektionsfunktion zur Kuratierung virtueller Ausstellungen noch flexibler als bisher.
5. Mit der Modernisierung der Recherche-Infrastruktur gingen auch zahlreiche kleinere Verbesserungen einher. So werden in den Metadaten vorhandene Geokoordinaten (GeoJSON) im Index für eine räumliche Suche aufbereitet, ein neues Tool der Toolbox ermöglicht eine Suche im aktuellen Dokument und das Trefferhighlighting in Volltexten funktioniert nun besser und schneller.
6. Den Empfehlungen der AG Lizenzen der DINI AG KIM zur Frage der einheitlichen Kodierung von Rechteinformationen in den Metadaten folgend, unterstützt Kitodo.Presentation nun auch die Indexierung und Anzeige genau dieser Informationen zu Lizenz, Zugriffsrechten, Benutzungsbeschränkungen, etc. Das war zwar bislang auch schon über eine entsprechende Metadatenkonfiguration möglich, nun werden diese Daten jedoch explizit ausgelesen und haben eigene Datenbankfelder erhalten, um sie künftig besser – etwa zur technischen Durchsetzung der Zugriffsrechte – auswerten zu können.
7. Bringt eine Person oder Körperschaft Referenzen zu ihrem Normdatensatz mit, so erkennt Kitodo.Presentation dies nun automatisch und verlinkt den Namen entsprechend mit dem Normdatensatz. (Letzteres ist natürlich wie gehabt konfigurierbar.)
Auch unter der Haube ist einiges passiert, das vielleicht eher für die TechnikerInnen unter Ihnen interessant ist:
8. Die Extension folgt modernen Standards wie PSR-4 für das Autoloading und PSR-12 für den Coding Style – beides in Anlehnung an die entsprechenden Standards im TYPO3-Projekt.
9. Kitodo.Presentation ist nun auch als Composer-Package „kitodo/presentation“ erhältlich. Tatsächlich ist dies sogar nun die bevorzugte Installationsweise, da so alle Abhängigkeiten automatisiert mitinstalliert werden können. Entsprechend sind über Composer verfügbare Programmbibliotheken und Frameworks auch nicht mehr Bestandteil der Extension, sondern müssen separat installiert werden (falls die Installation nicht über Composer erfolgt).
10. Die Kommunikaton mit dem Solr-Service erfolgt nun über das Framework Solarium. Damit wurde die alte und leider nicht mehr gepflegte PHP-Bibliothek abgelöst, die bisher Bestandteil der Extension war.
11. Die Datenbankabstraktion wurde dahingehend überarbeitet, dass die Datenbank nun im SQL strict mode betrieben werden kann. Dies ist in neueren Versionen von MySQL und MariaDB der Normalfall.
12. Das Command Line Interface zur Indexierung von Digitalisaten wurde komplett neu implementiert und basiert nun auf den CLI-Funktionen des Frameworks Symfony. Es ermöglicht nun auch die gezielte Re-Indexierung einzelner Kollektionen, inkl. der oben erwähnten dynamischen Kollektionen.
Einen ausführlicheren Einblick in die neue Version können Sie heute auf dem Kitodo-Anwendertreffen gewinnen – oder sie probieren die neue Version einfach selbst einmal aus! Fehlermeldungen können wie immer auf GitHub erfolgen: https://github.com/kitodo/kitodo-presentation/issues
Zuletzt möchte ich noch darauf hinweisen, dass die Modernisierung von Kitodo.Presentation für den Einsatz aktuellerer TYPO3-Versionen erhebliche Aufwände verursacht hat, die weit über die Ressourcen des Release Managements hinaus gingen und leider beinahe ausschließlich von der SLUB Dresden getragen wurden. Die Modernisierung ist auch mit der Veröffentlichung von Version 3 keineswegs abgeschlossen, zumal bereits jetzt aktuellere TYPO3-Versionen existieren, die noch nicht unterstützt werden. Eine komplexe Software wie Kitodo stets auf dem aktuellen Stand zu halten, erfordert einen dauerhaften Einsatz und kann nicht allein vom Release Management geleistet werden. Diese Community-Aufgabe auf mehr Schultern zu verteilen, ist daher unumgänglich. Wenn Sie also die Chance sehen, die Software-Pflege einmalig oder sogar dauerhaft zu unterstützten, sprechen Sie mich gerne an – jeder Handgriff hilft und es gibt immer etwas zu tun! ;o)
Viele Grüße
Sebastian Meyer
--
Sebastian Meyer
Stabsstelle Digitale Bibliothek
Sächsische Landesbibliothek –
Staats- und Universitätsbibliothek Dresden (SLUB)
Abteilung IT, Referat 2.1 Digitale Bibliothek
01054 Dresden
Besucheradresse: Zellescher Weg 18, 01069 Dresden
Telefon: +49 351 4677-206
Mobilfunk: +49 173 9615528
Liebe Anwender,
hat jemand auch unten stehenden Effekt in Kitodo 2.3.0 beobachtet oder gar (lieber Herr Ronge) eine Erklärung dafür?
Wenn ich einen Vorgang habe, der mindestens eine Personenmetadatagroup enthält, die mehr als zwei Rollen (Beziehungskennzeichen, z.B. aut , pbl und lbt) aufweist, kommt es (während der Strukturdatenerfassung) durch mehrfaches "Speichern" in Kombination mit "Speichern und zurück" zur Potenzierung der Beziehungskennzeichnungen. Dadurch wird Kitodo regelmäßig wie folgt zum Absturz gebracht: 1. Speichern --> Verdopplung; 2. Speichern --> x 6; 3. Speichern --> x 127. Beim Öffnen des Vorgangs mit 127 Rollen stürzt der Javaprozess ab. Wir lassen nun ein Reparaturskript alle paar Minuten laufen, das die sinnlosen Informationen wieder löscht, bevor Kitodo zum Absturz gebracht wird. Hiermit werden aber nur die Symptome bekämpft, nicht die eigentliche Ursache ... Da wir das Problem einer "Personenpotenzierung" bereits in Kitodo 2.2.0 hatten, vermuten wir möglicherweise eine ähnliche Ursache. Kann jemand helfen?
Mit freundlichen Grüßen
Armin Möller und Maria Federbusch
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz
Liebe Community,
mal allgemein in die Runde gefragt: Wer hat Erfahrungen mit den
Texterkennungsfunktionalitäten mit Kitodo gesammelt?
Und wenn ja, mit welcher Kitodo-Version?
Da wir bei der ULB Sachsen-Anhalt auf ALTO-XML setzen, interessiert uns
natürlich, ob Kitodo mit diesem Format etwas anfangen kann. Dazu zählt,
z.B. ob der "OCR"-Button in der Strukturierungsansicht diese Daten
entsprechend darstellen kann und ob dieses Format auch von
nachgelagerten Prozessen Richtung DMS-Export (zedExporter) verarbeitet
werden kann.
Danke!
--
Uwe Hartwig
Anwendungsentwickler IT / Digitale Dienste
Universitäts- und Landesbibliothek Sachsen-Anhalt
August-Bebel-Straße 13
D - 06108 Halle (Saale)
Fon: + 49 345 55 22 183
Mail: uwe.hartwig(a)bibliothek.uni-halle.de