Lieber Herr Maus,
ich bin beeindruckt! Haben Sie nicht Lust, den Validator für den DFG-Viewer zu entwickeln?
;o)
Unabhängig davon ließe sich die Validierung als
mehrstufiger Prozess
durch spezialisierten Code
bewerkstelligen. Vielleicht so:
0. Prüfen auf Wohlgeformtheit
1. Validieren der METS gegen das offizielle METS-Schema
2. Prüfbericht für die Schematron-Regeln erstellen
3. Teilbäume dv:links und dv:rights mit RelaxNG validieren
4. Deskriptive Metadaten gegen die jeweiligen Schemata validieren
Das ist machbar aber recht komplex.
Genauso funktionierte schon der alte Validator, nur dass er die Punkte 2 und 3 nicht mit
Hilfe von Schemata prüfte, sondern über eine lange Folge von Xpath-Abfragen und bedingten
Schleifen im Programmcode. Dadurch wurde der Validator jedoch sehr unübersichtlich und
ließ sich zuletzt mit der anstehenden Erweiterung für Handschriften und deskriptive
Metadaten im TEI-Format nicht mehr vernünftig pflegen. Ein Schema-basiertes Verfahren ist
da deutlich flexibler und pflegeleichter.
Problematisch waren im alten Validator auch die inhaltliche Validierung, etwa die
Überprüfung der korrekten Kodierung von Sonderzeichen, und die Ermittlung von einigen
peripheren Leistungsparametern, zum Beispiel der für die Gesamtperformance nicht
unerheblichen Antwortzeiten der OAI-Schnittstelle des Datenlieferanten.
Viele Grüße
Sebastian Meyer
--
Sebastian Meyer
Referatsleiter Digitale Bibliothek
Sächsische Landesbibliothek -
Staats- und Universitätsbibliothek Dresden (SLUB)
Abteilung IT, Referat Digitale Bibliothek
01054 Dresden
Besucheradresse: Zellescher Weg 18
Tel.: +49 351 4677 206 | Fax: +49 351 4677 711
E-Mail: sebastian.meyer(a)slub-dresden.de
http://www.slub-dresden.de
> -----Original Message-----
> From: dv-technik-bounces(a)dfg-viewer.de [mailto:dv-technik-
> bounces(a)dfg-viewer.de] On Behalf Of David Maus
> Sent: Wednesday, July 09, 2014 10:14 AM
> To: dv-technik(a)dfg-viewer.de
> Cc: technik(a)dfg-viewer.de
> Subject: Re: [DFG-Viewer] DFG-Viewer 3.0 veröffentlicht!
>
> Lieber Herr Meyer,
> Liebe Kolleginnen und Kollegen,
>
> 1/ Lizenz
>
> Die Lizenz habe ich bewusst offengelassen, da ich bei den
> RelaxNG-Schemata zunächst keine Schöpfungshöhe erkennen kann, die
> eine
> Urheberschaft begründet. Die Regeln sind ja im Anwendungsprofil
> formuliert und lassen sich im Grunde nicht anderes als RelaxNG
> ausdrücken als geschehen. Bei den Schematron-Regeln ist das anders --
> ich denke, dass es der Einfachheit halber auf CC0 hinauslaufen wird.
>
> 2/ Ergänzungen
>
> Folgende Dateien habe ich kürzlich ergänzt:
>
> util/strukturdatenset.rdf
> util/filegrp-use.rdf
>
> Das Strukturdatenset bzw. die zulässigen Werte des
> mets:fileGrp/@USE-Attributs ausgedrückt als SKOS in RDF/XML. Beide
> Dateien dienen zur Zeit als reine Lookup-Tabellen für die Prüfung der
> METS.
>
> schematron/mets.sch
>
> ISO Schematron [ISO-SCHEMATRON], das die METS-Datei anhand der im
> Anwendungsprofil formulierten Regeln validiert. Erhebt keinen Anspruch
> auf Vollständigkeit, könnte aber bereits alle Regeln abdecken. Ist
> noch in der Bearbeitung.
>
> schematron/mets.xsl
>
> Ein XSLT 1.0, das die Schematron-Regeln überprüft und einen Bericht in
> der SVRL (Schematron Validation Report Language) [ISO-SCHEMATRON]
> erstellt.
>
> 3/ Validieren der METS
>
> Das ist eine sehr spannende Frage. Wenn die Herausforderung darin
> besteht, dass wir die METS nicht nur gegen ein, sondern gegen mehrere
> Schemata validieren müssen bzw. unterschiedene Teile der METS gegen
> unterschiedene Schemata, dann bietet die X-Familie mit der
> Namespace-based Validation Dispatching Language (NVDL) [ISO-NVDL]
> eine
> Lösung an.
>
> Die Beschäftigung mit der NVDL steht bei mir auf der Vorhabenliste für
> die nächsten Monate, die Validierung der METS des DFG-Viewers soll
> hier als exemplarischer Anwendungsfall fungieren.
>
Unabhängig davon ließe sich die Validierung als
mehrstufiger Prozess
durch spezialisierten Code
bewerkstelligen. Vielleicht so:
0. Prüfen auf Wohlgeformtheit
1. Validieren der METS gegen das offizielle METS-Schema
2. Prüfbericht für die Schematron-Regeln erstellen
3. Teilbäume dv:links und dv:rights mit RelaxNG validieren
4. Deskriptive Metadaten gegen die jeweiligen Schemata validieren
Das ist machbar aber recht komplex.
>
> Mit besten Grüßen,
> -- David Maus
>
> [ISO-NVDL] : ISO/IEC 19757-4:2006(E)
> [ISO-SCHEMTRON] : ISO/IEC 19757-3:2006(E)
>
> At Fri, 4 Jul 2014 16:27:56 +0200,
> Meyer, Sebastian wrote:
> >
> > Lieber Herr Maus,
> >
> > vielen Dank für die Mühe!
> > Derzeit gibt es auf der Webseite des DFG-Viewers ja leider keinen
> Validator mehr und wir prüfen gerade verschiedene Technologien, um
> einen solchen Validator wieder zu realisieren. Ggf. können wir Ihre
> Schemata da also gut gebrauchen - vorausgesetzt natürlich, wir dürfen
> sie in diesem Kontext nachnutzen! (Ich habe im Github keine
> Lizenzangaben gefunden.)
> >
> > Viele Grüße
> > Sebastian Meyer
> >
> > --
> > Sebastian Meyer
> > Referatsleiter Digitale Bibliothek
> >
> > Sächsische Landesbibliothek -
> > Staats- und Universitätsbibliothek Dresden (SLUB)
> > Abteilung IT, Referat Digitale Bibliothek
> > 01054 Dresden
> > Besucheradresse: Zellescher Weg 18
> > Tel.: +49 351 4677 206 | Fax: +49 351 4677 711
> > E-Mail: sebastian.meyer(a)slub-dresden.de
> >
> >
http://www.slub-dresden.de
> >
> > > -----Original Message-----
> > > From: dv-technik-bounces(a)dfg-viewer.de [mailto:dv-technik-
> > > bounces(a)dfg-viewer.de] On Behalf Of David Maus
> > > Sent: Friday, June 27, 2014 10:21 AM
> > > To: dv-technik(a)dfg-viewer.de
> > > Cc: technik(a)dfg-viewer.de
> > > Subject: Re: [DFG-Viewer] DFG-Viewer 3.0 veröffentlicht!
> > >
> > > Liebe Kolleginnen und Kollegen,
> > >
> > > Wenn es keine Einwände dagegen gibt, die Reihenfolge der
> Elemente in
> > > <dv:links> und <dv:rights> festzulegen, dann könnte das
> > > Anwendungsprofil ggf. um einen informellen Teil mit einem Schema
> > > ergänzt werden.
> > >
> > > Ich habe hier:
> > >
> > >
https://github.com/dmj/dfgviewer-schema
> > >
> > > Ein kleines Projekt gestartet und die Schemata für <dv:links> und
> > > <dv:rights> bereits eingespielt.
> > >
> > > In den nächsten Tagen werde ich ein ISO-Schematron ergänzen, dass
> die
> > > im Anwendungsprofil 2.1 formulierten Regeln prüft.
> > >
> > > Mit besten Grüßen,
> > > -- David Maus
> > >
> > > At Mon, 2 Jun 2014 18:22:11 +0200,
> > > Meyer, Sebastian wrote:
> > > >
> > > > Lieber Herr Maus,
> > > >
> > > > unter diesem Aspekt habe ich das noch nicht betrachtet. Aber Sie
> > > haben recht, für die Schema-Erstellung ist das natürlich ungünstig.
> > > Meinetwegen können wir auch eine Reihenfolge festlegen (dann
> würde
> > > ich die Reihenfolge der Beschreibung im Anwendungsprofil
> vorschlagen).
> > > Das wäre eine Frage in die Runde: Gibt es noch andere Gründe dafür
> > > bzw. dagegen?
> > > >
> > > > Viele Grüße
> > > > Sebastian Meyer
> > > >
> > > > --
> > > > Sebastian Meyer
> > > >
> > > > Referatsleiter 2.1 - Digitale Bibliothek
> > > > Abteilung 2 - Informationstechnologie
> > > >
> > > > Sächsische Landesbibliothek -
> > > > Staats- und Universitätsbibliothek Dresden (SLUB)
> > > > 01054 Dresden
> > > >
> > > > Tel.: +49 351 4677 - 206
> > > > Fax.: +49 351 4677 - 711
> > > >
http://www.slub-dresden.de/
> > > >
> > > > > -----Ursprüngliche Nachricht-----
> > > > > Von: dv-technik-bounces(a)dfg-viewer.de [mailto:dv-technik-
> > > bounces@dfg-
> > > > > viewer.de] Im Auftrag von David Maus
> > > > > Gesendet: Montag, 2. Juni 2014 16:30
> > > > > An: dv-technik(a)dfg-viewer.de
> > > > > Cc: technik(a)dfg-viewer.de
> > > > > Betreff: Re: [DFG-Viewer] DFG-Viewer 3.0 veröffentlicht!
> > > > >
> > > > > Liebe Herr Meyer,
> > > > >
> > > > > At Mon, 2 Jun 2014 11:39:56 +0200,
> > > > > Meyer, Sebastian wrote:
> > > > > >
> > > > > > [1 <text/plain; iso-8859-1 (quoted-printable)>]
> > > > > > [2 <text/html; iso-8859-1 (quoted-printable)>]
> > > > > > Lieber Herr Maus,
> > > > > >
> > > > > > die Reihenfolge der Elemente ist tatsächlich beliebig.
> > > > > >
> > > > >
> > > > > Okay. Für das Schreiben eines XML-Schema ist das etwas
> ungünstig,
> > > weil
> > > > > man im Falle von <dv:links> alle möglichen Varianten
aufzählen
> muss.
> > > > >
> > > > > Das Konstrukt <xs:all> (ungeordnete Liste von Partikeln)
> erfordert
> > > > > (unter anderem) ein @maxOccurs von maximal 1, d.h. die
> beliebige
> > > > > Wiederholung <dv:reference> lässt sich damit nicht
ausdrücken.
> > > > >
> > > > > Für <dv:rights> ist momentan kein Problem, kann aber
zukünftig
> zum
> > > > > Problem werden.
> > > > >
> > > > > Wäre es da nicht besser, wenn die Reihenfolge vorgegeben ist?
> > > > >
> > > > > Mit besten Grüßen,
> > > > > -- David Maus
> > > > >
> > > > > > Bei der Angabe des Förderers ist zu unterscheiden zwischen
der
> > > > > bibliografischen Angabe und der "Steuerungsangabe" für
das
> Logo im
> > > DFG-
> > > > > Viewer. Die bibliografisch relevante Angabe machen Sie in MODS
> in
> > > einem
> > > > > entsprechenden
> > > > > > mods:name-Element (oder eben auch nicht, wenn Sie keine
> > > Angabe
> > > > > machen wollen). Über die Angabe in der amdSec steuern Sie
> lediglich
> > > die
> > > > > Anzeige des Logos im DFG-Viewer und dort wird standardmäßig
> das
> > > Logo der
> > > > > DFG angezeigt, weil der
> > > > > > Viewer selbst ein DFG-gefördertes Angebot ist. Auch wenn
Ihre
> > > > > Digitalisierung nicht von der DFG gefördert wurde, so wird doch
> > > zumindest
> > > > > die Präsentation der Digitalisate im DFG-Viewer gewissermaßen
> von
> > > der DFG
> > > > > gefördert.
> > > > > >
> > > > > > Viele Grüße
> > > > > > Sebastian Meyer
> > > > > >
> > > > > > --
> > > > > > Sebastian Meyer
> > > > > > Referatsleiter Digitale Bibliothek
> > > > > >
> > > > > > Sächsische Landesbibliothek -
> > > > > > Staats- und Universitätsbibliothek Dresden (SLUB)
> > > > > >
> > > > > > Zellescher Weg 18 // 01069 Dresden
> > > > > > Postanschrift: 01054 Dresden
> > > > > >
> > > > > > Tel: +49 351 4677206 // Fax: +49 351 4677711
> > > > > > E-Mail: sebastian.meyer(a)slub-dresden.de
> > > > > >
> > > > > >
http://www.slub-dresden.de/
> > > > > >
> > > > > > -------- Ursprüngliche Nachricht --------
> > > > > > Von: David Maus
> > > > > > Datum:02.06.2014 08:18 (GMT+01:00)
> > > > > > An: dv-technik(a)dfg-viewer.de
> > > > > > Cc: "'technik(a)dfg-viewer.de'"
> > > > > > Betreff: Re: [DFG-Viewer] DFG-Viewer 3.0 veröffentlicht!
> > > > > >
> > > > > > Liebe Kolleginnen und Kollegen,
> > > > > >
> > > > > > Mir sind da zwei Dinge am METS-Anforderungsprofil
> aufgefallen.
> > > > > >
> > > > > > 1/ Reihenfolge der Kindelement von <dv:rights> und
<dv:links>
> > > > > >
> > > > > > Beim Schreiben von Schemata für die o.g. Elemente[1] ist
mir
> > > > > > aufgefallen, dass das Anwendungsprofil keine Aussage über
die
> > > > > > Reihenfolge trifft, in der die Kindelement auftreten
dürfen.
> > > > > >
> > > > > > Ist die Reihenfolge beliebig?
> > > > > >
> > > > > > 2/ Angabe eines Förderers
> > > > > >
> > > > > > Laut Anwendungsprofil sind die Angaben zum Förderer
> optional,
> > > der
> > > > > > DFG-Viewer scheint aber mit der DFG als Standardwert zu
> arbeiten.
> > > > > >
> > > > > > Welche Möglichkeiten habe ich, um auszudrücken, dass die
> > > Information
> > > > > > zum Förderer schlicht nicht vorliegt?
> > > > > >
> > > > > > Mit besten Grüßen,
> > > > > > -- David Maus
> > > > > >
> > > > > > [1]
https://gist.github.com/dmj/c498a161bf053a1ed550
> > > > > >
> > > > > > At Fri, 30 May 2014 19:17:37 +0200,
> > > > > > Meyer, Sebastian wrote:
> > > > > > >
> > > > > > > Liebe Kolleginnen und Kollegen,
> > > > > > >
> > > > > > > nach mehreren Ehrenrunden bei der Formatspezifikation
und
> > > einer fast
> > > > > halbjährigen Testphase ist es endlich soweit: Version 3.0 des
DFG-
> > > Viewers
> > > > > hat das Licht der Welt erblickt!
> > > > > > >
> > > > > > > Die Neuerungen sind neben zahllosen
Detailverbesserungen
> und
> > > > > Fehlerkorrekturen:
> > > > > > >
> > > > > > > - Neben METS/MODS wird nun auch METS/TEI unterstützt,
> womit
> > > > > insbesondere digitalisierte mittelalterliche und
frühneuzeitliche
> > > > > Handschriften im DFG-Viewer angezeigt werden können. [1]
> > > Grundsätzlich
> > > > > ist die Umsetzung jedoch so generisch,
> > > > > > dass mit verhältnismäßig geringem Aufwand künftig auch noch
> > > weitere
> > > > > bibliographische Formate unterstützt werden können.
> > > > > > > - Statt der drei festen Zoomstufen gibt es nun einen
> stufenlosen
> > > Zoom.
> > > > > Dieser bewegt sich außerdem immer innerhalb seines Containers
> > > und
> > > > > sprengt somit auch bei hohen Auflösungen nicht mehr den
> > > Bildschirm.
> > > > > > > - Eine Vorschauansicht ist verfügbar, sofern in der
METS-Datei
> > > eine
> > > > > Dateigruppe "THUMBS" vorhanden ist. Diese erlaubt die
optische
> > > Navigation
> > > > > durch das Werk alternativ zum inhaltlichen Strukturbaum.
> > > > > > > - Es werden nun auch deskriptive Metadaten
> untergeordneter
> > > > > Strukturelemente angezeigt statt nur diejenigen auf
> > > bibliographischer
> > > > > Titelebene. Diese zusätzlichen Informationen lassen sich (ebenso
> wie
> > > das
> > > > > Inhaltsverzeichnis) ein- und
> > > > > > ausblenden.
> > > > > > >
> > > > > > > Alle Änderungen am DFG-Viewer sind voll
> abwärtskompatibel, so
> > > dass Sie
> > > > > keine Anpassungen an Ihren METS-Dateien vornehmen müssen.
> > > Einige der
> > > > > neuen Funktionen könnten allerdings zusätzliche Angaben
> erfordern
> > > (diese
> > > > > sind aber ausnahmslos
> > > > > > optional). Entsprechend wurden die Anwendungsprofile für
> METS
> > > und
> > > > > MODS angepasst und ein neues Anwendungsprofil für TEI auf der
> > > Webseite
> > > > > ergänzt [2]. Ein Blick in die Dokumentation lohnt sich, da sich
> einige
> > > neue
> > > > > Möglichkeiten ergeben,
> > > > > > die hier nicht im Detail aufgeführt sind!
> > > > > > >
> > > > > > > Im Kern des neuen DFG-Viewers werkelt nun
> Goobi.Presentation
> > > [3], die
> > > > > freie Präsentationskomponente der quelloffenen Goobi
> > > Digitalisierungssuite
> > > > > [4]. Dadurch arbeitet der Webservice um ein Vielfaches
> > > > > ressourceneffizienter und ist
> > > > > > wesentlich flexibler konfigurierbar als zuvor, bleibt aber
> weiterhin
> > > > > quelloffen und frei nachnutzbar. Den Quellcode des DFG-Viewers
> > > finden Sie
> > > > > auf der Entwicklerplattform Github [5] sowie im TYPO3 Extension
> > > Repository
> > > > > [6]. Dort können
> > > > > > Sie auch Fehler melden und Anregungen für die weitere
> > > Entwicklung
> > > > > loswerden.
> > > > > > >
> > > > > > > Die nächste Version des DFG-Viewers wird gegen
Jahresende
> > > > > fertiggestellt sein und einige Anpassungen speziell für die
> Anzeige
> > > > > digitalisierter Zeitungen enthalten (z.B. eine kalendarische
> > > Navigation). Mein
> > > > > Kollege Alexander Bigga wird
> > > > > > Sie darüber auf dem Laufenden halten und zu gegebener Zeit
> eine
> > > erste
> > > > > Testversion veröffentlichen.
> > > > > > >
> > > > > > > Viele Grüße
> > > > > > > Sebastian Meyer
> > > > > > >
> > > > > > > [1]
http://dfg-
> > > viewer.de/show/?tx_dlf[id]=http%3A%2F%2Ftest.dfg-
> > > > > viewer.de%2Ffileadmin%2Ftei.xml<http://dfg-
> > > > > viewer.de/show/?tx_dlf%5bid%5d=http%3A%2F%2Ftest.dfg-
> > > > > viewer.de%2Ffileadmin%2Ftei.xml>
> > > > > > > [2]
http://dfg-viewer.de/profil-der-metadaten/
> > > > > > > [3]
http://typo3.org/extensions/repository/view/dlf
> > > > > > > [4]
http://www.goobi.org/
> > > > > > > [5]
https://github.com/slub/dfg-viewer
> > > > > > > [6]
http://typo3.org/extensions/repository/view/dfgviewer
> > > > > > >
> > > > > > > --
> > > > > > > Sebastian Meyer
> > > > > > > Referatsleiter Digitale Bibliothek
> > > > > > >
> > > > > > > Sächsische Landesbibliothek -
> > > > > > > Staats- und Universitätsbibliothek Dresden (SLUB)
> > > > > > > Abteilung IT, Referat Digitale Bibliothek
> > > > > > > 01054 Dresden
> > > > > > > Besucheradresse: Zellescher Weg 18
> > > > > > > Tel.: +49 351 4677 206 | Fax: +49 351 4677 711
> > > > > > > E-Mail: sebastian.meyer@slub-
> > > > > dresden.de<mailto:sebastian.meyer@slub-dresden.de>
> > > > > > >
> > > > > > >
http://www.slub-dresden.de<http://www.slub-
> dresden.de/>
> > > > > > >
> > > > > > >
> > > > > >
> > > > > > --
> > > > > > David Maus
> > > > > > Herzog August Bibliothek - D-38299 Wolfenbuettel
> > > > > > Bibliothekarische IT / Digital Humanities
> > > > > > Phone: +49-5331-808-317
> > > > > > Email: maus(a)hab.de
> > > > > >
> > > > > > PGP Key 0x7B4F5A762AF6FBA6
> > > > > > Fingerprint DD38 8D2E 34C1 94DE 2058 69BE 7B4F 5A76 2AF6
> FBA6
> > > > > >
> > > > > >
> > > > >
> > > > > --
> > > > > David Maus
> > > > > Herzog August Bibliothek - D-38299 Wolfenbuettel
> > > > > Bibliothekarische IT / Digital Humanities
> > > > > Phone: +49-5331-808-317
> > > > > Email: maus(a)hab.de
> > > > >
> > > > > PGP Key 0x7B4F5A762AF6FBA6
> > > > > Fingerprint DD38 8D2E 34C1 94DE 2058 69BE 7B4F 5A76 2AF6 FBA6
> > > > >
> > > >
> > > >
> > >
> > > --
> > > David Maus
> > > Herzog August Bibliothek - D-38299 Wolfenbuettel
> > > Bibliothekarische IT / Digital Humanities
> > > Phone: +49-5331-808-317
> > > Email: maus(a)hab.de
> > >
> > > PGP Key 0x7B4F5A762AF6FBA6
> > > Fingerprint DD38 8D2E 34C1 94DE 2058 69BE 7B4F 5A76 2AF6 FBA6
> > >
> >
> >
>
> --
> David Maus
> Herzog August Bibliothek - D-38299 Wolfenbuettel
> Bibliothekarische IT / Digital Humanities
> Phone: +49-5331-808-317
> Email: maus(a)hab.de
>
> PGP Key 0x7B4F5A762AF6FBA6
> Fingerprint DD38 8D2E 34C1 94DE 2058 69BE 7B4F 5A76 2AF6 FBA6
>