Liebe METS-Kundige,
wir sind dabei, chinesische, japanische und mandschurische Blockdruckbücher zu
digitalisieren. Hierbei möchten wir genau wie bei mitteleuropäischen Drucken auch die
inhaltliche Struktur (logicalstructMap) zur Navigation verwenden. Probleme entstehen
jedoch in der vorhandenen Hierarchie der physischen Struktur:
Ein Titel ist in mehrere "Rollen" (chin: juan, jap: maki) physisch gegliedert;
bei jeder Rolle setzt die Seitenzählung neu an. Diese physische Gliederung läuft
unabhängig von der logischen Gliederung, d.h. eine Rolle kann ein oder mehrere Kapitel
enthalten, ein Kapitel oder Abschnitt (z.B. Abteilung "Gräser" in einem Buch zu
medizinischen Ingredenzien) kann auch über mehrere Rollen gehen.
Bei Zitaten aus solchen Werken wird jeweils Titel, Rolle und Seite angeben, also z.B.
Bencao gangmu, juan 4, S. 3r-10v. Anbei ein Link zu einem Image einer ganzen chinesischen
Blockdruck-Seite (normalerweise ist diese Seite in der Mitte gefaltet und die offenen
Enden sind mit einem Faden mit anderen Blättern zusammengebunden). In der Mitte findet
sich eine Art "running title" mit der Angabe der Rolle (in der Mitte) und
darunter die Seite. Oben wird hier noch der Buchtitel angegeben und neben der Rollenangabe
der Kapiteltitel:
http://res4.nlc.gov.cn/home/pdfRead.trs?marcid=MzEyMDAxMDc2NTg0&channel…
In der Regel findet man also bibliographisch mitgeliefert immer Rollen- und Seitenangabe.
Wie beschrieben ist die logicalStructMap weiterstgehend unabhängig von der physischen
Struktur der Rollen, so dass beide Angaben nicht vermengt werden können. Soweit wir das
richtig interpretieren, ist in der physStructMap oberhalb der Seitenebene keine weitere
Hierarchie als "physSequence" zugelassen. im ZVDD-Profil heißt es dazu:
"Innerhalb des physischen <structMap> Elements wird die Seitenstruktur durch
<div> Elemente wiedergegeben, die einem obersten <div>Element untergeordnet
sind. Dieses oberste <div> Element umfasst die Seiten, die die bibliographische
Einheit repräsentieren. Daher muss dessen TYPE Attribut immer den Wert
"physSequence" besitzen.
Die darunterliegenden Strukturelemente repräsentieren die Seiten bzw. den Einband. Einband
und Seiten werden auf derselben hierarchischen Ebene angesiedelt. Im Fall einer
Seiten-Repräsentation enthält das jeweilige <div> Element den Wert "page"
im TYPE Attribut. Eine weitere Verschachtelung bspw. zum Abbilden von Seitenbereichen wie
Spalten etc. ist ebenfalls denkbar und können als den Seiten untergeordnete <div>
Elemente implementiert werden. Der DFG-Viewer berücksichtigt entsprechende <div>
Elemente unterhalb der Seitenebene jedoch nicht."
Daher erschien uns die beste Lösung, die volle Information im ORDERLABEL einer jeden Seite
unterzubringen. Dann werden die notwendigen Angaben zu einer Seite auch im DFG-Viewer
ausgewertet. Rein von der Definition sehen wir eigentlich keinen Widerspruch, da in
ORDERLABEL ein string stehen kann. Dann hätten wir z.B. folgende Formulierung für zwei
aufeinander folgende Seiten:
<... ID="PHYS_0107" ORDER="107" ORDERLABEL="juan 4, 3a"
TYPE="page"> und <... ID="PHYS_0108" ORDER="108"
ORDERLABEL="juan 4, 3b" TYPE="page">
Hat von Ihnen jemand bereits ein vergleichbares Buch beschrieben? Gibt es Erfahrungen oder
Hinweise aus tieferer METS-Kenntnis?
Mit besten Grüßen
Maria Federbusch und Martina Siebert
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz