Beratung Hierarchiestufe hoeher

Dr. Marianne Dörr
Bayerische Staatsbibliothek

Bericht zur Frankreich-Reise (thematischer Schwerpunkt: Digitalisierung von Altbeständen) vom 26.10. – 3.11.1998

Programm und Ablauf:

26.10.98
    Sous-direction des bibliothèques et de la documentation

    Michèle Mathieu, Begrüßung, Administratives (Bourse)

Abreise nach Orléans (zus. mit Charlette Buresi, Sous-direction)

ab 15.00
   Orléans, IRHT (Institut de recherche et d'histoire de textes)
    Gesprächspartner: Odile Lepinay, Claudia Rabel

Das IRHT ist ein Institut des frz. CNRS (Centre National de la Recherche Scientifique). Aufgabe des IRHT ist das Studium der mittelalterlichen Handschriften unter all ihren Aspekten. Ein Projekt, das vom IRHT durchgeführt wird, hat die Verfilmung aller in französischen Bibliotheken vorhandenen mittelalterlichen Handschriften zum Ziel. Zusätzlich zur s/w-Verfilmung der Gesamthandschrift werden die Illustrationen in Farbe und s/w verfilmt. Aus dieser Verfilmung der Illustrationen ist eine Photothek mit rd. 100.000 Dias (Kodachrome 24x36) entstanden. Die Digitalisierung setzt auf diesem Programm und diesem Fundus auf. Ein gemeinsames Projekt der Abteilung Informatik, der Abteilung Photographie und der Sektion Sources iconographiques zur Digitalisierung entstand 1993 und ist seit 1996 bei der Arbeit.

Am 26.10. standen inhaltliche Fragen der Erschließung und der daraus resultierende Datenbank-Aufbau im Vordergrund. Das IRHT hat eine Taurus-Datenbank mit Namen Initiale aufgebaut, die ein Mehrdateien-System zur Beschreibung auf der Ebene des Codex, des Werks (Ms.) innerhalb des Codex und der Illustrationen des Einzelwerks erlaubt.
Vorgeführt wurde neben der Datenbank selbst die Vorarbeiten für die Erschließung: Für jedes Manuskript wird eine Excel-Datei erstellt, in der eine Verwaltungsnummer, die Provenienz, die Signatur, die einzelnen Illustrationen und bereits Erschließungs-/Beschreibungselemente zu den einzelnen Illustrationen (z.B. "Verkündigungsszene") aufgenommen sind. Bei kooperativen Projekten – wie z.B. das mit der Bibliothèque Ste. Geneviève (s.u. Besuch am 3.11.) – erhält die Bibliothek diese Datei mit den Bildern und kann sie als Basis für die eigene Erschließung nutzen.

27.10.98  Gesprächspartner: Gilles Kagan

Der zweite Tag war der Technik und praktischen Durchführung der Projekte gewidmet. Das IRHT hat sich – nach früheren Versuchen mit proprietären Formaten wie der Kodak CD seit einiger Zeit auf das auch im internationalen Rahmen verbreitetere Verfahren umgestellt: Zunächst werden TIFF-Bildern als Archiv-Versionen erstellt, ausgehend von denen wird eine JPEG-Version erzeugt. Vorgestellt wurden die unterschiedlichen Geräte, die im Einsatz sind (Flachbettscanner, Durchlicht-Scanner für Diapositive, PhaseOne als digitale Kamera). Außerdem wurden bereits Erfahrungen mit dem Problem des Farbmanagements gemacht, hier ist eine Software von AGFA (Colortune) im Einsatz. Die Arbeit mit dem Dia-Scanner und die darauf folgende Qualitätskontrolle wurden von Herrn Kagans Mitarbeiter praktisch demonstriert.

28.10.98
Paris: Bibliothèque interuniversitaire de Médecine (zus. mit C. Buresi)
Gesprächspartner: Jacques Gana, Magali Vène

An der BIUM sind verschiedene Projekt zur Digitalisierung in Arbeit:
1. Retrospektive Katalogkonversion (Imagekatalog):
Die BIUM besitzt einen alten, handgeschriebenen Zettel-Katalog (kein normiertes Format) auf teilweise farbigen Kärtchen. Der Zustand der Katalogkarten ist so schlecht, daß die Benutzung nur über die bibliothekarischen Mitarbeiter erfolgen kann, was natürlich umständlich und zeitaufwendig ist. Deshalb wird dieser Katalog, der ca. 366.000 Karten umfaßt, nun digitalisiert. Eine Auftragsfirma ist in den Räumen der BIUM dabei, die Kärtchen zu scannen. Die Auflösung beträgt 200 dpi mit 256 Graustufen. Eine so erzeugte Datei hat ca. 200 KB. Durch Komprimierung wird die Dateigröße auf 8 – 14 KB reduziert. Zusätzlich wird eine Zeichenkette von 25 Zeichen (normalerweise Autorname und Erscheinungsjahr) als Text, also suchbar, erfaßt. Die weitere Aufbereitung (Erzeugung der Netzversion im JPEG-Format mit reduzierter Auflösung, Einbringen in eine Filemaker Pro -Datenbank) wird von der Bibliothek in Eigenleistung erbracht.

2. Bilddatenbank
Im zweiten Projekt geht es um den Aufbau einer Bilddatenbank mit ca. 10.000 Bilder der Medizingeschichte. Der Ausgangspunkt sind vorwiegend Fotos (Papierabzüge) bzw. Dias. Zunächst wurden etwa 300 Beispiele selbst auf einem Flachbettscanner gescannt; für die Masse soll nun aber ebenfalls ein Dienstleister herangezogen werden. Die Suche ist sowohl auf Werk als auch auf Imageebene möglich. Die Treffer werden zunächst als Thumbnail mit den zugehörigen bibliographischen Daten angezeigt, auf Mausclick ist die vergrößerte Ansicht verfügbar.

3. Virtuelle Ausstellungen.
Da die BIUM aus räumlichen und sicherheitstechnischen Gründen keine Ausstellungen mit Originalmaterialien veranstalten kann, kam die Idee auf, dann die Ausstellungen gleich ins Web zu verlegen. Aktuell wird eine Ausstellung mit Frontispizen wichtiger Werke der Medizingeschichte aus dem 16. / 17. Jahrhundert erstellt. Dabei werden nicht nur medizingschichtliche, sondern gleichzeitig auch noch buchhistorische Informationen vermittelt. Für die Bereitstellung werden Frontpage und Macromedia eingesetzt.

29.10.98
Paris: Muséum National d'Histoire Naturelle
Gesprächspartner: Véronique van de Ponseele

Das Muséum National D'Histoire Naturelle baut in Zusammenarbeit mit dem Musée d'Homme eine Bilddatenbank zu historischen Darstellungen aus der Botanik auf. Als Ausgangspunkt dienen ca. 7.000 Bilder (Dias, Ectachrome, s/w-Fotografien), die aus systematischen Verfilmungsaktionen bzw. durch Benutzerbestellungen resultieren. Die Digitalisierung wurde durch einen Dienstleister realisiert, die Speicherung und Bereitstellung erfolgt mittels des proprietären Kodak-Photo-CD-System. Ca. 100 Bilder passen auf eine CD. Bis jetzt wurden 4.300 Bilder ins System eingebracht, die in einer Jukebox bereitgestellt werden. Die Erschließung erfolgt durch eine einschlägig vorgebildete Doktorandin. Sowohl der wissenschaftliche Name als auch die volkssprachliche Bezeichnung (mit Synonymen), die Pflanzenfamilie und –klasse sind suchbar. Für jedes Suchfeld kann aus einem Index ausgewählt werden. Als Datenbank-System ist Taurus im Einsatz, das auch vom IRHT in Orléans benutzt wird. Aktuell kann die Datenbank nur über die zuständige Mitarbeiterin benutzt werden, eine Benutzeroberfläche für das freie Angebot in der Bibliothek ist jedoch in Arbeit.
Weiterhin ist ein Projekt zum Thema Zoologie in Kooperation mit der BnF geplant. Nach einer gemeinsamen Titelauswahl sollen die entsprechenden Illustrationen verfilmt werden. Die BnF soll dann die Digitalisierung übernehmen und die Bilder zusammen mit einer groben Erst-Erschließung zurückliefern, damit im Museum dann die tiefere Erschließung vorgenommen werden kann.

30.10.98
Lyon: Bibliotheque Municipale
Gesprächspartner: Yvette Weber und Pierre Guinard

In Lyon wird von der Abteilung Regional-Dokumentation seit den siebziger Jahren ein Presse-Archiv zu ca. 200 Themen betreut. Die Artikel wurden auf DINA4-Format kopiert und gebunden. Sie sind im Lesesaal zugänglich.
1993 entschloß man sich, diese Dokumentation zu automatisieren. Eine retrospektive Digitalisierung wurde und wird aus Kosten- und Effizienzgründen nicht angestrebt. Aber die neuen Materialien wurden gleich elektronisch erfaßt. Auch hier ist eine Taurus-Datenbank im Einsatz, über die auf die Artikel zugegriffen werden kann. Die Erschließung erfolgt über einen Thesaurus, dem das frz. Sacherschließungsverfahren RAMEAU zugrundeliegt (Ketten wurden jedoch nie gebildet). Allerdings wurde diese Basis durch zahlreiche regionale Namen und Begriffe bereits sehr weitreichend ergänzt.
Die Digitalisierung erfolgt auf einem Flachbett-Scanner, für die Erschließung werden weiterhin Ausdrucke bzw. Kopien verwendet. Da die Erschließung ohne zusätzliches Personal geleistet werden muß, gibt es hier Rückstände von ca. 1 Jahr. Die Datenbank ist an bestimmten Arbeitsplätzen in der Bibliothek zugänglich.
Ein Problem liegt in der juristischen Situation: Eine Einigung mit den wichtigsten ausgewerteten Zeitungen wurden versucht, allerdings konnte kein Abkommen getroffen werden. Die Dokumentation wird von den Verlagen bis jetzt toleriert, teilweise von den Zeitungen selbst genutzt, da hier auch viel an grauer, schwer zugänglicher Literatur ausgewertet wird, aber zu einer vertraglichen Regelung, die zum Präzedenz-Fall für weitere Nutzungen werden könnte, wollte sich noch kein Verlag entschließen.

Weitere Projekte sind in der Abteilung für den Altbestand angesiedelt. Zum einen ist eine Mitarbeit an einem BnF-Projekt zum 16. Jh. (1520 – 1580) geplant. Die BM ist Pôle associé de la BnF für den Bereich Buchgeschichte. Auch hier ist geplant, daß die BnF die technische Durchführung der Digitalisierung übernimmt.
An einem europäischen Projekt DEBORA will die BM für das 16. Jahrhundert teilnehmen. Außerdem sollen in einem regionalzentrierten Projekt Arassh (Agence Rhone-Alpes Sciences Sociales et Humaines) Illuminationen des 16. Jahrhunderts digitalisiert werden.
Die BM will ca. 500 – 600 Kunstdrucke und 700 Plakate digitalisieren. Ausgangspunkt hier sind Dias (eingesetzt wird ein Nikon-Scanner, der ein Abarbeitung von bis zu 50 Dias erlaubt), aber es wurde auch ein neuer Epson Flachbettscanner für eine Direktdigitalisierung angeschafft. Die Digitalisierung soll in der Reproduktionswerkstatt selbst durchgeführt werden. Bei den Plakaten wird aufgrund des geringen Detailreichtums der Vorlage auch eine gute Bildschirm-Ausgabequalität erreicht. Bei anderen Versuchen der Digitalisierung von Handschriften, ebenfalls ausgehend vom Mikrofilm, wurde allerdings teilweise zuwenig auf die Auflösung geachtet, so daß hier manchmal Probleme mit der Lesbarkeit entstehen bzw. nachgearbeitet werden muß.

2.11.98
Paris: Bibliotheque Nationale de France
Gesprächspartner: Dominique Maillet, Gérard Cathaly, Jean-Didier Wagneur, Lionel Micault

An der BnF wurde ich trotz des noch herrschenden Streiks im Service de la numérisation empfangen. Die Leiterin, Dominique Maillet, gab zunächst einen Überblick über die Organisationsgeschichte der Abteilung, die im Rahmen des Projekts des Etablissement public, also der Neukonzeption der Très Grande Bibliothèque gegründet. Nach einer anfänglichen Aufspaltung der einzelnen Elemente der Digitalisierung auf verschiedene Abteilungen des Hauses fand vor einem Jahr eine Neustrukturierung statt. Unter dem Begriff Digitale Bibliothek wurden nun alle Teilaspekte zusammengefaßt; der Gesamtbereich gehört zur Großabteilung Services et Réseaux (Dienste und Netze). Nur die Digitalisierung von Tondokumenten liegt bei der Abteilung Audiovisuelles.
Der Vorbereitung und Planung von Digitalisierungsprojekten ist künftig so konzipiert:
Aus den Sammlungsabteilungen kommen (inhaltliche) Vorschläge, die einem Leitungsgremium vorgelegt werden. Hier wird eine Erst-Auswahl getroffen. Für ins Auge gefaßte Projekte wird ein Projektleiter ernannt, der eine Studie mit den für die Planung und Durchführung relevanten Daten erstellt: Menge der Bilder / Daten, zu leistende Erschließungsarbeiten, vorhandene Vorarbeiten etc. Aufgrund der so erstellten Aufwandsabschätzung kann dann eine endgültige Entscheidung für oder gegen das Projekt erfolgen. Für die Durchführung der Projekte wird ein Zeitrahmen von drei Jahren veranschlagt. Geplant ist, jedes Jahr ca. 10.000 Werke und ca. 30.000 – 40.000 Bilder zu digitalisieren. Auf dieser Planungsgrundlage wird auch das Budget der Abteilung beantragt.
Die Digitalisierung selbst wird grundsätzlich outgesourct. Soll die Digitalisierung vom Film vorgenommen werden, wird die Filmvorlage jedoch vom Reproduktionsservice der BnF erstellt. Die Vorgaben für die Digitalisierung, die Qualitätskontrolle, die Erschließung und die Bereitstellung werden natürlich von der Abteilung erstellt.
Von den anvisierten Großprojekten (Projekt der 100.000 Werke, die sich im Laufe der Arbeit aus rechtlichen und anderen Gründen auf 86.000 reduzierten, und dem Projekt der 300.000 Bilder) ist das Textprojekt abgeschlossen, das Bildprojekt ist teilweise aufgrund von Verzögerungen bei der Erschließung noch in Arbeit.

Zu technischen Fragen der Durchführung informierte der Stellvertreter von D. Maillet, Gérard Cathaly. Die BnF digitalisiert nicht selbst, sondern vergibt die Aufträge an Dienstleister. Als Vorgaben dienen die inzwischen international akzeptierten Standards (TIFF für die Masterversionen, reduzierte Netzversionen) Aufgrund der riesigen Mengen des Vorlagen-Materials ist das Vorgehen eher pragmatisch, d.h. es wird nicht die maximal mögliche Qualität, sondern die für die Vorlage ausreichende Qualität angestrebt. Texte wurden bitonal gescannt mit 300 bis 400 dpi Auflösung (40% der Vorlagen wurden direkt gescannt; 60% vom Mikrofilm).
Beim Bildprojekt sind drei Dienstleister tätig, die mit Flachbett-Scannern, digitalen Kameras und Filmscannern arbeiten. Die Auflösung variiert hier stark abhängig von der Vorlage.
Als interessanten Aspekt für die mittelfristige Achivierung wurde eine CD aus glasähnlichem Material vorgestellt, die vom Material her garantiert unveränderlich ist, so daß die ständige Überprüfung, ob die CD noch lesbar ist, entfällt. Natürlich ist damit nicht das Problem der im Lauf der Zeit wechselnden Formatstandards, die regelmäßige Migrationen erfordern werden, gelöst.

Auswahl
Über die Auswahl der Bestände für das Textprojekt informierte Herr Wagneur, der die im Zuge der Auswahl erstellte Filemaker- Datenbank vorführte, die immer noch weiter ergänzt wird. Hier sind Abfragen nach allen möglichen Kriterien (Autoren, Schulen, Umfeld, Texte, Thema, Gattungen..) möglich, so daß eine Basis für Erweiterungen in alle Richtungen gegeben ist.
Die Datenbasis umfaßt derzeit ca. 27.000 Eintragungen. Sie wurde in fünfjähriger Arbeit erstellt.

Programmierung Gallica
Zum Schluß erklärte Herr Micault die Gallica-Programmierung, die er in ca. 3 Monaten realisiert hat. Verwendet wurden weitgehend einfache Tools, wie z.B. als Suchmaschine der frei im Netz verfügbare Microsoft Index Server. Die Bilder in Gallica werden on the fly von TIFF G4 in PDF konvertiert. Die Zugriffsstatistik auf Gallica weist etwa 6000 Suchen pro Tag aus. Interessant ist besonders auch das Mitschneiden der häufigsten Sucheinstiege: eine deutliche Präferenz für die Autoren- und die Freitext-Suche in den Bildunterschriften ist erkennbar.

3.11.1998
Paris: Bibliothèque Sainte Geneviève
Gesprächspartner: Mme Delamur und Véronique deKok

In der B. Ste Genevieve wurde die Bibliotheksseite des Projekts vorgestellt, das in Kooperation mit dem IRHT Orléans betrieben wird. Als Ausgangspunkt diente eine ab 1992 durchgeführte Verfilmungsaktion aller mittelalterlichen Miniaturen. 1996 begannen Kooperationsgespräche mit dem IRHT. Die Digitalisierung erfolgt über das IRHT, die Erschließung soll von der Bibliothek geleistet werden. Der Umfang des Gesamtprojekts wird auf 380 CD-R mit etw 15.200 Bildern geschätzt. Die Bibliothek hat sich in der letzten Zeit vorwiegend mit der Frage der Systemauswahl und der Erstellung eines ausführlichen Pflichtenhefts beschäftigt. Für die Softwareseite stehen ca. 300.000 FF zur Verfügung; Hardware (zwei Server-Maschinen und zwei hochauflösende Bildschirme) wurde bereits beschafft. Als Grunderfordernisse gelten, daß ein relationales Datenbanksystem mit Mehrdateienverwaltung unter Windows 95 eingesetzt werden soll Zum Besuchszeitpunkt schien eine Tendenz für eine auf Fulcrum basierende Lösung absehbar. Die Erschließung der vom IRHT gelieferten Bilder soll – so lange das endgültige System noch nicht zur Verfügung steht – durch Erweiterung der vom IRHT mitgelieferten Excel-Sheets weitergetrieben werden. Da die personellen Kapazitäten der Bibliothek für die Erschließung nicht ausreichen, sollen hier qualifizierte Hilfskräfte eingesetzt werden.

Die Reise wurde mit einem kurzen Abschiedsbesuch bei Michèle Mathieu und Charlette Buresi in der Sous-direction beschlossen.


Seitenanfang