Ute Winter
Was das
Magazin für die gedruckten Werke einer Bibliothek, ist der Archivserver für die
virtuelle Bibliothek. Dieser Beitrag will eine Zusammenstellung von
Fragenkomplexen sein, die im Zusammenhang mit der Konzeptionierung eines
Archivservers auftauchen, er soll aufzeigen, welche Funktionen dieser Server
hat, welche Arbeitsbereiche damit verknüpft sind und nicht zuletzt, welche
Probleme dabei auftauchen. Antworten kann und will der Beitrag keine geben, für
manche Bereiche werden gerade Standards entwickelt (so in den Fragen der
Dateiformate), wieder andere Bereiche werden noch in Projekten erforscht (z.B.
die Frage der Langzeitarchivierung von Multimedia-Dateien) und wieder für andere
lassen sich nur hochschulspezifische Antworten finden, da die Gegebenheiten und
Ziele jeder Hochschule anders geartet sind.
In einem Artikel zum Bibliothekartag stand in einer Freiburger
Zeitung zu lesen: „Internet - die neue Bibliothek von Babel“. Und an
babylonische Sprachverwirrung grenzt es fast, wenn man sich nur die Namen
betrachtet, die einem im Bereich virtuelle Bibliothek für den Archivserver begegnen:
Depotserver, Dokumentenserver, Objektserver, Medienserver, um nur einige zu
nennen. Alle meinen irgendwie dasselbe, jedoch mit Unterschieden, je nachdem ob
sie den Inhalt des Servers oder mehr die Funktion des Servers betonen wollen.
Der englische Begriff „repository“ bezeichnet die Funktion eines Archivservers,
nämlich als Magazin, Aufbewahrungsort oder Vorratskammer. Die Aufgaben eines
Archivservers sind also vorrangig die der Speicherung, Verwaltung und Langzeitarchivierung,
eben eine Art „Archiv“. Zusätzlich kommen noch Funktionen als Webserver hinzu,
weil die aufbewahrten Dateien im Web angezeigt werden sollen, und je nach
verwendeter Software die eines Datenbankservers. Vom Inhalt her wird oft in
erster Linie an Textdokumente gedacht, die mit einem Dokument-Managementsystem
erschlossen werden, so dass die Bezeichnung Dokumentenserver zutreffend ist.
Hierzu die Definition von D. Ohst:
„Ein Dokumentenserver ist Hardware und Software zur Speicherung, Verwaltung,
Archivierung, Recherche und Präsentation digitaler Dokumente.“
Medien und Objekte als Inhalt gehen schon weiter: nicht mehr nur
reine Textdateien, sondern alle Arten von multimedialen Dateien sollen
archiviert werden. Das Datenbanksystem für solches Archiviergut ist meistens
sehr viel umfassender als bei einem reinen Dokument-Managementsystem und
benötigt deshalb einen eigenen Server. Archiviert wird nicht nur die Datei an
sich, sondern auch die dazugehörigen Metadaten, die beschreibenden Daten, die
Abstracts, Verifizierungen wie digitale Signatur, Zeitstempel u.ä. Alle diese
Daten befinden sich in einem sogenannten Datencontainer. Verläßlichkeit des
Zugriffs und gute Performancezeiten sowie die inhaltliche Qualität des Angebots
auf dem Archivserver sind Voraussetzungen für die Akzeptanz seitens der Nutzer.
Weitere Anforderungen nach D.
Ohst sind: „Die Integrität der Daten ist sicherzustellen, die Authentizität
muss jederzeit intern als auch extern nachprüfbar sein. Ein umfassendes
Backup-Konzept ist vorzusehen. Der Zugriffs- und Lizenzschutz für Dokumente
muss gewährleistet werden. Sowohl Hardware als auch Software sind ständig
hinsichtlich neuer oder veränderter Bedingungen zu überprüfen und
gegebenenfalls anzupassen.“
Was soll nun aber archiviert werden, was ist archivierungswürdig?
Hier sollte jede Hochschulbibliothek ein eigenes Konzept entwickeln. Mit
welchen elektronischen Dateien kann sie z.B. das schon vorhandene Web-Angebot
an Daten sinnvoll ergänzen? Welche Spezialbestände kann sie einbringen? Was
kann sie überhaupt vom Arbeitsaufwand her leisten? Unbestritten ist hier wohl
bei allen Hochschulbibliotheken, dass hier vorrangig die Publikationen der
eigenen Hochschule archiviert werden sollten, alle Arten von Abschlussarbeiten
(Dissertationen, Magisterarbeiten, Diplomarbeiten), Forschungsberichte,
Unterrichtsmaterialien, virtuelle Kurse, Universitätsreden und dergleichen
mehr. Diese Arbeiten liegen meist schon in digitalisierter Form vor. Darüber
hinaus kann man wertvolle alte Bestände, Sonderbestände, Landkarten
digitalisieren, multimediale Lernmaterialien (Bild-, Ton- und Videodateien)
anbieten, und durchaus denkbar das gesamte Verwaltungsschrifttum der
Universität mit dem Vorteil, dass es dann durch ein Datenbanksystem erschlossen
ist und somit die Informationen allen Mitarbeitern zur Verfügung stehen. Dann
muss der Archivserver ins Intranet eingebunden werden und der interne Bereich
durch Sicherungsmaßnahmen (IP-Check, Passwortabfrage) gegen Zugriffe von
Nichtautorisierten abgesichert werden. Durch die Einbindung des Archivservers
ins WWW wird eine weltweite Verfügbarkeit rund um die Uhr von jedem Ort
erreicht, die Idealvorstellung einer Virtuellen Bibliothek. Sinnvoll ist es,
die Darstellung auf dem Bildschirm - wer liest schon 500 Seiten online? - durch
das Angebot von Downloadfiles zu ergänzen.
Wer arbeitet nun eigentlich innerhalb der Universität mit dem
Archivserver? Welche Bereiche innerhalb der Universität sollten kooperieren und
als Partner zusammenarbeiten, damit der Archivserver attraktiv, gut organisiert
und leicht zu nutzen ist?
Die Bibliothek macht, was sie schon immer gemacht hat: verwalten,
d.h. erwerben, erschließen, zur Verfügung stellen und bewahren. Das
Rechenzentrum übernimmt die technische Betreuung der Hard- und Software,
entwickelt professionelle Backup-Konzepte, ist in die Datenbankprogrammierung
und
–generierung involviert, kümmert sich um die technischen Aspekte des Zugriffs-
und Lizenzschutzes. Und der dritte große Partner, das sind die Wissenschaftler,
die Professoren und Studenten. Sie liefern die Inhalte, die auf dem
Archivserver abgelegt werden sollen. Gleichzeitig nutzen sie den Archivserver
zur Recherche nach Inhalten und Fakten und produzieren daraus wieder neue
Dateien, die archiviert werden.
Schauen wir uns nun einmal die Bibliotheksarbeitsbereiche genauer
an, so werden wir feststellen, dass kaum eine Abteilung nicht mit dem
Archivserver mehr oder weniger stark befasst ist: die Fotostelle übernimmt die
Digitalisierung, also das Scannen der gedruckten Vorlagen und die Texterkennung
mittels OCR, bei der Tausch- und Geschenkstelle kommen die Elektronischen
Dissertationen an, die Fachreferenten treffen eine Auswahl und systematisieren
und schreiben Abstracts, die Bibliotheks-EDV hält Kontakt zum Rechenzentrum,
erarbeitet die technische Gesamtkonzeption und die Geschäftsgänge, unter
Umständen liegt hier auch die Datenbankbetreuung, die elektronischen Objekte
müssen katalogisiert werden, die Öffentlichkeitsarbeit macht das neue Dienstleistungsangebot
bekannt, die Benutzung muss mit Rat und Tat bei Problemen zur Stelle sein und
die Schulung der Nutzer im Umgang mit dem Archivserver übernehmen. Hinzu kommt
eine für die Bibliotheken neue Aufgabe: die der Verlagsarbeit. Übernimmt die
Bibliothek Verlagsaufgaben für die Universität, muss sie auch dessen gewahr
sein, Verlagsarbeit leisten zu müssen, wie Marketing, Werbung und
Autorenbetreuung.
Aus der Anzahl der in den Arbeitsprozess involvierten Abteilungen
ergibt sich die zwingende Forderung, den Umgang mit dem Archivserver so einfach
zu gestalten, dass jeder damit arbeiten kann, ohne dass die Integrität der
Daten auf dem Archivserver in Gefahr gerät. Die Forderung, dass nur wenige
Personen mit bzw. auf dem Archivserver arbeiten, lässt sich innerhalb der Bibliothek
angesichts der umfassenden Aufgaben nicht durchsetzen. Es müssen also für die
interne Verwaltungsarbeit einfache Interfaces entwickelt werden.
Man kann jede Menge Probleme benennen und beschreiben, aber es
gibt noch keine allgemeingültigen Lösungen - die Lösungen ergeben sich aus den
hochschulspezifischen Anforderungen und Schwerpunkten. Hier stehen dann oft
kleinere Universitäten und Bibliotheken ohne ausreichende Technikinfrastruktur
(Rechenzentren) vor schier unlösbaren Problemen. Die Lösung der Probleme
erfordert einen konstruktiven Dialog mit den Wissenschaften (in Erfurt
moderiert vom Zentrum für Kommunikation und Infrastruktur als zentraler
Universitätseinrichtung) und den Rechenzentren (als Ansprechpartner mit dem
nötigen Know-How für Computer- und Netztechnik und Datenverarbeitung).
Ein großes Problemfeld läßt sich im Bereich der elektronischen
Dateien abstecken: Hierzu gehört als erstes wohl die Formatfrage: Abgabeformat,
Archivierungsformat, Präsentationsformat und Download-Formate müssen erzeugt
und parallel verwaltet werden. Dies bedeutet eine Menge an
Konvertierungsarbeit, die auf die Bibliotheken zukommt, weil es noch keine 100%
automatische Konvertierung gibt. Jede Datei muss nach der Konvertierung
mühevoll manuell nachbearbeitet werden. Dann die Frage: Wer soll die
Metadaten-Erfassung übernehmen: Bibliothek (Fachreferat und Katalogisierung)
oder der Autor selber? Wie können die Daten in den OPAC oder vom OPAC in das
eingesetzte Datenbankprogramm übernommen werden?
Das Versionsmanagement bei den Dynamic Documents gestaltet sich
schwierig, weil diese Dokumente ja nicht statisch sind, sondern von einer
fortgesetzten Diskussion leben. Soll man also jede Version archivieren oder nur
die jeweils aktuelle? Welche Programme müssen für die Präsentation multimedialer
Dateien angeboten werden bzw. zusammen mit den Dateien archiviert werden? Die
Bibliothek muss in der Lage sein, die Garantien für die Authentizität und
Integrität der abgegebenen Dateien auch technisch leisten zu können. Sie muss
z.B. die Datei mittels einer digitalen Signatur oder eines digitalen
Wasserzeichens kennzeichnen, um beabsichtigte oder unbeabsichtigte Manipulationen
am Inhalt der Datei zu verhindern. Die Bibliothek muss nicht zuletzt für eine
gewisse inhaltliche Qualität der archivierten Datei bürgen. Ein weiteres
Problem ist die Frage der Langzeitarchivierung. Hier existieren schon
verschiedene Modellvorstellungen. Beim ersten Modell, dem Migrationsmodell,
werden die Objekte von einer Hard- und Software-Umgebung in eine neue Umgebung
integriert. Der Nachteil ist, dass die Gefahr besteht, dass die Objekte dabei
nicht unverändert bleiben. Beim Emulationsmodell bleiben die Objekte selbst
unverändert, die neue Hard- und Software-Umgebung bildet dann die
ursprüngliche Umgebung nach. Bei dem dritten Modell des Technikmuseums
schließlich werden die unveränderten Objekte in einer unveränderten Hard- und
Software-Umgebung aufbewahrt.
Als weitere Problemfelder lassen sich sowohl psychologische,
technische, juristische, organisatorische als auch softwareseitige benennen.
Als psychologische Probleme wären die mangelnde Akzeptanz seitens
der Nutzer (und auch der Bibliotheksmitarbeiter) zu nennen. Diese unzureichende
Akzeptanz elektronischer Medien resultiert oft aus einer Unkenntnis über die
Einsatzmöglichkeiten z.B. einer Volltextsuchmaschine und/oder fehlenden
technischen Fähigkeiten beim Umgang mit PC und Programmen. Hieraus ergibt sich
die Forderung nach möglichst einfachen Bedienoberflächen: einfach hinsichtlich
Einheitlichkeit (eine Bedienoberfläche für alle Funktionen) und Verständlichkeit.
Durch gezieltes Marketing und Öffentlichkeitsarbeit läßt sich die Akzeptanz
sicher genauso erhöhen wie durch vermehrte Einführungs- und Schulungsprogramme.
Eine ketzerische Frage drängt sich hier aber auf: Erzeugt man durch dieses
Marketing nicht einen künstlichen Bedarf für etwas, das eigentlich so gar nicht
benötigt wird?
Technische Probleme wie Lizenzverwaltung, Absichern
nichtöffentlicher Bereiche durch IP-Check und/oder Passwortabfrage,
Backup-Systeme und ähnliches sind wesentlich leichter lösbar. Es gibt für fast
alles eine Lösung. Eng mit der eingesetzten Technik verbunden sind Probleme im
Zusammenhang mit der einzusetzenden Software: hierbei ist vor allem die Frage
der Software-Auswahl zu nennen. Welche ist für die Zwecke der Bibliothek am
geeignetsten? Wieviele Datenbanklizenzen müssen gekauft werden? Die
Beantwortung solcher Fragen kann nur in enger Zusammenarbeit mit dem
Rechenzentrum erfolgen. Die Verflechtung der Fragen, die einerseits bibliothekarische
Anforderungen darstellen, andererseits aber mit deren technischen Umsetzungsmöglichkeiten
verknüpft sind, macht diese Kooperation zwingend notwendig.
Schwieriger wird es dann schon wieder bei den Überlegungen zur
Organisation: Wie gestalte ich den Geschäftsgang für elektronische Medien so,
dass er möglichst gut in den existierenden Geschäftsgang der Bibliothek eingebunden
ist? Wie kann die Zusammenarbeit Wissenschaft, Rechenzentrum und Bibliothek
erfolgen? Aus den auftauchenden Problemen ergibt sich, dass es wohl am
günstigsten wäre, eine Art Round Table mit Vertretern aller drei Bereiche zu
schaffen, die sich in regelmäßigen Abständen treffen, um Erfahrungen, Probleme
und Wünsche auszutauschen.
Für die juristischen Probleme: Copyright, Datenschutz wurden
zumindest schon Lösungsansätze in Projekten erarbeitet.
Im Bereich der Wissenschaften dürfte sich das Akzeptanzproblem
(ganz unterschiedlich nach Fächern: am größten noch im Bereich der
Geisteswissenschaften) als das schwierigste erweisen. Fehlender
Technikkompetenz können Schulungen und einfach gehaltene Bedienoberfläche entgegengehalten
werden. Fehlende Informationskompetenz beim Umgang mit elektronischen Daten
sind ein weiteres Problem. Solange beispielsweise unsere Nutzer und Mitarbeiter
elektronisch generierte Kurztitellisten ausdrucken, um sie danach wieder durch
Abtippen in ihre Arbeit einzufügen, solange solche Brüche in der
Informationskette an der Tagesordnung sind, solange müssen Bibliotheken auch
den Umgang mit dem PC schulen, müssen sie Dinge wie Zwischenablage und
Cut-und-Paste-Funktionen erklären. Die Wissenschaftler als Autoren sind oft zu
wenig über ihre Rechte informiert. Meist treten sie die Veröffentlichungs- und
Verwertungsrechte komplett an die Verlage ab, ohne zu wissen, dass sie hier
Verhandlungsspielraum haben. Hier muss die Bibliothek informieren und betreuen.
Die amateurhafte Erstellung von elektronischen Publikationen (Schlagwort: der
PC als Schreibmaschine) ist ein weiteres Problem, dem seitens der Bibliothek
durch intensive Autorenbetreuung und bestimmte Vorgaben hinsichtlich der
Abgabeformate und -formatierung (Erarbeiten von Document Type Definitions -
DTDs - für bestimme Dokumentformen, Style Sheets) begegnet werden kann.
Im Bereich der Bibliothek fehlt es sehr oft am nötigen technischen
Know-How, es fehlt an geeignetem Personal, um die zusätzlichen
Serviceleistungen und Arbeiten zu bewältigen, die rapide technische Entwicklung
bedeutet einen ständig wachsenden Fortbildungs- und Nachqualifizierungsbedarf
seitens der Mitarbeiter. Was in unseren Bibliotheken fehlt, ist der Digitale Bibliothekar.
„Digital librarians must thrive on change. They should read
constantly (but selectively) and experiment endlessly. They need to love
learning, be able to self-teach, and be inclined to take risks. And they must
have a keen sense of both the potentials and pitfalls of technology.“
Die technische Ausrüstung und die Informationsangebote, der gute
Wille der Mitarbeiter, das alles sind noch keine Garantien für eine effektive
Nutzung des Angebots Virtuelle Bibliothek. Was wir brauchen, sind Visionäre,
die ihre Visionen pragmatisch und praktisch umsetzen können, sind
innovationsfreudige Mitarbeiter und Nutzer ohne Berührungsängste zur Technik,
die mit dem elektronischen Angebot kompetent umgehen können. Die viele
Doppelarbeit in den einzelnen Bibliotheken muss verhindert werden durch
Koordinierung und einer Kartographierung des Wissens, z.B. könnte nach Art der
Yellow Pages ein Verzeichnis der Experten im Bereich Digitale Bibliothek
erstellt werden. Damit können dann auch kleinere Bibliotheken, die mit weniger
Personal auskommen müssen, beginnen, ihren Beitrag zum Aufbau der weltweiten,
alles umfassenden Digitalen Bibliothek zu leisten.
Literaturhinweise:
Arms, William
(u.a.): An architecture for information in digital libraries. In: D-Lib Magazine, 1997, Feb. <http://www.dlib.org/dlib/february97/cnri/02arms1.html>
Bericht der Arbeitsgruppe
Technik zur Vorbereitung des Programms „Retrospekive Digitalisierung von
Bibliotheksbeständen“ im Förderbereich „Verteilte Digitale Forschungsbibliothek“,
Red. Norbert Lossau. Sept. 1997
Hastings, Kirk
und Tennant, Roy: How to build a
digital librarian. In: D-Lib Magazine, 1996,
Nov. <http://www.dlib.org/dlib/november96/ucb/11hastings.html>
Koring, Bernhard:
Bibliotheken im Netz: Überlegungen zur Entwicklung der Universitätsbibliotheken
auf der Basis eines Interfacekonzepts. In: Zeitschrift für Bibliothekswesen und
Bibliographie, 45.1998, 4, S. 387 - 398
Ohst, Daniel:
Was ist ein Dokumentenserver: Vortrag, gehalten auf dem Kolloquium
„Elektronische Publikationen an der Humboldt-Universität zu Berlin“ am
10.6.1998. <http://dochost.rz.hu-berlin.de/projekte/epdiss/kolloqu/ohst/
ohst1.html>
Zimmer, Dieter E.:
Die digitale Bibliothek: eine Artikelserie für Nutzer und Verächter der Computernetze.
In: Die ZEIT.