Publikationen Hierarchiestufe höher Vorherige Seite

BIBLIOTHEKSDIENST Heft 9, 99

Der Archivserver

Der Archivserver

Funktionen, Arbeitsbereiche, Probleme

Ute Winter

 

Funktionen

Was das Magazin für die gedruckten Werke einer Bibliothek, ist der Archivserver für die virtuelle Bibliothek. Dieser Beitrag will eine Zusammenstellung von Fragenkomplexen sein, die im Zusammenhang mit der Konzeptionierung eines Archivservers auftauchen, er soll aufzeigen, welche Funktionen dieser Server hat, welche Arbeitsbereiche damit verknüpft sind und nicht zuletzt, welche Probleme dabei auftauchen. Antworten kann und will der Beitrag keine geben, für manche Bereiche werden gerade Standards entwickelt (so in den Fragen der Dateiformate), wieder andere Bereiche werden noch in Projekten erforscht (z.B. die Frage der Langzeitarchivierung von Multimedia-Dateien) und wieder für andere lassen sich nur hochschulspezifische Antworten finden, da die Gegebenheiten und Ziele jeder Hochschule anders geartet sind.

In einem Artikel zum Bibliothekartag stand in einer Freiburger Zeitung zu lesen: „Internet - die neue Bibliothek von Babel“. Und an babylonische Sprachverwirrung grenzt es fast, wenn man sich nur die Namen betrachtet, die einem im Bereich virtuelle Bibliothek für den Archivserver begegnen: Depotserver, Dokumentenserver, Objektserver, Medienserver, um nur einige zu nennen. Alle meinen irgendwie dasselbe, jedoch mit Unterschieden, je nachdem ob sie den Inhalt des Servers oder mehr die Funktion des Servers betonen wollen. Der englische Begriff „repository“ bezeichnet die Funktion eines Archivservers, nämlich als Magazin, Aufbewahrungsort oder Vorratskammer. Die Aufgaben eines Archivservers sind also vorrangig die der Speicherung, Verwaltung und Langzeitarchivierung, eben eine Art „Archiv“. Zusätzlich kommen noch Funktionen als Webserver hinzu, weil die aufbewahrten Dateien im Web angezeigt werden sollen, und je nach verwendeter Software die eines Datenbankservers. Vom Inhalt her wird oft in erster Linie an Textdokumente gedacht, die mit einem Dokument-Managementsystem erschlossen werden, so dass die Bezeichnung Dokumentenserver zutreffend ist. Hierzu die Definition von D. Ohst: „Ein Dokumentenserver ist Hardware und Software zur Speicherung, Verwaltung, Archivierung, Recherche und Präsentation digitaler Dokumente.“

Medien und Objekte als Inhalt gehen schon weiter: nicht mehr nur reine Textdateien, sondern alle Arten von multimedialen Dateien sollen archiviert werden. Das Datenbanksystem für solches Archiviergut ist meistens sehr viel um­fassender als bei einem reinen Dokument-Managementsystem und benötigt deshalb einen eigenen Server. Archiviert wird nicht nur die Datei an sich, sondern auch die dazugehörigen Metadaten, die beschreibenden Daten, die Abstracts, Verifizierungen wie digitale Signatur, Zeitstempel u.ä. Alle diese Daten befinden sich in einem sogenannten Datencontainer. Verläßlichkeit des Zugriffs und gute Performancezeiten sowie die inhaltliche Qualität des Angebots auf dem Archivserver sind Voraussetzungen für die Akzeptanz seitens der Nutzer.

Weitere Anforderungen nach D. Ohst sind: „Die Integrität der Daten ist sicherzustellen, die Authentizität muss jederzeit intern als auch extern nachprüfbar sein. Ein umfassendes Backup-Konzept ist vorzusehen. Der Zugriffs- und Lizenzschutz für Dokumente muss gewährleistet werden. Sowohl Hardware als auch Software sind ständig hinsichtlich neuer oder veränderter Bedingungen zu überprüfen und gegebenenfalls anzupassen.“

Was soll nun aber archiviert werden, was ist archivierungswürdig? Hier sollte jede Hochschulbibliothek ein eigenes Konzept entwickeln. Mit welchen elektronischen Dateien kann sie z.B. das schon vorhandene Web-Angebot an Daten sinnvoll ergänzen? Welche Spezialbestände kann sie einbringen? Was kann sie überhaupt vom Arbeitsaufwand her leisten? Unbestritten ist hier wohl bei allen Hochschulbibliotheken, dass hier vorrangig die Publikationen der eigenen Hochschule archiviert werden sollten, alle Arten von Abschlussarbeiten (Dissertationen, Magisterarbeiten, Diplomarbeiten), Forschungsberichte, Unterrichtsmaterialien, virtuelle Kurse, Universitätsreden und dergleichen mehr. Diese Arbeiten liegen meist schon in digitalisierter Form vor. Darüber hinaus kann man wertvolle alte Bestände, Sonderbestände, Landkarten digitalisieren, multimediale Lernmaterialien (Bild-, Ton- und Videodateien) anbieten, und durchaus denkbar das gesamte Verwaltungsschrifttum der Universität mit dem Vorteil, dass es dann durch ein Datenbanksystem erschlossen ist und somit die Informationen allen Mitarbeitern zur Verfügung stehen. Dann muss der Archivserver ins Intranet eingebunden werden und der interne Bereich durch Sicherungsmaßnahmen (IP-Check, Passwortabfrage) gegen Zugriffe von Nichtautorisierten abgesichert werden. Durch die Einbindung des Archivservers ins WWW wird eine weltweite Verfügbarkeit rund um die Uhr von jedem Ort erreicht, die Idealvorstellung einer Virtuellen Bibliothek. Sinnvoll ist es, die Darstellung auf dem Bildschirm - wer liest schon 500 Seiten online? - durch das Angebot von Downloadfiles zu ergänzen.

 

Arbeitsbereiche

Wer arbeitet nun eigentlich innerhalb der Universität mit dem Archivserver? Welche Bereiche innerhalb der Universität sollten kooperieren und als Partner zusammenarbeiten, damit der Archivserver attraktiv, gut organisiert und leicht zu nutzen ist?

Die Bibliothek macht, was sie schon immer gemacht hat: verwalten, d.h. erwerben, erschließen, zur Verfügung stellen und bewahren. Das Rechenzentrum übernimmt die technische Betreuung der Hard- und Software, entwickelt professionelle Backup-Konzepte, ist in die Datenbankprogrammierung und
–generierung involviert, kümmert sich um die technischen Aspekte des Zugriffs- und Lizenzschutzes. Und der dritte große Partner, das sind die Wissenschaftler, die Professoren und Studenten. Sie liefern die Inhalte, die auf dem Archivserver abgelegt werden sollen. Gleichzeitig nutzen sie den Archivserver zur Recherche nach Inhalten und Fakten und produzieren daraus wieder neue Dateien, die archiviert werden.

Schauen wir uns nun einmal die Bibliotheksarbeitsbereiche genauer an, so werden wir feststellen, dass kaum eine Abteilung nicht mit dem Archivserver mehr oder weniger stark befasst ist: die Fotostelle übernimmt die Digitalisierung, also das Scannen der gedruckten Vorlagen und die Texterkennung mittels OCR, bei der Tausch- und Geschenkstelle kommen die Elektronischen Dissertationen an, die Fachreferenten treffen eine Auswahl und systematisieren und schreiben Abstracts, die Bibliotheks-EDV hält Kontakt zum Rechenzentrum, erarbeitet die technische Gesamtkonzeption und die Geschäftsgänge, unter Umständen liegt hier auch die Datenbankbetreuung, die elektronischen Objekte müssen katalogisiert werden, die Öffentlichkeitsarbeit macht das neue Dienstleistungsangebot bekannt, die Benutzung muss mit Rat und Tat bei Problemen zur Stelle sein und die Schulung der Nutzer im Umgang mit dem Archivserver übernehmen. Hinzu kommt eine für die Bibliotheken neue Aufgabe: die der Verlagsarbeit. Übernimmt die Bibliothek Verlagsaufgaben für die Universität, muss sie auch dessen gewahr sein, Verlagsarbeit leisten zu müssen, wie Marketing, Werbung und Autorenbetreuung.

Aus der Anzahl der in den Arbeitsprozess involvierten Abteilungen ergibt sich die zwingende Forderung, den Umgang mit dem Archivserver so einfach zu gestalten, dass jeder damit arbeiten kann, ohne dass die Integrität der Daten auf dem Archivserver in Gefahr gerät. Die Forderung, dass nur wenige Personen mit bzw. auf dem Archivserver arbeiten, lässt sich innerhalb der Bibliothek angesichts der umfassenden Aufgaben nicht durchsetzen. Es müssen also für die interne Verwaltungsarbeit einfache Interfaces entwickelt werden.

 

Probleme

Man kann jede Menge Probleme benennen und beschreiben, aber es gibt noch keine allgemeingültigen Lösungen - die Lösungen ergeben sich aus den hochschulspezifischen Anforderungen und Schwerpunkten. Hier stehen dann oft kleinere Universitäten und Bibliotheken ohne ausreichende Technikinfrastruktur (Rechenzentren) vor schier unlösbaren Problemen. Die Lösung der Probleme erfordert einen konstruktiven Dialog mit den Wissenschaften (in Erfurt moderiert vom Zentrum für Kommunikation und Infrastruktur als zentraler Universitätseinrichtung) und den Rechenzentren (als Ansprechpartner mit dem nötigen Know-How für Computer- und Netztechnik und Datenverarbeitung).

Ein großes Problemfeld läßt sich im Bereich der elektronischen Dateien abstecken: Hierzu gehört als erstes wohl die Formatfrage: Abgabeformat, Archivierungsformat, Präsentationsformat und Download-Formate müssen erzeugt und parallel verwaltet werden. Dies bedeutet eine Menge an Konvertierungsarbeit, die auf die Bibliotheken zukommt, weil es noch keine 100% automatische Konvertierung gibt. Jede Datei muss nach der Konvertierung mühevoll manuell nachbearbeitet werden. Dann die Frage: Wer soll die Metadaten-Er­fassung übernehmen: Bibliothek (Fachreferat und Katalogisierung) oder der Autor selber? Wie können die Daten in den OPAC oder vom OPAC in das eingesetzte Datenbankprogramm übernommen werden?

Das Versionsmanagement bei den Dynamic Documents gestaltet sich schwierig, weil diese Dokumente ja nicht statisch sind, sondern von einer fortgesetzten Diskussion leben. Soll man also jede Version archivieren oder nur die jeweils aktuelle? Welche Programme müssen für die Präsentation mul­timedialer Dateien angeboten werden bzw. zusammen mit den Dateien archiviert werden? Die Bibliothek muss in der Lage sein, die Garantien für die Authentizität und Integrität der abgegebenen Dateien auch technisch leisten zu können. Sie muss z.B. die Datei mittels einer digitalen Signatur oder eines digitalen Wasserzeichens kennzeichnen, um beabsichtigte oder unbeabsichtigte Manipulationen am Inhalt der Datei zu verhindern. Die Bibliothek muss nicht zuletzt für eine gewisse inhaltliche Qualität der archivierten Datei bürgen. Ein weiteres Problem ist die Frage der Langzeitarchivierung. Hier existieren schon verschiedene Modellvorstellungen. Beim ersten Modell, dem Migrationsmodell, werden die Objekte von einer Hard- und Software-Umge­bung in eine neue Umgebung integriert. Der Nachteil ist, dass die Gefahr besteht, dass die Objekte dabei nicht unverändert bleiben. Beim Emulationsmodell bleiben die Objekte selbst unverändert, die neue Hard- und Software-Um­gebung bildet dann die ursprüngliche Umgebung nach. Bei dem dritten Modell des Technikmuseums schließlich werden die unveränderten Objekte in einer unveränderten Hard- und Software-Umgebung aufbewahrt.

Als weitere Problemfelder lassen sich sowohl psychologische, technische, juristische, organisatorische als auch softwareseitige benennen.

Als psychologische Probleme wären die mangelnde Akzeptanz seitens der Nutzer (und auch der Bibliotheksmitarbeiter) zu nennen. Diese unzureichende Akzeptanz elektronischer Medien resultiert oft aus einer Unkenntnis über die Einsatzmöglichkeiten z.B. einer Volltextsuchmaschine und/oder fehlenden technischen Fähigkeiten beim Umgang mit PC und Programmen. Hieraus ergibt sich die Forderung nach möglichst einfachen Bedienoberflächen: einfach hinsichtlich Einheitlichkeit (eine Bedienoberfläche für alle Funktionen) und Ver­ständlichkeit. Durch gezieltes Marketing und Öffentlichkeitsarbeit läßt sich die Akzeptanz sicher genauso erhöhen wie durch vermehrte Einführungs- und Schulungsprogramme. Eine ketzerische Frage drängt sich hier aber auf: Erzeugt man durch dieses Marketing nicht einen künstlichen Bedarf für etwas, das eigentlich so gar nicht benötigt wird?

Technische Probleme wie Lizenzverwaltung, Absichern nichtöffentlicher Bereiche durch IP-Check und/oder Passwortabfrage, Backup-Systeme und ähnliches sind wesentlich leichter lösbar. Es gibt für fast alles eine Lösung. Eng mit der eingesetzten Technik verbunden sind Probleme im Zusammenhang mit der einzusetzenden Software: hierbei ist vor allem die Frage der Software-Auswahl zu nennen. Welche ist für die Zwecke der Bibliothek am geeignetsten? Wieviele Datenbanklizenzen müssen gekauft werden? Die Beantwortung solcher Fragen kann nur in enger Zusammenarbeit mit dem Rechenzentrum erfolgen. Die Verflechtung der Fragen, die einerseits bibliothekarische Anforderungen darstellen, andererseits aber mit deren technischen Umsetzungsmöglichkeiten verknüpft sind, macht diese Kooperation zwingend notwendig.

Schwieriger wird es dann schon wieder bei den Überlegungen zur Organisation: Wie gestalte ich den Geschäftsgang für elektronische Medien so, dass er möglichst gut in den existierenden Geschäftsgang der Bibliothek eingebunden ist? Wie kann die Zusammenarbeit Wissenschaft, Rechenzentrum und Bibliothek erfolgen? Aus den auftauchenden Problemen ergibt sich, dass es wohl am günstigsten wäre, eine Art Round Table mit Vertretern aller drei Bereiche zu schaffen, die sich in regelmäßigen Abständen treffen, um Erfahrungen, Probleme und Wünsche auszutauschen.

Für die juristischen Probleme: Copyright, Datenschutz wurden zumindest schon Lösungsansätze in Projekten erarbeitet.

Im Bereich der Wissenschaften dürfte sich das Akzeptanzproblem (ganz unterschiedlich nach Fächern: am größten noch im Bereich der Geisteswissenschaften) als das schwierigste erweisen. Fehlender Technikkompetenz können Schulungen und einfach gehaltene Bedienoberfläche entgegengehalten werden. Fehlende Informationskompetenz beim Umgang mit elektronischen Daten sind ein weiteres Problem. Solange beispielsweise unsere Nutzer und Mitarbeiter elektronisch generierte Kurztitellisten ausdrucken, um sie danach wieder durch Abtippen in ihre Arbeit einzufügen, solange solche Brüche in der Informationskette an der Tagesordnung sind, solange müssen Bibliotheken auch den Umgang mit dem PC schulen, müssen sie Dinge wie Zwischenablage und Cut-und-Paste-Funktionen erklären. Die Wissenschaftler als Autoren sind oft zu wenig über ihre Rechte informiert. Meist treten sie die Veröffentlichungs- und Verwertungsrechte komplett an die Verlage ab, ohne zu wissen, dass sie hier Verhandlungsspielraum haben. Hier muss die Bibliothek informieren und betreuen. Die amateurhafte Erstellung von elektronischen Publikationen (Schlagwort: der PC als Schreibmaschine) ist ein weiteres Problem, dem seitens der Bibliothek durch intensive Autorenbetreuung und bestimmte Vorgaben hinsichtlich der Abgabeformate und -formatierung (Erarbeiten von Document Type Definitions - DTDs - für bestimme Dokumentformen, Style Sheets) begegnet werden kann.

Im Bereich der Bibliothek fehlt es sehr oft am nötigen technischen Know-How, es fehlt an geeignetem Personal, um die zusätzlichen Serviceleistungen und Arbeiten zu bewältigen, die rapide technische Entwicklung bedeutet einen ständig wachsenden Fortbildungs- und Nachqualifizierungsbedarf seitens der Mitarbeiter. Was in unseren Bibliotheken fehlt, ist der Digitale Bibliothekar.

„Digital librarians must thrive on change. They should read constantly (but selectively) and experiment endlessly. They need to love learning, be able to self-teach, and be inclined to take risks. And they must have a keen sense of both the potentials and pitfalls of technology.“

Die technische Ausrüstung und die Informationsangebote, der gute Wille der Mitarbeiter, das alles sind noch keine Garantien für eine effektive Nutzung des Angebots Virtuelle Bibliothek. Was wir brauchen, sind Visionäre, die ihre Visionen pragmatisch und praktisch umsetzen können, sind innovationsfreudige Mitarbeiter und Nutzer ohne Berührungsängste zur Technik, die mit dem elek­tronischen Angebot kompetent umgehen können. Die viele Doppelarbeit in den einzelnen Bibliotheken muss verhindert werden durch Koordinierung und einer Kartographierung des Wissens, z.B. könnte nach Art der Yellow Pages ein Verzeichnis der Experten im Bereich Digitale Bibliothek erstellt werden. Damit können dann auch kleinere Bibliotheken, die mit weniger Personal auskommen müssen, beginnen, ihren Beitrag zum Aufbau der weltweiten, alles umfassenden Digitalen Bibliothek zu leisten.

 

Literaturhinweise:

Arms, William (u.a.): An architecture for information in digital libraries. In: D-Lib Magazine, 1997, Feb. <http://www.dlib.org/dlib/february97/cnri/02arms1.html>

Bericht der Arbeitsgruppe Technik zur Vorbereitung des Programms „Retrospekive Digitalisierung von Bibliotheksbeständen“ im Förderbereich „Verteilte Digitale Forschungsbibliothek“, Red. Norbert Lossau. Sept. 1997

Hastings, Kirk und Tennant, Roy: How to build a digital librarian. In: D-Lib Magazine, 1996, Nov. <http://www.dlib.org/dlib/november96/ucb/11hastings.html>

Koring, Bernhard: Bibliotheken im Netz: Überlegungen zur Entwicklung der Universitätsbibliotheken auf der Basis eines Interfacekonzepts. In: Zeitschrift für Bibliothekswesen und Bibliographie, 45.1998, 4, S. 387 - 398

Ohst, Daniel: Was ist ein Dokumentenserver: Vortrag, gehalten auf dem Kolloquium „Elektronische Publikationen an der Humboldt-Universität zu Berlin“ am 10.6.1998. <http://dochost.rz.hu-berlin.de/projekte/epdiss/kolloqu/ohst/ ohst1.html>

Zimmer, Dieter E.: Die digitale Bibliothek: eine Artikelserie für Nutzer und Verächter der Computernetze. In: Die ZEIT.

<http://www2.zeit.de/tag/digbib/digbib1.html>


Stand: 06.09.99
Seitenanfang