Publikationen Hierarchiestufe höher Vorherige Seite Nächste Seite

Bibliotheksdienst Heft 7, 96

Bibliotheken und elektronische Publikationen auf der Basis des SGML-Standards

Einige Konsequenzen aus dem Projekt BIADOK-Publikation

Johannes Palme

Hypertext-Technologien werden mittlerweile in einem breiten Spektrum von Anwendungsbereichen eingesetzt, wobei dies teilweise mit oder ohne Mitwirkung von Bibliotheken bei der Informationsstrukturierung und -verwaltung geschieht. Traditionell bisher getrennte Bereiche der Publikationserstellung, der Informationsvermittlung und der Archivierung verschmelzen miteinander, so daß auch vermittelnde Institutionen, wie Bibliotheken, und die Disziplinen, die sich mit solchen Themen im Rahmen von Forschung und Lehre beschäftigen (auch die Bibliothekswissenschaft) ihren Standpunkt vor diesem Hintergrund neu bestimmen müssen 1).

Ausgangspunkt: Das freie Projekt BIADOK_Kunst

Im Rahmen eines Kooperationsvertrages zwischen HUB 2) und ITAW 3) findet mit dem Institut für Bibliothekswissenschaft eine Zusammenarbeit statt: Studenten des M.-A. Studiengangs Bibliothekswissenschaft haben seit 1992 die Gelegenheit, im Rahmen des freien Projektes BIADOK_Kunst Online-Katalogisierung und Fragen der bibliothekarischen Systemadministration in einem lokalen Rechnernetz (LAN) auf der Basis eines UNIX-Betriebssystems mit praxisnahem Bezug kennenzulernen und die theoretischen Kenntnisse an relevanten Beispielen (Katalogisierung von Beständen einer kunstwissenschaftlichen Spezialbibliothek) zu diskutieren 4). Zu diesem Zweck wurde die Software Dynix 1.38 eingesetzt, wo gegenwärtig ein Upgrade auf das grafische System HORIZON 4.1 erfolgt. Das Projekt bietet den Studenten ein Experimentierfeld für aktuelle Fragen der bibliothekarischen Fachdiskussion:

Wie erschließe und beschreibe ich Bilder in einer kunstwissenschaftlichen Spezialbibliothek in der gleichen Weise und dem gleichen Datenformat wie für die Fachliteratur? Wie erschließe ich elektronische Publikationen, die im lokalen Netz oder im Internet verfügbar sind, ohne daß ihre Aktualität durch eine langwierige bibliothekarische Bearbeitung verloren geht? Wie verknüpfe ich bibliographische Information einerseits und das Objekt der bibliographischen Beschreibung (hier Bilder) andererseits, ohne in die Quellen der Bibliothekssoftware oder der Software der Bilddatenbankverwaltung einzugreifen?

An diesen Punkten wird deutlich, daß man sich nicht auf die strukturierte Objektbeschreibung (in den Bibliotheken zumeist formale Erschließung) beschränken kann, sondern sich durchaus auch mit dem Erstellungsprozeß elektronischer Publikationen beschäftigen muß, weil bereits bei der Erstellung die späteren Retrievalmöglichkeiten festgelegt werden. Praktisches Beispiel sind die WWW-Seiten im Internet: Der Produzent erstellt und pflegt diese Seiten, er setzt die Links und bietet Suchformulare an. Im Rahmen der Lehre hatten die Studenten die Gelegenheit, sich hier Grundkenntnisse und Fähigkeiten anzueignen. Dazu gehören Veranstaltungen zur Einführung in das elektronische Publizieren, die Vermittlung von Basiskenntnissen im Umgang mit entsprechenden Editoren, die z. T. als Freeware (z. B. HoTMetaL) oder kommerziell erhältlich sind (z. B. HoTMetaL Pro, Author / Editor).

Elektronische Publikationen auf der Basis des SGML-Standards

In den 70er Jahren haben Anwender mit großen Datenmengen, komplexen Strukturen und heterogenen Netzen in den USA einen ISO-Standard entwickelt, der einen plattformunabhängigen Austausch von strukturierten Informationen sowie deren Pflege und Publikation ermöglicht. Es handelt sich dabei um den ISO-Standard 8879 (SGML), der von Charles Goldfarb 5) wesentlich ausgearbeitet wurde. Eine weite Verbreitung fand dieser Standard durch ein Subset von SGML, die Struktursprache HTML (HyperText Markup Language), auf der die graphische Oberfläche des WWW (World Wide Web) mit seinen Protokoll HTTP (HyperText Transfer Protocol) basiert.

Jede Publikation, die gemäß SGML-Standard strukturiert ist, basiert auf einer Dokument-Typ-Definition (DTD), in der ihre Elemente logisch definiert sind und die im Text als Strukturelemente wiederkommen. Layout und inhaltliche Struktur des Dokuments sind konsequent getrennt. Dadurch erweisen sich solche Dokumente als Lebenszeitdokumente, da sie von den Formatierungsleistungen einzelner Textverarbeitungssysteme unabhängig sind. Auch im deutschsprachigen Bibliothekswesen wird dieser Standard zunehmend zur Kenntnis genommen und die Auswirkung eines solchen Standards diskutiert 6).

Das Higher Education Full Grant Program

Seit Ende 1995 ist ITAW, als Drittmittelinstitut außeruniversitärer Anwendungsforschung, ein (von zwei pro Land) Teilnehmer am internationalem Higher Education Full Grant Program der Firma Electronic Books Technologies (EBT), Providence R. I. / USA und stellt Berliner Universitäten die Produktions- und Entwicklungssoftware DynaText für die Herstellung von elektronischen SGML-basierten Publikationen zur Verfügung. Das Programm unterstützt die Forschung und Lehre, etwa an Universitäten, allgemein durch die:

Abbildung 1: DynaText Hypertext-Browser (aus technischen Gründen nicht verfügbar)

Abbildung 2: Strukturübersicht

Entwicklung von prototypischen Anwendungen für den nicht-kommerziellen Einsatz

Im Rahmen der bestehenden Kooperationsbeziehungen mit der Humboldt-Universität und dem K-K-V 7) wurden bereits prototypische Anwendungen entwickelt, d. h. elektronische Publikationen im Umfang von Monographien auf der Basis von Daten und Informationen, die seitens der Partner zur Verfügung gestellt wurden: "Forschung für die Umwelt '95" (in Kooperation mit der Forschungsabteilung), "Bibliographie und Chronik der Bibliothekswissenschaft an der Humboldt-Universität 1990-1995", "Musik in der Bildenden Kunst" (in Kooperation mit dem K-K-V). Im Rahmen dieser Anwendungen hat sich folgende Vorgehensweise herauskristallisiert:

Die "Chronik und Bibliographie 1990 - 1995" des Instituts für Bibliothekswissenschaft wurde aus Anlaß des 40jährigen Bestehens des Instituts zunächst in gedruckter Form vorgelegt. Sie enthält eine chronologische Aufführung von Ereignissen, eine Liste der wissenschaftlichen Mitarbeiter und verschiedene bibliographische Verzeichnisse: am Institut verteidigte Dissertationen und Habilitationsschriften, Diplom- und Magisterarbeiten, Abschlußarbeiten postgradualer Studiengänge sowie Veröffentlichungen, die das Institut insgesamt, seine Forschungs-, Aus- und Fortbildungstätigkeit und einzelne Mitarbeiter betreffen und Publikationen der Institutsmitarbeiter. Die Daten lagen in elektronisch lesbarer Form (als LARS-Datenbank) vor und wurden für die Druckausgabe entsprechend bearbeitet.

Im Rahmen der Prototypentwicklung für eine elektronische Publikation auf der Basis des SGML-Standards wurden zunächst die Informationen aus der Datenbank auf der Basis einer entsprechenden DTD in die SGML-Struktur umgesetzt und in die Browser-Oberfläche DynaText eingebunden. Dabei wurden Suchformulare für die Suche nach Autoren, nach Sachtiteln sowie eine kombinierte Autor- / Titelsuche auf der Basis der SGML-Struktur integriert. Ein Teil der in der Chronik aufgeführten Titel liegt in elektronischer Form (Textverarbeitung) vor. Es bot sich also an, nicht nur die bibliografischen Informationen über die Publikationen abzuspeichern, sondern darüber hinaus Volltexte in die DynaText-Applikation einzubinden.

Auf der Basis der Freiwilligkeit stellten einzelne Mitarbeiter des Instituts entsprechende Publikationen zur Verfügung. Diese wurden ebenfalls in eine SGML-Struktur umgesetzt. Dazu wurde die vorhandene Software, die im Rahmen der Lehrveranstaltung zum elektronischen Publizieren vorgestellt wird, benutzt, d. h. sowohl SGML-Editoren als auch Konvertierer aus Textverarbeitungsformaten. Neben der Chronik wurden folgende Publikationen integriert: Heft 1, 2 und 3 des Projektes BIADOK_Kunst. Heft 1 und 2 der Schriftenreihe "Weitblick" wurden als originäre HTML-Publikationen unter SGML eingebunden. Einzelne Publikationen von Mitarbeitern des Instituts können als Grundstock eines logistischen Bestandsaufbaus einer elektronischen Bibliothek dienen. Bei Interesse kann der Leser über ein Icon direkt von der bibliografischen Information auf den Volltext zugreifen. Prinzipiell ist hier auch eine Verknüpfung mit extern gespeicherten Volltexten - etwa über eine URL - möglich.

Da das EBT Higher Education Grant Full Program ausdrücklich auf nicht-kommerzielle Anwendungen beschränkt ist, können über diesen Weg keine elektronischen Publikationen erstellt werden, die kommerziellen Charakter haben. In diesem Fall kann zwar über das nicht-kommerzielle Programm eine Produktentwicklung vorgenommen werden; sie muß aber durch eine kommerzielle Publikationslizenz freigegeben werden 8). Präsentiert werden die Ergebnisse dieses Projekts in Form von Präsentationen (z. B. auf der Digital Media World '96 Berlin im Rahmen des Forschungsmarktes der Berliner Universitäten und Fachhochschulen) und durch Publikationen.

Vorteile der Nutzung des SGML-Standards

Das hier vorgestellte Projekt "BIADOK_Publikation - Elektronisches Publizieren auf der Basis des SGML-Standards" bietet die Gelegenheit, sich bereits im Rahmen der Publikationserstellung mit der Frage von Wissenstrukturierung auf der Basis eines international gültigen Standards zu beschäftigen. Von zentraler Bedeutung ist die Orientierung an dem international gültigen SGML-Standard, der neben der Plattformunabhängigkeit vor allem flexible Anwendungsmöglichkeiten impliziert. Unter einer einheitlichen Oberfläche auf der Basis einer entsprechenden DTD bzw. mehrerer DTDs können unterschiedlichste Anwendungsformen eingebunden werden: strukturierte Informationen aus Datenbanken, Texte, Bilder, Grafiken, Formeln. Dabei hängt es von der Qualität der Strukturierung der Quelldaten und nicht von deren unterschiedlichen, womöglich nichtkompatiblen Formaten ab, wie gut die elektronische Publikation strukturiert werden kann. Zugänglich gemacht und recherchierbar sind solche Publikationen sowohl im WWW (über einen speziellen DynaWeb-Server) als auch auf CD-ROM oder in gedruckter Form verfügbar.

Konsequenzen für Bibliotheken

Auch wenn bibliographische und Volltext-Datenbanken noch längere Zeit nebeneinander bestehen, so werden sie sich gegenseitig beeinflussen 9). Ähnliches gilt für den verstärkten internationalen Datenaustausch, z. B. für die Frage eines internationalen Austauschformates (UNIMARC) und die Annähererung von Katalogisierungsregeln des englisch- und des deutschsprachigen Raumes 10).

Ziel muß sein, den aufwendigen Katalogisierungsprozeß durch die Übernahme von Fremdleistungen zu effektivieren, die Recherchemöglichkeiten zu verbessern und über definierte Schnittstellen den Übergang zu anderen Systemen zu ermöglichen, wenn die gesuchte Information im eigenen System nicht vorhanden ist. Diese Funktionalität ist unter grafischen Bibliothekssystemen als eine Internet-Anwendung mit der Schnittstelle Z39.50 bekannt. Da die Publikationen zunehmend in elektronisch lesbarer Form vorliegen, werden hier bisher getrennte Prozesse der Nachweisführung (in Bibliographie oder Katalog) und Beschaffung (Ausleihe oder Fernleihe) integriert: durch eine entsprechende Verknüpfung kann der Benutzer direkt vom bibliographischen Nachweis auf die Publikation zugreifen.

Ein Weg, diese Publikationen nachzuweisen, besteht darin, bestehende Datenformate für die bibliographische Beschreibung anzupassen - etwa durch die Definition eines Feldes für den elektronischen Standort und den Zugriff auf das Dokument 11). Der andere Weg ist, die bibliographischen Informationen, die in der SGML-Struktur einer Publikation enthalten sind, für die Katalogisierung zu nutzen.

Formale Erschließung stellt aus der SGML-Perspektive eine mögliche Sicht auf die elektronische Publikation dar, die genau die Elemente enthält, die für diese Form der Erschließung als relevant angesehen werden und im elektronischen Dokument vorhanden sind, ähnlich wie die CIP-Aufnahme in gedruckten Büchern zur Vorabinformation und als Katalogisierungshilfe für Bibliotheken. Bei einer Katalogisierung "per Hand" von elektronischen Publikationen durch den Bibliothekar/-in, würden die relevanten Elemente der DTD in einzelne Felder eines bibliothekarischen Datenformates überführt. Bei einer "automatischen Katalogisierung" könnten die Feldbenennung des benutzten bibliothekarischen Datenformates den Elementen der DTD als Attribut zugeordnet werden 12). Diese Attribute realisieren Filterfunktionen. Ergebnis des Filterprozesses sind bibliographische Daten, die einmal in das eigene Bibliothekssystem übernommen, gemäß dem eigenen Bedürfnissen ergänzt werden (z. B. einheitliche Ansetzung von Personennamen, Ergänzung fehlender Angaben).

Traditionellerweise erfolgt die inhaltliche Erschließung von Publikationen durch eine systematische Aufstellung und / oder durch Schlagworte. Diese Form der Erschließung soll dem Nutzer einen Rechercheeinstieg unter inhaltlichen Aspekten ermöglichen. SGML-strukturierte Publikationen enthalten durch ihre Struktur bereits diese Suchmöglichkeiten. Hier bestimmt der Autor bei der Erstellung das Retrieval. Neben der Freitextsuche ist eine spezielle Textsegmentsuche nach den markierten Textelementstrukturen in logischer und hierarchischer Anordnung möglich. Bei großen Datenmengen, wie sie Kataloge bzw. Katalogverbünde von wissenschaftlichen Bibliotheken darstellen, können auf der Basis einer SGML-Struktur die Retrievalmöglichkeiten des Browsers und entsprechende Suchformulare für die Recherche über den Gesamtbestand genauso eingesetzt werden, um relevante Titel zu ermitteln, wie innerhalb von Publikationen für die Recherche nach relevanten Textstellen oder

-abschnitten. Mit diesen komfortablen Suchmöglichkeiten verliert das Schlagwortprinzip für die inhaltliche Erschließung an Bedeutung. An ihre Stelle tritt ein terminologisch begründeter Deskriptor mit Definitionsschema. Damit wachsen Bibliothek und Dokumentation ineinander.

1) Vgl. hierzu beispielsweise das umfangreiche Programm der "Summer School" an der Universität von Tilburg im August 1996, wobei allerdings die Teilnahmegebühren von 6000 DFL den Kreis der potentiellen Teilnehmer erheblich einschränkt.

2) HUB = Humboldt-Universität Berlin

3) ITAW = Institut für Terminologie und angewandte Wissensforschung (itaw) GmbH, Berlin

4) Das Projekt ist durch eine eigene Schriftenreihe dokumentiert: "Projekt BIADOK_Kunst : Methoden der rechnergestützten Kunstdokumentation ; Berichte aus dem Projekt". Berlin Heft 1-3 (1995).

5) Goldfarb, C. F. : The SGML Handbook. Oxford 1990.

6) Verwiesen sei hier auf den Vortrag von Frau Boßmeyer auf dem Bibliothekartag 1996 in Erlangen über elektronische Texte und Dokumentformate am 29.05.1996.

7) K-K-V = Kunstwissenschaftler- und Kunstkritiker-Verband. Der K-K-V ist gemeinsam mit ITAW Träger des freien Projektes BIADOK_Kunst.

8) Weitere Informationen sind beim Verfasser erhältlich. ITAW ist Focal Point für SGML-Publikationen unter DynaText, DynaTag und DynaWeb

9) Die bibliografischen Datenbanken sind bisher i.d.R. das Arbeitsfeld der wissenschaftlichen Bibliotheken, während Volltextdatenbanken eher das Arbeitsfeld von Dokumentationsstellen und Spezialbibliotheken sind.

10) Hier sei auf die Vorträge von Frau Münnich, Dr. Tillet und Dr. Thomas während des Bibliothekartages in Erlangen (Themenkreis XIV: Formal und Sacherschließung am 31.05.1996) verwiesen.

11) S. "Palme, Johannes: Katalogisierung elektronischer Publikationen zur Kunstinformation". - In: Projekt BIADOK_Kunst H. 3 (1995). - S. 3-18

12) Um eine internationalen Austauschbarkeit zu gewährleisten, wäre hierzu die Anwendung des UNIMARC-Formates sinnvoll.


Seitenanfang