Publikationen Hierarchiestufe höher Vorherige Seite Nächste Seite

BIBLIOTHEKSDIENST Heft 11, 98

Metadaten - neue Perspektiven für die Erschließung von Netzpublikationen in Bibliotheken


Erster META-LIB-Workshop in Göttingen

Friederike von Essen

Vom 22. bis 23. Juni 1998 fand in der Niedersächsischen Staats- und Universitätsbibliothek (SUB) Göttingen der erste Workshop des DFG-geförderten Projektes META-LIB (Metadaten-Projekt deutscher Bibliotheken / Metadata Initiative of German Libraries) statt, der mit rund 70 Teilnehmern gut besucht war. In insgesamt 14 Vorträgen wurden Projekte und Initiativen aus dem In- und Ausland zum Einsatz von Metadaten bei der Erschließung digitaler Objekte vorgestellt und diskutiert. Das Programm sowie Abstracts, Vortragsfolien und -konzepte sind auf den META-LIB-Seiten1) einzusehen.

Die während des Workshops immer wieder aufscheinende Frage, warum sich Bibliothekare angesichts ausgefeilter und erprobter bibliographischer Regelwerke und Formate mit Metadaten-Formaten wie dem Dublin Core (DC) beschäftigen, wurde bereits in den Einführungsvorträgen kursorisch beantwortet. Die internationale Ausrichtung, die Reduktion auf Kernelemente ebenso wie die flexible Anwendbarkeit auf unterschiedliche Gegenstandsbereiche von multimedialen Internet-Ressourcen über Printmedien bis hin zu Museumsobjekten machen, so Elmar Mittler in seiner Begrüßung, Metadaten zu zukunftsweisenden Erschließungsmodellen, von denen letztlich auch innovative Impulse für die Fortentwicklung nationaler Katalogisierungskonventionen ausgehen. Diese Impulse zu kanalisieren und darauf hinzuarbeiten, daß der Nachweis von Internet-Ressourcen integraler Bestandteil des bibliothekarischen Informationsangebotes wird, ist eine Hauptaufgabe von META-LIB, wie Karin Pauleweit in ihrer Vorstellung des Projektes betonte.

Das weitere Workshop-Programm umfaßte vier Themenblöcke, wobei die drei ersten den Arbeitsschwerpunkten von META-LIB entsprechen und somit auch zur Präsentation der drei Teilprojekte genutzt wurden.

Dublin Core

Zu Beginn des ersten Blockes Dublin Core und seine Aufnahme in deutschen Bibliotheken stellte Hans Becker angesichts der häufig formulierten Frage, ob denn der Dublin Core bereits reif für die Anwendung sei, das mittlerweile breite Spektrum weltweit verteilter DC-Anwendungen dar. Auf der offiziellen DC-Site2) sind derzeit über 40 Projekte genannt. Parallel zu dieser praktischen Erprobung hat eine verstärkte Institutionalisierung der noch nicht abgeschlossenen Arbeit am DC-Set stattgefunden. So haben sich zehn Arbeitsgruppen mit unterschiedlichen inhaltlichen Schwerpunkten gebildet, die durch vorab erstellte Konzeptpapiere und Entwürfe die Entscheidungsfindungsprozesse der DC-Workshops beschleunigen sollen. Meilensteine für eine weitere DC-Standardisierung sind der bei der IETF (Internet Engineering Task Force) eingereichte Entwurf für das nicht-qualifizierte Element-Set3) ebenso wie die Beteiligung der DC-Community an der Ausarbeitung des umfassenderen RDF (Resource Description Framework)4), einer zukunftsweisenden Entwicklung zur Strukturierung und Austauschfähigkeit von Daten.

In den beiden folgenden Vorträgen wurde über zwei exemplarische DC-Anwendungen aus dem bibliothekarischen Kontext berichtet, wobei übereinstimmend die aus der noch unvollkommenen DC-Standardisierung resultierenden Probleme angesprochen und mit Beispielen aus der Praxis belegt wurden. Mit dem "Virtuellen Medienserver"5) wurde, wie Thomas Dierig berichtete, im Bibliotheksservice-Zentrum Baden-Württemberg eine Pilotanwendung zur halbautomatischen Erschließung eines heterogenen Spektrums digitaler Medien (Hochschul-Publikationen, E-Journals, Reprints etc.) mit DC-Metadaten geschaffen. Dabei werden Metadaten entweder auf der Grundlage von Katalogisaten des SWB-Verbundpools oder aber auf der Grundlage von DC-Datensätzen aus den neun universitären Kooperationsprojekten über einen Frontdoor-Generator produziert. Im Gegenzug werden aus DC-Daten Aufnahmen für den Verbundpool generiert, die jedoch zunächst durch "Hochkatalogisieren" dem hohen Qualitätsstandard der Verbund-Titelaufnahmen angeglichen werden. Komplementär zu diesem fächerübergreifenden Erschließungsansatz auf Verbundebene vermittelt das Projekt SSG-FI (SondersammelGebiet-FachInformationen) der SUB Göttingen6) in den Fächern Mathematik, Geowissenschaften und Anglo-Amerikanischer Kulturraum (Geschichte und Literatur) einen Überblick über relevante Fachinformationen. Jedoch werden nach Aussage von Heike Neuroth und Karsten Hülsemann dabei keine Einzeldokumente, sondern ausschließlich Dokumenten-Server berücksichtigt. Der Beschreibung von fachlich einschlägigen Ressourcen liegt ebenfalls das DC-Set zugrunde, das aber bei der Anpassung an die gemeinsamen Erschließungserfordernisse der drei Fachdisziplinen modifiziert und um Zusatzinformationen im Bereich von Zugangsbedingungen und inhaltlicher Bewertung erweitert wurde.

Da diese Adaptionsprozesse des DC-Sets an jeweils spezifische Erschließungserfordernisse nicht nur bei den bibliothekarischen, sondern auch bei den zahlreichen Anwendungen der wissenschaftlichen Fachgesellschaften zu beobachten sind, stellt sich die Frage, wie die eigentlichen Kernelemente des DC zu definieren sind. Dieser Frage geht Ralf Schimmer im Rahmen des Göttinger META-LIB-Projektes Grundlagen zu einem Regelwerk zur Erschließung digitaler Objekte unter besonderer Berücksichtigung der internationalen Diskussion nach. Grundlage für die Empfehlung eines DC-Erschließungsstandards für digitale Objekte in Bibliotheken ist die in Göttingen aufgebaute Access-Datenbank METAFORM, in der eine Vielzahl von DC-Spezifikationen und DC-verwandten Metadatenformaten erfaßt werden. Über ihre Funktion als Analyseinstrument hinaus wird sie auch zur Erstellung von Konkordanzen (z.B. PICA-Format (r) DC) genutzt. METAFORM wird noch im Herbst im Netz öffentlich zugänglich gemacht, und zwar über den im Rahmen des Projektes an der SUB betriebenen Metadatenserver7), auf dem einschlägige Dokumente zur Metadatendiskussion nachgewiesen sind.

Retrieval

Ausgangspunkt für den zweiten Themenblock Retrieval in heterogenen Datenbeständen ist die Beobachtung, daß in Bibliotheken in zunehmendem Maße heterogene Erschließungsdaten zusammenfließen, die den Benutzern unter einer möglichst einheitlichen Recherche-Umgebung zur Verfügung gestellt werden sollten. Astrid Schoger nannte in ihrem Vortrag u.a. folgende Datenprovenienzen:

* nach verschiedenen nationalen Regelwerken und Formaten erstellte bibliographische Daten zur Formal- und Sacherschließung,

* Fachdatenbanken, Zeitschriftenartikel-Datenbanken von Verlagen und Agenturen,

* Metadaten zur Erschließung digitaler Objekte.

Neben den unterschiedlichen Regelwerken und Formaten ergibt sich auf Datenbankebene zusätzlich das Problem heterogener Zugangsprotokolle (Z39.50, http etc.) und heterogener Suchfunktionalitäten. Im META-LIB-Projekt der Bayerischen Staatsbibliothek (BSB)8) wird es zunächst darum gehen, die im Bibliotheksbereich bereits existierenden Suchdienste mit Hilfe eines auf der praktischen Erfahrung des BSB-Auskunftspersonals aufsetzenden Suchfragenkatalogs zu testen. Berücksichtigung finden dabei u.a. der KVK (Karlsruher Virtueller Katalog)9), das Web-Z39.50-Gateway Der Deutschen Bibliothek10) und der Gesamtkatalog der UB Bielefeld11). Darüber hinaus wird im Rahmen einer Kooperation mit XRCE (Xerox Research Centre Europe) an der Entwicklung des Suchdienstes Knowledge Broker12) mitgewirkt, der ebenfalls in die Tests einbezogen wird.

Im folgenden Vortrag stellte Boris Chidlovskii vom XRCE die Architektur des Knowledge Broker vor. Es handelt sich dabei um einen übergreifenden Suchdienst ohne zentralen Index, der den Zugriff auf WWW-fähige Datenbanken erlaubt. In sogenannten Wrappern werden die Recherchefunktionalitäten und Antwortstrukturen der einzubeziehenden Datenbanken abgebildet. Auf Grundlage der darin u.a. enthaltenen Attribut-Konkordanzen wird es möglich, an den Suchdienst gestellte Anfragen in die Retrievalsprache unterschiedlicher Datenbanken zu übersetzen und die extrahierten Antwortdaten einheitlich anzuzeigen.

Nationalbliographische Erschließung

Der dritte Themenblock Konzepte zur (national)bibliographischen Erschließung von Netzpublikationen wurde mit einem Bericht von Berthold Weiß über erste Ergebnisse des META-LIB-Projektes Der Deutschen Bibliothek13) eröffnet. In der Analysephase dieses Projektes, das die Erarbeitung von Konventionen für die (national)bibliographische Erschließung von digitalen Publikationen zur Aufgabe hat, ging es zunächst um eine Sichtung und Bewertung der weltweit laufenden Projekte mit ähnlicher Zielsetzung. Neben Projekten, die Netzpublikationen auf der Grundlage des DC-Sets erschließen, ist auch die Erschließung nach klassischen Regelwerken sowie die Doppelerschließung nach DC und klassischen Regelwerken verbreitet. Im weiteren wurden dann die Regelungen nationaler wie auch internationaler Regelwerke für den Bereich digitaler Publikationen genauer analysiert und verglichen. In einem dritten Arbeitspaket ging es bei der Analyse der für die Erschließung relevanten Dokumenttypen in erster Linie um deren abweichende Besonderheiten im Vergleich zu konventionellen Publikationen. Denn nur auf der Grundlage dieser Besonderheiten sind die Konsequenzen für die Erschließungsregeln genau zu beschreiben.

Als sehr lohnend erwies sich der anschließende Blick auf ausländische Metadaten-Projekte, zumal mit Skandinavien, den Niederlanden und Großbritannien Länder vertreten waren, in denen ein nationales Konzept zum Nachweis digitaler Ressourcen greifbar ist.

Das Nordic Metadata Project14), vorgestellt von Juha Hakala, hat sich einerseits um die Entwicklung weltweit nachgenutzter Metadaten-Tools verdient gemacht. Dazu gehören ein leicht handhabbares Template15) für die Produzenten-gestützte Erstellung von DC-Daten, der NWI16) (Nordic Web Index) als eine der wenigen DC-gerechten Suchmaschinen, ein Uniform-Resource-Name-Generator17), der auf der NBN (National Bibliography Number) aufsetzt, ein DC-Marc-Converter18) sowie ein Metadata Viewer19), ein in Webseiten einzubauendes Tool zur besseren Sichtbarmachung der Metadaten aus dem Header-Bereich. Verwiesen wurde weiterhin auf den Abschlußbericht20) des Nordic Metadata Project sowie auf seine bereits bewilligte zweite Phase21).

Außerdem wird in Dänemark mit dem Projekt Net Publikationer22) an Standards für die Bereitstellung und Erschließung amtlicher Druckschriften im Internet gearbeitet. Ebenfalls beachtenswert ist das Projekt INDOREG23) (INternet DOcument REGistration), dessen Aufgabe es ist, Prinzipien für die nationalbibliographische Verzeichnung von Netzpublikationen festzulegen. Auch in Finnland wird derzeit eine Neufassung des Pflichtexemplargesetzes vorbereitet, die die Einbeziehung elektronischer Publikationen vorsieht. Vor dem Jahr 2000 wird jedoch nicht mit ihrer Verabschiedung gerechnet.

Die niederländische Lösung sieht in Analogie zur erfolgreichen Verfahrensweise bei den Printmedien anstelle eines gesetzlichen Pflichtexemplarrechts auch im Bereich elektronischer Medien die freiwillige Anzeige vor, wie Titia van der Werf berichtete. So hat sich bei der Königlichen Bibliothek Den Haag mit NL-menu24) ein zentraler Zugriffspunkt auf ausschließlich niederländische, nicht-private WWW-Angebote etabliert, der bereits seit 1992 existiert. Die Registrierung wird durch die Anbieter der Sites selbst vorgenommen. Die Sites werden sachlich und nach dem Typ der übergeordneten Institution erschlossen. Derzeit umfaßt der Dienst mehr als 10.000 Nachweise, monatlich kommen mehr als 500 Meldungen hinzu. Mit NL-Select soll das Informationsangebot dieses Dienstes zukünftig in Richtung der Entwicklung und Anwendung von qualitativen Beurteilungskriterien auf die nachgewiesenen Netz-Ressourcen ausgebaut werden.

Parallel dazu hat sich ebenfalls schon seit 1993 und bemerkenswerterweise zunächst von den Geisteswissenschaften und Bildenden Künsten ausgehend ein enges Netz von fachlichen Gateways herausgebildet. Diese sind zusammengefaßt zu dem auch an der Königlichen Bibliothek angesiedelten Projekt DutchESS25) (Dutch Electronic Subject Service) und beruhen auf der Zuarbeit von Fachreferenten einer wachsenden Anzahl wissenschaftlicher Bibliotheken der Niederlande.

Bei UKOLN (UK Office for Library and Information Networking)26) fließen, wie Michael Day in seinem Vortrag darstellte, sowohl nationale als auch europäische Metadaten-Projekte mit ganz unterschiedlichen Zielrichtungen zusammen. Ein EU-gefördertes Vorhaben aus dem Bereich Telematics for Libraries ist BIBLINK27), ein Projekt zur Intensivierung des Datenaustausches zwischen Verlegern und nationalbibliographischen Zentren. Als weiteres EU-Projekt wird auch DESIRE28) unter starker britischer Beteiligung und Know-how-Vorgabe durchgeführt. Im Work-Package 3 (Resource discovery and indexing) geht es zum einen darum, Werkzeuge zum automatischen Indexieren von Internet-Ressourcen jeglicher Fachrichtung zu entwickeln. Zum anderen werden in Kooperation mit dem britischen Projekt ROADS29) qualitativ hochwertige europäische Fachdienste zum Nachweis von Internet-Ressourcen aufgebaut.

Im Rahmen von ROADS, das gefördert durch das Electronic Libraries Programme (eLib)30) auch unter Beteiligung von UKOLN durchgeführt wird, wurden mit Erfolg Web-basierte Tools zum Aufbau von Fachinformations-Gateways zum Beispiel für die Bereiche Art, Design, Architecture und Media 31) und Electronic Engineering32) entwickelt und in der Praxis erprobt.

Ebenfalls mit UKOLN-Beteiligung ist in diesem Jahr CEDARS33) , ein Projekt zur digitalen Bestandserhaltung angelaufen. In diesem Zusammenhang sind Metadaten sowohl für die technische Abstimmung von Digitalisierungsprogrammen als auch für die Gewährleistung eines zielgenauen Zugriffs auf diese digitalisierten Materialien von großer Bedeutung.

Metadaten

Mit dem letzten Themenblock Metadaten in den wissenschaftlichen Fachgesellschaften und im Rahmen von Global Info kamen wichtige außerbibliothekarische Kooperationspartner für den Aufbau integrierter wissenschaftlicher Informationssysteme in den Blick. Joachim Lügger stellte mit Math-Net34) exemplarisch für die Aktivitäten der Fachgesellschaften die Entwicklungsgeschichte eines nutzergesteuerten elektronischen Informationsdienstes für die Mathematik dar. Knut Barghorn, Springer Verlag, skizzierte den Beitrag der Verlage zum Aufbau von Online-Informationssystemen insbesondere im Rahmen von Global Info35). Mit diesem Förderprogramm des BMBF wird, wie Rudi Schmiede abschließend darlegte, durch die Beteiligung von Vertretern der Verlage, Fachgesellschaften, Universitäten, Bibliotheken und Fachinformationseinrichtungen die Intention verfolgt, die treibenden Kräfte der Gestaltung einer globalen wissenschaftlichen Informationslandschaft zur dringend gebotenen Zusammenarbeit zu motivieren.

Die Diskussionen, die sich an die Themenblöcke anschlossen, verliefen sehr rege. Insbesondere die Bewertung des DC war kontrovers. Eher kritische Stimmen hoben die noch weitgehend fehlende Normierung der Elementinhalte und den unübersichtlichen, etwas willkürlich wirkenden Verlauf der Entwicklungsarbeit am Element-Set als Hemmnisse für eine erfolgreiche Anwendung hervor. Außerdem läge mit RAK bzw. RAK-NBM ein taugliches Regelwerk vor, mit dem Lösungen für die Probleme, die die DC-Community noch heftig diskutiert, bereits lange gefunden seien.

Dem wurde entgegengehalten, daß mit dem DC das Ziel verfolgt wird, Wissenschaftlern in aller Welt ein leicht handhabbares und auf die Funktion resource discovery abgestimmtes Erschließungsmodell zur Verfügung zu stellen. Sehr umfangreiche, nur im deutschen Sprachraum angewandte Katalogisierungsregeln seien zur Erreichung dieses Zieles sicherlich ungeeignet.

Auf allgemeines Interesse des Publikums stießen die Berichte der ausländischen Kollegen, die einen eher pragmatischen Umgang mit dem neuen Universum von Internet-Objekten sichtbar werden ließen.

1) Vgl.: http://www.dbi-berlin.de/projekte/einzproj/meta/meta00.htm

2) Vgl.: http://purl.oclc.org/metadata/dublin_core/

3) Vgl.: ftp://ftp.isi.edu/in-notes/rfc2413.txt

4) Vgl.: http://www.w3.org/RDF/

5) Vgl.: http://www.swbv.uni-konstanz.de/wwwroot/s71800_d.html

6) Vgl.: http://www.sub.uni-goettingen.de/ssgfi/

7) Vgl.: http://www2.sub.uni-goettingen.de/

8) Vgl.: http://www.bsb.badw-muenchen.de/projekt/META.HTM

9) Vgl.: http://www.ubka.uni-karlsruhe.de/kvk.html

10) Vgl.: http://z3950gw.dbf.ddb.de/

11) Vgl.: http://www.ub.uni-bielefeld.de/netahtml/coib.htm

12) Vgl.: http://www.xrce.xerox.com/ats/xtrim/

13) Vgl.: http://www.ddb.de/partner/metalib.htm

14) Vgl.: http://renki.helsinki.fi/meta/

15) Vgl.: http://www.lub.lu.se/cgi-bin/nmdc.pl

16) Vgl.: http://nwi.ub2.lu.se/

17) Vgl.: http://www.lub.lu.se/dc/urntest.pl

18) Vgl.: http://www.bibsys.no/meta/d2m/

19) Zur Nutzung dieser Funktionalität muß man einfach in einer HTML-Seite folgenden Befehl einfügen: <a href="http://www.lub.lu.se/dc/nmd_viewer.pl"> View Metadata for this page! </a>. Eine Seite, auf der dies exemplarisch realisiert ist, ist die Homepage des Metadatenservers an der SUB Göttingen: http://www2.sub.uni-goettingen.de

20) Vgl.: http://linnea.helsinki.fi/meta/nmfinal.htm

21) Vgl.: http://linnea.helsinki.fi/meta/nm2plan.html

22) Vgl.: http://www.fsk.dk/fsk/publ/online-pub/kolofon.htm

23) Vgl.: http://purl.dk/rapport/html.uk/

24) Vgl.: http://www.nl-menu.nl/nlmenu.eng/nlmenu.html

25) Vgl.: http://www.konbib.nl/dutchess/

26) Vgl.: http://www.ukoln.ac.uk/metadata/

27) Vgl.: BIBLINK: Linking Publishers and National Bibliographic Services: http://www.ukoln.ac.uk/metadata/biblink/

28) Vgl.: DESIRE: Development of a European Service for Information on Research and Education: http://www.ukoln.ac.uk/metadata/desire/

29) Vgl.: Resource Organisation And Discovery in Subject-based services: http://www.ukoln.ac.uk/metadata/roads/

30) Vgl.: http://www.ukoln.ac.uk/services/elib/

31) Vgl.: ADAM: Art, Design, Architecture and Media: http://www.adam.ac.uk/

32) Vgl.: EELS: Engineering Electronic Library, Sweden: http://www.ub2.lu.se/eel/eelhome.html

33) Vgl.: CEDARS: CURL (Consortium of University Research Libraries) Exemplars in Digital Archives: http://www.ukoln.ac.uk/metadata/cedars/

34) Vgl.: Informationsdienste für die Mathematik im Internet: http://www.math-net.de/

35) Vgl.: Globale Elektronische und Multimediale Informationssysteme für Naturwissenschaft und Technik: http://www.global-info.org/


Stand: 09.11.98
Seitenanfang