Publikationen Hierarchiestufe höher Vorherige Seite Nächste Seite

Bibliotheksdienst Heft 12, 96

Erschließung von Internet-Quellen durch Metadata

Ergebnisbericht des 2. DELOS-Workshop

Diann Rusch-Feja

Das Informationsangebot im Internet erstreckt sich über Tausende von Ressourcen, die nur teilweise in verschiedenen Listen, "Katalogen", Datenbanken (als Basis für unterschiedliche Search Engines) und/oder Sammelquellen nachgewiesen sind. Um zu vermeiden, daß ein Verzeichnen einzelner Quellen relativ willkürlich und kaum nachvollziehbar geschieht, wurde ein Satz von Erschließungselementen auf internationaler Basis erarbeitet, die zum Zweck verbesserter Recherche und Nutzung von Internet-Quellen eingesetzt werden1). Diese Elemente finden erstmalige Anwendung vereinzelt in Skandinavien, USA, Großbritannien, Australien und Neuseeland. Einzelne Fachgesellschaften in Deutschland unterstützen die Anwendung dieser Erschließung durch Metadata bei ihrer Erstellung von gemeinsamen, verteilten Informationssystemen.

Ausschlaggebend für die Entwicklung in Deutschland war ein Workshop zum Thema "Metadata and Interoperability", der vom 7.-8. Oktober 1996 in Bonn-Bad Honnef stattfand. Der Workshop wurde von Dr. Thomas Baker (GMD) unter der Schirmherrschaft der ERCIM (European Research Consortium for Informatics and Mathematics) organisiert und war der zweite in einer Reihe von internationalen DELOS-Workshops zum Thema strategischer Fragen zur Informationsdarbietung im Internet. Der erste fand am 4.-5. März 1996 bei INRIA, Sophia Antipolos (Nize), statt - jedoch ohne Teilnehmer aus Deutschland außer Dr. Baker.

Der 2. DELOS-Workshop hat als Grundlage die Diskussion über den zur Zeit vorliegenden Vorschlag für einen Satz von Metadata-Elementen für die formale und inhaltliche Erschließung von Internet-Quellen, den man Dublin Core nennt 2). Metadata beinhaltet Kategorien von zusätzlichen, übergeordneten Daten zu Informationseinheiten im Internet, die als "document-like objects" bezeichnet werden, aber auch viele andere Formen von Internet-Quellen einschließen. Durch die entsprechenden Metadata-Tags werden zusätzliche inhaltliche und formale Aspekte mit den Dateien verbunden - ähnlich wie bei der herkömmlichen bibliothekarischen Katalogisierung -, die dann von Suchmaschinen und anderen methodischen Suchstrategien aufgegriffen werden. Dadurch soll ein präziseres Suchverfahren und eine höhere Quote von Direkttreffern ermöglicht werden.

Der Satz der Dublin Core-Metadata-Elemente wurde 1995 und 1996 in zwei Workshops in Dublin, Ohio (OCLC) und Warwick, England auch im Kontext des größeren Rahmens des Warwick-Framework erarbeitet. Nach der Definition des Dublin Core bestehen Metadata-Tags aus bis zu 13 Kern-Elementen, die wiederum beliebig oft und mit weiteren Unterbegriffen qualifiziert werden können:

Dublin Core-ElementDeutsche Übersetzung ggf. mit Beschreibung 3)
DescriptionBeschreibung (Schlagwörter, Stichwörter, Abstract)
TitleTitel
AuthorAutor (Person(en), die den Inhalt verantworten - kann auch andere Bezeichnungen haben, z.B. Komponist etc.)
PublisherHerausgeber / Verleger
Other AgentAndere beteiligte Personen (sekundäre, jedoch intelektuell beteiligte Personen an dem Werk, z.B. Übersetzer, Herausgeber etc.)
DateDatum (der Veröffentlichung)
Object TypeArt der Quelle (Literatur, Nachschlagewerk, Software-Programm etc.)
Form (Format)Format der Quelle (.htm, .html, .gif, .jpeg, .ps, .exe etc.)
IdentifierURL, URN bzw. andere Zahlen- / Buchstabenkette, die das Objekt eindeutig identifiziert
RelationVerhältnis dieser Quelle zu anderen
SourceQuellenwerk (gedrucktes oder elektronisches Werk, von dem das vorliegende Objekt ein Derivat ist)
LanguageSprache
CoverageAbdeckungsaspekte (zeitliche, örtliche, flächenhafte etc. Aspekte, die zur Charakterisierung des Objekts sinnvolle Ergänzungen geben, z.B. bei Karten, Bildern etc.)

Diese Metadata-Elemente beziehen sich primär auf die ergänzende Beschreibung des Inhalts und der Form (bzw. des Formats) und dienen vorwiegend der für sinnvolles, gezielteres Retrieval erforderlichen Indexierung. Die Gesamttypologie von Metadata schließt aber auch weitere Metadata-Elemente mit ein. Solche beziehen sich auf Nutzungs- und Beschaffungsaspekte (z.B. Bezugsbedingungen, Lizenzaspeke etc., die im Elementensatz "Terms and Conditions" untergebracht werden) oder auf den Kontext, für den das Objekt hergestellt worden ist ("Context"), etc.4). Solche sind jedoch noch nicht standardisiert bzw. bis jetzt ist noch kein Konsensus gefunden worden, wie bei den inhaltlichen und formalen Erschließungselementen des Dublin Core. Weiterführende Aspekte der Informationsquellen-Analyse, -Bewertung, -Benutzungsbemessung sowie der Informations-Repräsentation sind noch nicht festgelegt, obwohl bereits einige informationswissenschaftliche Gremien innerhalb (und außerhalb) der Internet Engineering Task Force diesen Aspekten nachgegangen sind.

Im Workshop in Bonn-Bad Honnef erläuterten mehrere Mitgestalter des Dublin Core (Stuart Weibel, John Kunze) und des Warwick Framework (Carl Lagoze) die Konzepte von Metadata, ihre Einsatzmöglichkeiten, den Stand des Konsensus und Aspekte der "Interoperability". Gerade letzteres stellte sich als noch stark definierungs- und präzisierungsbedürftig heraus, zumal dieser Begriff sich auf eine Reihe technischer Aspekte der Kommunikation und Verarbeitungsmöglichkeiten unter den unterschiedlichen Systemen, auf datentechnische Aspekte der Datenformate und -kompatibilität, auf sprachliche Aspekte der Multilingualität bei Internet-Quellen und ihrer zielgerechten Benutzung etc. bezogen hat. Vertreter der NSF-digitalen Bibliotheksprojekte in Stanford University (Andreas Paepke), University of Michigan (Daniel Kiskis, Gene Alloway) sowie europäischer Projekte, wie in der Bibliothèque de France (Sonia Zillhardt), der Deutschen Gesellschaft für Mathematik (Judith Plümer, Joachim Lügger), der niedersächsischen Staats- und Universitätsbibliothek (Hans-Jürgen Becker), des Deutschen Bildungs-Servers (Diann Rusch-Feja) erläuterten ihre Ansätze zur Sammlung und Erschließung von Internet-Quellen in Anlehnung an das Dublin Core. Weitere Vortragende sprachen über die konzeptuellen Grundlagen zur Lösung struktureller Probleme bei der Interoperabilität, über Abwicklungsmechanismen für weitere Metadata wie bei Zahlungsvorgängen, über Kompatibilität der Retrievalsysteme, Datenbanksysteme etc. Auch die Probleme von Thesauri, Hierarchien von Attributen, und der Ansprechbarkeit verschiedenartiger Datenquellen in einer Recherche wurden diskutiert.

Dieser 2. DELOS-Workshop hatte 34 Teilnehmer aus 13 Ländern (USA, Großbritannien, Frankreich, Niederlande, Norwegen, Schweden, der Schweiz, Portugal, Ungarn, Griechenland, Italien, Australien, und Deutschland). Darunter waren überwiegend Mathematiker und Informatiker, zumal diese Berufssparte eine der ersten war, die sich mit verteilten Informationssystemen und der systematischen Erschließung von Internet-Quellen und elektronischen Publikationen befaßt hatte. Die bibliothekarischen und dokumentarischen Aspekte waren auch, aber im Rahmen des stärker technisch bezogenen Umfelds, vertreten. Ein ausführlicher Bericht über die einzelnen Vorträge des Workshops wird in Kürze erscheinen. Nähere Angaben zum Workshop sind auch über die URL http://www.area.pi.cnr.it/ErcimDL/delos.html zu finden. Weitere Workshops zum Thema Metadata sind für überwiegend deutsche Teilnehmer geplant. Ansprechpartner für die ersten dieser Work-shops, der sich auf die Aktivitäten der Fachgesellschaften abzielt, ist Dr. Hans-Jürgen Becker, Niedersächsische Staats- und Universitätsbibliothek, Göttingen (becker@sub.uni-goettingen.de).

Der Dublin Core ist grundsätzlich einfach angelegt, so daß eine Vielfalt von Erstellern solcher Quellen diese Metatags (Elemente) anwenden können und die Praxis dieser Art von Erschließung akzeptiert wird. Gleichzeitig jedoch sind diese Metatags so erweiterbar, daß sie den Bedürfnissen hochspezifischer Benutzergruppen nach Präzision sowohl bei der Indexierung als auch bei der Recherche durch das Dublin Core genügen und auch eine Akzeptanz dieser Gruppe erzielt bzw. das Internet wissenschaftsfähig macht. Autoren können - wie bereits in vielen Fällen für Journalartikel und Datenbankmeldung von Forschungsprojekten - inhaltliche Erschließungstermini (Deskriptoren, "Key Words" etc.) sowie auch Hinweise auf den Adressatenkreis und Verbindungen zu anderen Internet-Quellen angeben. Somit kann die Qualität der inhaltlichen Erschließung angehoben werden. Sicherlich können diese Angaben auch von bibliothekarischen oder dokumentarischen Kräften vergeben werden, jedoch nicht ohne gewisse zeitliche Verzögerungen und ggf. nur in Rücksprache mit dem fachvertrauten Wissenschaftler. Formale Aspekte können aus Referenzlisten übernommen werden (ein Metatags-User-Guide befindet sich bereits in der Vorbereitung) oder von bibliothekarischen oder redaktionellen Kräften ergänzt bzw. eingearbeitet werden.

Dies bedeutet nicht, daß der Wissenschaftler oder andere Ersteller von Internet-Ressourcen die Arbeit der Bibliothekare und Dokumentare übernimmt. Eine engere Zusammenarbeit dieser Gruppen kann zur Arbeitserleichterung sowie zur Verbesserung der Informationsvermittlung und -recherche führen. Größere Fachkenntnisse seitens der Erschließenden werden vorausgesetzt, diese jedoch werden nicht nur bei den Erschließungsarbeiten, sondern auch bei den weiteren informationsvermittelnden und vorab bewertenden Tätigkeiten bei diesen neuen Medienquellen notwendig sein. Die Implikationen dieser Entwicklung sind weitreichend:

Die Katalogisierung von Dokumenten und anderen Internet-Ressourcen wird durch die Vergabe von Metatags weitgehend überholt. Zeitersparnisse und verbesserte Erschließung bzw. Informationsvermittlung können dadurch erreicht werden. Durch die Anwendung eines international vereinheitlichten Satzes von Erschließungselementen, die auch breit genug angelegt sind, daß sie die Erschließung verschiedenstartiger Daten-, Bild- und anderer -quellen gerecht werden, werden andere Probleme der Multilingualität, der Inkompatibilität von Systemen und von semantischen Strukturen ("Interoperabilität") leichter zu lösen und zu überwinden sein.

Gerade weil das Internet eine internationalisierende Tendenz hat, sollen Standards angestrebt werden, die sprachübergreifend und Nationalregeln übergreifend zum Zweck der Recherche und Informationsvermittlung anzuwenden sind, ohne daß die Individualität einzelner Sprach- und Regionalbezogenheit gefährdet wird. Die weiteren Entwicklungen auf diesem Gebiet werden sowohl für den gegenwärtigen Trend zum Aufbau digitaler Bibliotheken als auch für die sich bereichernden Informationsvermittlungsaufgaben der Bibliothekare, Dokumentare - ja alle Informationsprofessionelle wichtige Aspekte aufschlagen, die für die Veränderung unserer Serviceleistungen und Arbeitsfeld unabdingbar sind.

1) Thomas Baker: Schlag nach im Netz. Die Zeit, Nr. 36, 30.8.1996, S. 74, auch (http://win.bda.de/bda/int/zeit/aktuell/artikel/WEBKATA.TXT.19960830.html)

2) Vgl. Stuart Weibel: A Proposed Convention for Embedding Metadata in HTML <June 2, 1996> (http://www.oclc.org:5046/~weibel/html-meta.html), und Carl Lagoze, Clifford A. Lynch, Ron Daniel Jr.: The Warwick Framework: A Container Architecture for Aggregating Sets of Metadata, 24.06.1996 (http://cs.-tr.cs.cornell.edu/warwich/warwick.ps); siehe auch Stuart Weibel: Metadata: The Foundations of Resource Description. D-Lib Magazine. July 1995 (http://ukoln.bath.ac.uk/dlib/july95-weibel.html); Paul Miller: Metadata for the masses. Ariadne September 1996 (http://www.ukoln.ac.uk/ariadne/issue5/metadata-masses/)

3) Der aktuellste Stand wird in Zukunft auch unter http://www.mpib-berlin.mpg.de/DOK/metatagd.htm zu finden sein

4) Eine Auflistung der weiteren möglichen Metadata-Elemente geben Lagoze/Lynch/ Daniel: The Warwick Framework ... unter der Überschrift "Metadata takes a variety of forms, both specialized and general."


Seitenanfang