Clearinghouse
für bibliothekarische Internetquellen - ein Service des EDBI

Kooperative Erschließung von bibliothekarischen Internetquellen - ein Projekt des EDBI

Brigitte Rüdiger und Martin Baumgärtel, Deutsches Bibliotheksinstitut, Berlin
gekürzte Version des Vortrages gehalten auf der 2. INETBIB in Potsdam

Inhaltsübersicht:

1. Einleitung
2. Problemstellung
3. Lösungsansatz
3.1Datenbank
3.2 Kooperative Dateneingabe
3.3 Anwendungsbeispiel
4. Vorführung der einzelnen Funktionen der Datenbank
5. Technik
6. Stand des Projektes und Ausblick
7. Literatur und verwandte Projekte

1. Einleitung:
Zunächst zu den Rahmenbedingungen für dieses Projekt: Die Projektmitglieder arbeiten innerhalb des DBI abteilungsübergreifend. Das Projekt wurde von Herrn Prof. Beyersdorff befürwortet und Ende Juli wurde mit den Arbeiten begonnen. Die Projektgruppe besteht aus 3 Personen, die diese Aufgabe neben ihrem eigentlichen Arbeitsgebiet betreuen. Ende Juli erfolgte eine Projektankündigung "Clearinghouse für bibliothekarische Internetquellen" in den Mailinglisten "INETBIB" und "ForumOeb". Die Reaktionen waren überwiegend positiv.

Zur Begriffsklärung:
"Clearinghouse" nach der Definition von Rusch-Feja: "Clearinghouses bestehen aus aufgearbeiteten Zusammenstellungen von verschiedenen Internet-Quellen, die für ein bestimmtes Fachgebiet oder für mehrere verwandte Gebiete von einer oder mehreren Personen als Suchhilfen zusammengestellt werden."1

"Zur Zeit findet ein rasanter Ausbau solcher "Clearinghouses" und virtual subject libraries durch gegenseitige Kooperation und Anregungen von Nutzern, weitere Links in solchen Quellensammlungen aufzunehmen, statt. Der Vorteil solcher durch intellektuelle Selektion zusammengestellten Fachquellen ist m.E. offensichtlich: noch sind die Suchmaschinen nicht in der Lage, Redundanz der Quellen auszuschließen und aussagekräftige Rückschlüsse über inhaltliche Qualitätskriterien außer der Frequenz des Auftretens eines Stichwortes zu geben."2

2. Problemstellung
Für Angebote im Internet, die den bibliothekarischen Bereich betreffen, gelten die gleichen Voraussetzungen und Fragestellungen, die die heutige Benutzung des Internets mit sich bringen:

  • mannigfaltige Informationen sind vorhanden
  • die Informationsmenge wächst ständig
  • qualitativ (hinsichtlich Aktualität, Strukturierung etc.) sind die Angebote sehr heterogen
  • keine festen Hierarchien - potentielle Gleichberechtigung aller Angebote

Als Folge treten für Benutzer wie für Anbieter folgende Probleme in den Vordergrund:

  • schwierige Navigation
  • wie kann Information gewichtet/bewertet werden?
  • wie werden eigene Angebote im Internet eingeordnet?
  • wie aktuell ist das Angebot, wie hoch ist der Pflegeaufwand (Bsp: veraltete URL's)?

Nicht zuletzt durch diesen Zustand verstärkt sich die Nachfrage nach allgemeinen Suchdiensten, sei es in Form von Suchmaschinen, thematischen Suchdiensten wie z.B. DINO, sogenannten Clearinghouses (Bsp: BUBL), Virtuellen Bibliotheken (Bsp: UB Düsseldorf) oder speziellen Subject Guides als Bewertungshilfe und Orientierung.
Ein weiterreichender Ansatz ist die Entwicklung von sog. Software-Agenten. "Agenten sind Suchwerkzeuge, die der Anwender selbst durch den Datenbestand des Web schickt. Sie werden mit möglichst vielen Kriterien gefüttert. Hierbei handelt es sich nicht um Datenbanken, die im Web liegen, sondern um lokale Anwendungen, die diese Aufgabe übernehmen."3. Zu diesem Ansatz aus der Informatik-Sparte KI (Künstliche Intelligenz) bestehen z.Zt. unserer Kenntnis nach noch keine nennenswerten, breitenwirksamen Produkte.

So stellt sich auch bei der Erschließung von bibliotheksrelevanten Angeboten das Problem, daß es bereits eine Vielzahl von größeren und kleineren Sammlungen von Internetquellen gibt, die für Bibliotheken relevante WWW-Angebote erschließen. Diese Sammlungen enthalten in einem großen Ausmaß immer wieder die gleichen URL-Adressen, d. h. die scheinbar so große Angebotsmenge reduziert sich auf einen überschaubaren Kreis von interessanten Anbietern, die auch empfohlen und genutzt werden können.
Die Pflege der gesammelten Internetquellen durch die Anbieter ist aufwendig und sehr unterschiedlich ausgeprägt (abhängig von Kenntnisstand und Umfeld z.B. Studenten, Bibliothekare, Fachfremden).

Ein Beispiel für eine Sammlung von bibliothekarisch relevanten Internetquellen ist die UB Augsburg mit ihren WWW-Seiten "Quellen für den Auskunftsdienst". Diese erschließen ihr Angebot auf statischen HTML-Seiten, d.h. ihr Angebot ist nicht suchbar. Die Betreuung wird von einen oder mehreren Personen vorgenommen.

Ein Beispiel für ein Datenbankangebot sind die allgemein thematischen Suchdienste wie DINO. Die Einträge sind per einfacher Stichwortsuche suchbar. Die Inhalte sind aber nicht auf bibliothekarische Quellen beschränkt und werden von Fachfremden erstellt.

Ein Beispiel für die kooperative Zusammenarbeit sind die Projekte "WEBIS" und "IBIS". "WEBIS" beschränkt sich bei der Erschließung von Internetquellen auf SSG-Gebiete der DFG und "IBIS" bietet den direkten und systematischen Nachweis von wissenschaftlichen Internetquellen an ausgewählt durch ein geschlossenen Fachreferentenkreis. Genauere Projektbeschreibung im Anhang.

Der Ansatz für unser Projekt ist eine Kombination aus :

  • Einsatz einer Datenbank
  • Kooperative Eingabe von Daten ohne Beschränkung des Teilnehmerkreises (Passwort).
  • Anwendungsbeispiel: Nachweis bibliothekarischer Sammlungen von Internetquellen

3. Lösungsansatz

3.1 Datenbank:
Gegenüber den sich rasch verändernden Gegebenheiten (hinsichtlich der Adressen und der Inhalte) bringt das statische Konzept von HTML einen hohen Wartungsaufwand mit sich. Der Einsatz einer Datenbank bringt neben der besseren Verwaltung der Informationen (einschließlich der viel einfacheren Wartung) auch den Vorteil, daß die gesammelten Daten auch anderweitig (und gleichzeitig) genutzt werden können

3.2 Kooperative Dateneingabe:
Das Datenbankangebot wird durch kooperative Mitarbeit erweitert und aktualisiert. Jede/r kann in dieser Datenbank nach einem bestimmten Angebot suchen, selbständig mit Hilfe eines Formulars neue Angebote eintragen bzw. bereits vorhandene Einträge ändern. Das Löschen von Einträgen ist jedoch nicht direkt möglich, sondern nur per E-Mail an die Redaktion. Das heißt: die redaktionelle Verantwortung und die technische Betreuung der Datenbank wird während der Projektlaufzeit durch das DBI bestritten, die Eingabe und die Pflege der Datensätze erfolgt verteilt.

Vorteil dabei ist ein reduzierter Arbeitsaufwand, da die Liste nicht von einer Person gepflegt werden muß. Durch die Beteiligung externer Personen besteht bei der Datenerfassung ein breiterer Einzugsbereich. Ebenso wichtig ist die höhere Flexibilität: Neue Angebote und Änderungen können durch die eintragende Person innerhalb von Minuten wirksam in der Datenbank nachgewiesen werden.
Es können folgende Problem bei dieser Form der kooperativen Zusammenarbeit auftreten: Es fehlt möglicherweise an Motivation bei der Mitwirkung. Die Datenmenge stagniert anfangs auf niedrigem Niveau. Möglich ist auch ein Qualitätsverlust durch fehlerhafte und falsche Einträge. Damit würde der Pflegeaufwand für die Redaktion im DBI so ansteigen, daß wir zu einer Einschränkung der Freigabe mittels Paßwort gezwungen wären (was dann sofort passieren würde).
Wir gehen jedoch davon aus, daß sich mit dem Internet auch eines seiner ursprünglichen Prinzipien durchsetzt: Geben und Nehmen. D.h., der schnellen Verfügbarkeit qualitativ hochwertiger Informationen zu geringsten Kosten (im Vergleich zu kommerziellen Diensten) steht ein maßvolles Eigenengagement gegenüber.
Redaktionelle Betreuung der Datenbank heißt, das wir regelmäßig die neu hinzugekommenen Daten durchsehen und auf Fehler überprüfen und korrigieren, sowie irrelevante Angebote löschen.

3.3 Anwendungsbeispiel:
Als erstes Anwendungsbeispiel haben wir uns für ein übergeordnetes Verzeichnis von bibliothekarischen Quellensammlungen entschieden. D.h. der Nutzer findet in der Datenbank nur Listen von WWW-Seiten mit bibliothekarischen Inhalten z.B. die Liste "Deutsche Bibliotheken Online" vom HBZ, die Bibliotheken im Internet nachweist. Er findet keine einzelnen Nachweise oder Angebote z.B. die WWW-Seite einer einzelnen Bibliothek. Es handelt sich also um eine Art "Bibliographie der Bibliographien". Ein Angebot mit vergleichbarem Inhalt, jedoch nicht nur auf bibliothekarische Internetquellen beschränkt, findet man beim amerikanischen The Argus Clearinghouse , University of Michigan.

Der Erfolg dieses Clearinghouse bestätigte unsere Annahme, daß es ein Bedarf an einem übergeordneten Verzeichnis von gesammelten Internetquellen gibt. Ein zentraler Überblick über bereits existierende Listen kann Lücken und Doppelarbeit deutlicher sichtbar machen. Dies vereinfacht den Suchaufwand für den einzelnen und kann zu einer Strukturierung der Angebote führen. Für den Anbieter einer Liste bedeutet es umgekehrt, daß er für sein Angebot überregional und zentral werben kann.

Dieses Projekt wurde Ende Juli in der Mailingliste "INETBIB" vorgestellt. Ende November wurde die Projektdatenbank zu Testzwecken für einen kleinen Benutzerkreis geöffnet.
Verbesserungsvorschläge und Anforderungen, die uns mitgeteilt wurden, waren u.a.:

  • URL-minder = automatisches Registrierung von Neuzugängen in der Rubrik NEWS.

  • Automatische Routine des URL (ob Link noch stimmt oder nicht).

  • vorhandene Ressourcen miteinbeziehen. Teilweise konnten wir diese Anforderungen sofort umsetzen.

    4. Vorführung der einzelnen Funktionen der Datenbank

  • Zur Homepage

    5. Technik
    Das Angebot basiert auf der Verbindung zwischen einem relationalen Datenbanksystem und einem Web-Server, sämtliche Software läuft unter UNIX auf Rechnern des DBI. Nach einer kurzen Erprobung der Funktionsweise konnten die Programme inzwischen auf den Rechner migriert werden, auf dem der normale Web-Server des DBI läuft (www.dbi-berlin.de).
    Zum verwendeten Datenbanksystem (msql) existiert ein Programm, welches die CGI-Spezifikation bedient und die Verbindung zur Datenbank herstellt. Vorgefertigte Template-Files (HTML) werden so on the fly mit aktuellen Informationen aus der Datenbank angereichert bzw. werden Daten aus HTML-Formularen an die Datenbank mit der entspr. Operation (z.B. INSERT, UPDATE) übergeben.
    Das Datenbanksystem zeichnet sich durch den sparenden Ressourcenverbrauch aus, die Funktionalität ist daher eher schlank. Deshalb wurden zunächst einige Routinen beigestellt, die kleinere Aufgaben, wie z.B. die Erzeugung der richtigen Datums-Formate, erledigen.
    Über die Kopplung mittels CGI zwischen Web-Server-Prozeß und DBMS-Prozeß können theoretisch beliebig viele Datenbanken angesprochen werden. Diese Tatsache wird sich das DBI für andere Angebote aus dem Spektrum des hauseigenen Web-Servers zunutze machen.

    Perspektive: Der Weg über CGI ist mittlerweile in die Diskussion gekommen, da bei stark frequentierten Servern bei Datenbankankopplungen über Scripts Leistungseinschränkungen hinzunehmen sind (UNIX-Forking ( Antwortzeiten!). In Abstimmung mit den Web-Mastern des DBI wird der Einsatz des Apache-Servers in Betracht gezogen, um das jetzige Programm (mit leichten Abwandlungen) als Modul hinzuzulinken und dadurch die Funktionalität in den Server zu integrieren.
    Das Datenbanksystem msql liegt seit Anfang '97 in Version 2.0 vor, einige von uns von Hand hinzugefügte Elemente können dann ggf. entfallen, da der Server um diese Funktionalität bereichert worden ist (Datumfelder, vollständige Auflösung logischer Ausdrücke).

    (Funktionsschema - 11k/gif).

    6. Stand des Projektes und Ausblick
    Die Datenbank ist seit Januar 1997 auf dem DBI-WWW-Server für alle Interessierten geöffnet. Die Ankündigung erfolgt im Februar-Heft des Bibliotheksdienstes, sowie an die Mitglieder der Mailingliste INETBIB.

    Die weiteren Planungen gehen nun dahin, die Datenbank nachzunutzen, z.B. für ein kooperativ geführtes E-Mail-Verzeichnis von Bibliotheken oder für speziell ÖB-bezogene Internetangebote etc.

    So wird momentan an einem zweiten Anwendungsbeispiel gearbeitet. Die bereits auf dem DBI-WWW-Server angebotene Liste Deutsche Öffentliche Bibliotheken im Internet wird auf Grund der großen Nachfrage und des relativ hohen Pflegeaufwandes demnächst als Datenbank angeboten. Auch hier gelten dann die Kriterien der kooperativen Dateneingabe.

    7. Literatur und verwandte Projekte

    • Körner, K.: Objekte statt Scripts : Sapphire/Web: Entwicklungs-Tool fürs Internet In: UNIX Open 10/96
    • Rusch-Feja, Diann: Informationsvermittlung, Informationsretrieval und Informationsqualität im Internet ZfBB 43 (1996) 4, S.329 - 360.
    • Rusch-Feja, Diann: Clearinghouses als Vermittlungsstellen für Fachinformation im Internet: Beitrag im Tagungsband auf der 1. INETBIB-Tagung in der UB Dortmund / bearb. von Barbara Jedwabski und Jutta Nowak. - 2. erw. Aufl., 1996, S. 63 - 80.
    • Schmelze, Oliver: Angebunden : Datenbankanwendungen mit dem W3-Gateway für mSQL In: iX 2 / 1996, S. 158 - 162
    • Wätjen, Hans-Joachim: Mensch oder Maschine? Auswahl und Erschließung von Informationsressourcen im Internet
    • IBIS : von der Arbeitsgemeinschaft der Hochschulbibliotheken des Landes Nordrhein-Westfalen ist der Aufbau eines Internet-basierten Informationssystems des Landes Nordrhein-Westfalen beschlossen. Ziel dieses Projektes ist es, in einem kooperativen Verfahren die Ressourcen des Internet unter fachlichen Gesichtspunkten auszuwählen und zu erschließen.
    • WEBIS: Sondersammelgebiete im Internet: Bibliothekskooperation im WWW
      "Im Rahmen eines von der DFG geförderten Projekts wird an der Staats- und Universitätsbibliothek Hamburg ein WWW-Server mit einem Informationssystem für die von der DFG geförderten Sondersammelgebiete, die Zentralen Fachbibliotheken sowie Spezialbibliotheken aufgebaut. Der WWW-Server soll den betreffenden Einrichtungen die Möglichkeit geben, ihre Daten und Dienstleistungsangebote einem größeren Nutzerkreis im Internet zur Verfügung zu stellen. Bestehende Initiativen und Informationen auf bereits existierenden WWW-Servern können in das Gesamtsytem durch das Anlegen von Hypertextverweisungen integriert werden..."7


  • Fußnoten:
    1Rusch-Feja, Diann: Informationsvermittlung, Informationsretrieval und Informationsqualität im Internet ZfBB 43 (1996) 4, S.334.
    2Rusch-Feja, Diann: Clearinghouses als Vermittlungsstellen für Fachinformation im Internet: Beitrag im Tagungsband auf der 1. INETBIB-Tagung in der UB Dortmund vom 11.-13. März 1996, S. 52
    3Reibold, Holger: Orientierung im Netz In: Internet Magazin 1/97, S. 38
    4Ahlers, Torsten: SSG im Internet, Vortrag 1. INETBIB-Tagung in Dortmund vom 11.-13. März 1996


    Stand: 08.02.2000
    Seitenanfang