WWW Administration - Universitätsbibliothek Bielefeld

Zugriff zu wissenschaftlichen Informationen vom eigenen Computer aus


Solke H.J. Veling (Tilburg Universität) und Chris Luiters (Elsevier Science)

Einführung

Seit dem 25. April 1995 haben Studenten und Angestellte der Universität Tilburg (TU) von ihren eigenen Computern aus Zugang zu einem einmaligen Informationsdienst: wissenschaftliche Artikel aus über einhundert Zeitschriften, die von Elsevier Science publiziert wurden, sind jetzt einsehbar.

Dieser Vortrag ist ursprünglich und hauptsächlich ein Diskussionsbeitrag zu infrastrukturellen Aspekten solcher Dienstleistungen. Dann wird die Software, die speziell für diesen Informationsdienst entwickelt wurde, betrachtet. Und zum Schluß soll die Bedeutung dieses neuen Informationsdienstes im Zusammenhang mit der Entwicklung zur Virtuellen Bibliothek diskutiert werden.

Infrastruktur und Informationsdienstleistungen

Während der letzten fünf Jahren hat das Konzept des "integrierten Desktop" für Studenten und Angestellte an der TU eine konkrete Gestalt angenommen. 25.000 Computer auf dem Campusgelände sind mit der Standardsausstattung einer Software für wissenschaftliche und bildungspolitische Zwecke ausgerüstet worden. 700 dieser Computer stehen den Studenten zur Verfügung, die Mehrzahl davon befindet sich in dem neuen, hoch technisierten Bibliotheksgebäude. Die Bibliothek hat Arbeitsplätze für 900 Studenten, 450 davon sind mit Computern ausgerüstet.

Die Standardausrüstung besteht aus einer Software zur Büroautomatisierung (dazu gehören Textverarbeitung, Kalkulations- und Präsentationsprogramme, Statistiken etc.), Kommunikationssoftware (unter anderem e-mail, Internetanschluß, File Server Verbindung), sowie eine Software zur Informationswiedergewinnung (u.a. das holländische Telefonbuch, Zugfahrpläne, zahlreiche CD-ROMS, Bibliothekskataloge, Inhaltsverzeichnisse von Zeitschriften, eine graphische Internet-Oberfläche und etliche Datenbanken zu speziellen Themen). Allen Angestellten und Studenten ist die Nutzung dieser Dienstleistungen gestattet: Jeder bekommt einen Nutzernamen, ein Passwort, eine e-mail Adresse und eine Kopie der Geschäftsbestimmungen. Studenten erhalten dazu auch noch einige "Verhaltensmaßregeln", und sie müssen ein Formular ausfüllen und bescheinigen, daß sie sich mit dieser Net-etiquette (Verhaltensmaßregeln) einverstanden erklären. Sobald dieses Formular wieder abgegeben haben, werden alle Dienstleistungen aktiviert und der Student hat freien Zugang. An allen zur Verfügung stehenden Computer kann nach der Eingabe des Nutzernamens und des Passworts gearbeitet werden. Durch ein Reservierungssystem ist es auch möglich, einen bestimmten Computer für eine bestimmte Zeitperiode zu reservieren. Fast alle Universitätsangestellten haben ihren eigenen Computer.

Die großen Vorteile einer solchen homogenen Infrastruktur für Studenten und Angestellte sind die einfache Handhabung und die Möglichkeit, eine neue Funktion einzufügen, die dann automatisch auch von allen genutzt werden kann. Mit der zunehmenden Erfahrung ist es möglich geworden, in bestimmten Zeitabständen neue Dienstleistungen anzubieten, die dann auch nur recht wenig Aufsicht und Instandhaltung benötigen.

Mit anderen Worten: eine neuer Service kann, wenn er lange genug getestet worden ist, mit einem einzigen Knopfdruck den schon existierenden beigefügt werden. Das gilt auch für die neuen Informationsdienstleistungen, die hier vorgestellt werden. Neue Versionen der Software werden geliefert und ohne Beeiträchtigung der Nutzer installiert. Sozusagen beim Einschalten des Computer bemerkt der Nutzer, daß ein neuer Service dazugekommen ist. Es ist von großer Bedeutung, daß die Studenten und Angestellten während der Einführungsphase genügend Informationen über diese neue Dienstleistungen erhalten.

Die Software

Um den kompletten Text von Zeitschriftenartikeln von der Datenbank auf die verschiedenen Computern zu übertragen, ist eine spezielle Client/Server Software entwickelt worden. Diese Software, KWIK genannt, basiert auf noch fortlaufenden Arbeiten, die an der Carnegie Mellon Universität (CMU) in Pittsburgh, USA, stattfinden. Wenn KWIK benutzt wird, können viele Nutzer an verschiedenen Orten bedient werden. Momentan gibt es zehn Datenbanken (Zeitschriftenartikel, eine Datenbank von Abbildungen und verschiedene bibliographische Datenbanken). Der Standard, der in der Kommunikation zwischen Nutzer und Anbieter gebraucht wird, ist von entscheidender Bedeutung (Z39.50).

Ein besonderes Merkmal des Clients besteht darin, daß er unabhängig vom Format des Dokuments ist. Dies wird dadurch erreicht, daß verschiedene "viewers" verwendet werden, die automatisch, auf der Basis der Eigenschaften des Dokumentes, gewählt werden (gegenwärtig: tiff, pdf, jpeg). Weitere Maßnahmen müssen getroffen werden, um die großen Datenmengen, die für Abbildungen benötigt werden, speichern zu können. An der Universität Tilburg wird hierzu eine "jukebox" mit magnetisch-optischen wiederbeschreibbaren Disketten benutzt (38 Gigabyte), denen eine zusätzliche Speicherkapazität (3 GB) hinzugefügt wurde.

Ein neuer Informationssdienst: EASE

EASE (Elsevier Articles Supplied Electronically) ist ein kooperatives Projekt zwischen der TU und Elsevier Science (ES). ES ist mit mehr als 1.200 englischen Zeitschriften marktführend in der Veröffentlichung von wissenschaftlichen Arbeiten. Die Titel umfassen ein breites Spektrum von Chemie und Physik über Biomedizin zur Wirtschaft.

Der Prozeß der wissenschaftlichen Informationsdienstleistungen wird oft durch eine Kette dargestellt, die die verschiedenen Mitspieler identifiziert. Der Autor, ein Wissenschaftler, schreibt über seine/ihre Forschung einen Artikel und schickt ihn an eine der vielen Zeitschriften auf diesem Gebiet, die weltweit veröffentlicht werden. Die Redakteure (entweder extern oder intern) überarbeiten den Artikel entsprechend der Standards, die sowohl von Experten (Kollegen, die in demselben Gebiet arbeiten oder derselben Profession angehören) als auch von der Zeitschrift (Peer Review) festgelegt wurden, und dann erst erscheint der Arikel in der entsprechenden Zeitschrift. Der Verleger dagegen kümmert sich um den Produktionsprozeß, die internationale Vermarktung, und die weitere Verbreitung der Zeitschrift, die meistens durch Zwischenhändler erfolgt. Schließlich gelangt die Zeitschrift zu den Abonnenten, z.B. eine Universitätsbibliothek wie Tilburg. Und hier schließt sich der Kreis, denn die Autoren, die in diese Zeitschrift schreiben, gehören derselben Gemeinschaft an, wie die Leser der Zeitschrift.

In vielen Ländern basiert der Status und die Anerkennung von Wissenschaftlern hauptsächlich auf der Quantität und Qualität ihrer veröffentlichten Arbeiten. Dieses Phänomen ist besser bekannt unter "Veröffentliche oder geh' unter" und ist auch für das enorme Anwachsen von wissenschaftlicher Literatur verantwortlich. Dieses exponentiale Wachstum von wissenschaftlichen Artikeln (mehr Wissenschaftler und mehr Artikel pro Wissenschaftler) hat in den letzten Jahren einen enormen Druck auf den Zeitschriftenmarkt ausgeübt. Steigende Preise, ein Anstieg an neuen Zeitschriften, alternative Veröffentlichungsmethoden und sinkende Bibliotheksbudgets haben wesentlich zu diesem Phänomen beigetragen.

Es ist deshalb für Verleger sehr wichtig, ihr Marketing so genau wie möglich auf ihre eigenen Zielgruppen (Autoren und Leser) auszurichten. Das wird besonders wichtig, wenn man die ständige Spezialisierung bedenkt, die zu Gebieten geführt hat, in denen es nur etwa 500 bis 1000 praktizierende Wissenschaftler gibt.

In den letzten Jahren hat ES an einer Reihe von internationalen Projekten gearbeitet, die die früher gedruckten Informationen elektronisch zugänglich machen. Diese Arbeit hat viele Erfahrungen gebracht, sowohl auf der technischen (die Wahl der Systemlösung und ähnliche Belange) als auch auf der strategischen Ebene (Preispolitik für elektronische Informationen, Urheberrecht, Lizenzbestimmungen).

In diesem Projekt sind Informationen über die Nutzer sehr wichtig, denn daraus lassen sich Rückschlüsse auf das Lese- und Suchverhalten von Studenten und Wissenschaftlern ziehen. Dieses Verhalten kann auch die Preispolitik für zukünftige Informationsdienste bestimmen (das wirtschaftliche Modell). Wie suchen Einzelpersonen nach spezieller wissenschaftlicher Literatur? Nutzen Sie die bekannten Zeitschriftentitel? Arbeiten sie mit Schlagwörtern? Benutzen sie Zusammenfassungen/Abstracts, oder ist es die erste Seite eines Artikels? Wird eine große Auswahl an Artikeln gedruckt und mit nach Hause genommen, um dann anhand der "gedruckten Version" zu entscheiden, welche Artikel von Bedeutung sind und welche nicht? Man hofft, von dem Projekt an der Universität Tilburg, die Antworten auf einige dieser Fragen zu finden.

Produktion und Lieferung

Sofort nach dem Erscheinen einer neuen Zeitschriftenausgabe wird die gedruckte Version von den fünf ES-Verlagen an den externen Produzenten geschickt. Die Herstellung von elektronischen Dateien geschieht durch Einscannen der gedruckten Version in diesem Produktionszentrum. Nachdem die elektronischen Dateien zu ES in Amsterdam geschickt und dort für rechtsgültig erklärt wurden, wird eine CD für TU hergestellt. Normalerweise erhält TU diese CD etwa fünf Wochen nachdem die gedruckte Ausgabe von den fünf ES-Verlagen abgeschickt wurde. Natürlich ist eines der Ziele, diese Zeitspanne weiter zu verringern. Außerdem konnte ES ein großes Stück bei der Umgestaltung des Produtionsprozesses weitergekommen, um diesen völlig medienunabhängig zu gestalten. Das Ziel ist es, den Artikel elektronisch verfügbar zu machen, bevor er gedruckt ist. Konkret heißt das: alle zwei Wochen wird von Amsterdam eine speziell für TU produzierte CD an das TU Rechenzentrum geschickt. Natürlich ist diese CD nur ein Transportmittel und kann nicht als eigenständiges Produkt genutzt werden. In Hinblick auf die begrenzte Netzwerkkapazität entschied man sich für die Versendung auf einer CD.

Diese CD enthält die elektronischen Dateien von durchschnittlich 50-75 Zeitschriftenausgaben. Die Universität Tilburg hat elektronische Abonnements für 120 Zeitschriften von Elsevier (einschließlich Titel, die als "imprints" erscheinen, so wie Pergamon/Nordholland). Diese elektronischen Dateien brauchen 300 bis 600 Mb Speicherkapazität pro CD!

Die gelieferten elektronischen Dateien bestehen aus vier Komponenten oder Bauelementen für die šbertragung in eine Datenbank:

Wenn die CD bei TU ankommt, werden diese Dateien automatisch in eine Datenbank eingespeist und noch am selben Tag für den Endnutzer zugänglich gemacht. Die Datenbank, in der diese Informationen gespeichert ist, heißt Online Contents Database. Diese Datenbank enthält Informationen über alle (momentan mehr als 40.000) Artikel aller Zeitschriften, die die TU abonniert (seit dem 1.Januar 1993). In Tabelle 1-5 ist eine typische Suche in Online Contents dargestellt.

Vorbedingungen

Diese zwei Dienstleistungen sind ziemlich einmalig, weil sie für die Angestellten von allen Computern der Universität und von allen 700 für die Studenten zugänglichen Universitätscomputern genutzt werden können. Im Prinzip kann die Clientsoftware überall auf dem Internet installiert werden. Für die Nutzung aus der Entfernung ist die Bandbreite von entscheidender Bedeutung. Wenn man die starke Nutzung des Internet bedenkt, dann empfiehlt es sich nicht, diesen Service außerhalb von Tilburg zu nutzen.

Eine andere wichtige Voraussetzung sind Vereinbarungen mit den Verlegern über die Nutzung von Volltextdateien auf dem Netzwerk. Die Vereinbarung zwischen TU und ES besagt, daß nur solche Artikel, die in Zeitschriften erscheinen, die TU abonniert hat, auch als Volltext angeboten werden. Darüberhinaus haben natürlich nur Universitätsangestellte und Studenten der TU Zugang zu diesen Informationen. Dritte Parteien können eine Informationssuche durchführen, aber der letzte Schritt, Volltextartikel auf dem Bildschirm, ist gesperrt.

Entwicklungen

Für Wissenschaftler, Lehrer und Studenten an Universitäten ist es von großer Bedeutung, daß immer mehr Zeitschrifteninformationen online zugänglich werden. Um dieses Ziel zu erreichen, müssen wesentlich mehr Verleger ihre Zeitschriften in elektronischer Form anbieten und ein Subskriptionssystem muß entwickelt werden (analog zu Universitätslizenzen für Software und CD-ROMs). Für den Nutzer ist es nicht so wichtig zu wissen, wo der Volltext gespeichert ist. In Ermangelung einer bezahlbaren "information highway" Infrastruktur ist es für den Nutzer besser, wenn die Informationen in der Nähe gespeichert werden.

Vom Technischen her gesehen, können in der Zukunft noch einige Dinge verbessert werden. Eine WWW-Version der Nutzeroberfläche wird momentan entwickelt. Andere Formate, besonders SGML und HTML, werden ebenfalls untersucht. Das wird zu einer Verbesserung der Bildqualität auf dem Bildschirm und in der gedruckten Version der wissenschaftlichen Artikel führen.


Sekretariat der Bibliothek der Universität Bielefeld