WWW Administration - Universitätsbibliothek Bielefeld

Wie können allgemein verbindliche Standards für elektronische Publikationen geschaffen werden?


Mark Bide

Einführung

Meine kurze Darstellung über die Entwicklung von Standards für elektronische Publikationen möchte ich damit beginnen, Ihnen einige Worte über mich selbst zu sagen, die vielleicht auch meine Voreingenommenheit verständlich machen werden. Obwohl ich in den letzten drei Jahren als Consultant gearbeitet habe, verbrachte ich die ersten 20 Jahre meines Arbeitslebens im Management des - vorwiegend wissenschaftlichen - Verlagswesen. Ich bin Verleger und tendiere deshalb dazu, die Perspektive des Verlegers auf die Fragen des elektronischen Publizierens anzuwenden.

In meiner Arbeit als Consultant beschäftige ich mich hauptsächlich mit den Auswirkungen neuer Technologien auf das Management von Verlagsprozessen. Dies erklärt auch mein Interesse an Standards für elektronische Publikationen. Die wesentlichen Fragen, die beantwortet werden müssen, sind: Brauchen wir Standards für elektronisches Publizieren, und wenn ja: Wie können diese entwickelt werden?

Standards für Elektronische Inhaltsverzeichnisse

Statt zu versuchen, diese Fragen nur abstrakt zu beantworten, möchte ich über zwei Projekte berichten, an denen ich beteiligt war, und die sich mit der Entwicklung von Standards für die Speicherung und šbertragung von elektronischen Inhaltsverzeichnissen (electronic tables of contents oder EToCs) beschäftigen. Das erste Projekt, welches 1994 begann, sollte einen ersten Entwurf für einen Standard für EToCs für Zeitschriftenpublikationen entwickeln. Das zweite, welches 1995 begann, entwickelt, aufbauend auf dem ersten Projekt, Standards für EToCs für Bücher. Beide Projekte werden von Book Industry Communications (BIC) koordiniert. BIC ist eine britische Körperschaft, die von der britischen Publishers' Association, der Library Association, der Booksellers' Association und der British Library finanziert wird. Die Projekte werden vom Research Fund der British National Bibliography gesponsert.

Diese beiden sind die ersten zwei BIC-Projekte, die sich direkt mit der Entwicklung von Standards für die Publikation von Inhalten befassen; bisher (seit seiner Gründung 1991) hat sich BIC vor allem mit der Entwicklung von Standards für elektronische Handelsbeziehungen und für bibliographische Datenbanken von Verlagen befaát. Aus diesen Arbeiten heraus entwickelte sich die Erkenntnis, daá einige Standards für die Publizierung von Inhalten wesentlich sind, wenn die Nutzer irgendeine Chance haben sollen, einen bestimmten Inhalt, an dem sie interessiert sind, genau zu identifizieren und zu lokalisieren.

Von dieser Erkenntnis aus war es nur ein kleiner Schritt bis zu der Erkenntnis, daá das erste Gebiet, wo Standards entscheidend sind, die Meta-Daten sind, also Informationen über Informationen. Die Hauptgründe für diese Erkenntnis sind zweifellos einleuchtend. Es ist besonders wichtig, Standards zu haben, wenn Informationen aus mehr als einer Quelle miteinander verbunden werden, um den Wert der Daten zu erhöhen. Dies trifft ganz sicher für Meta-Daten zu. Man kann sogar behaupten, daá Meta-Daten das einzige Gebiet sind, in dem so etwas wie eindeutig definierte Standards angewendet werden können.

So entschlossen wir uns, daá der Ausgangspunkt Inhaltsverzeichnisse sein sollten, und ganz speziell Inhaltsverzeichnisse von Zeitschriften, für die es einen schon etablierten kommerziellen Bedarf gibt.

Wirtschaftliche Rechtfertigung

Es bietet sich hier vielleicht an, ein paar Worte über die wirtschaftlichen Aspekte der Entwicklung von Standards zu sagen. Ich bin auf jeden Fall dafür, Standards nur dann zu entwickeln, wenn sie auch mit großer Wahrscheinlichkeit angenommen werden. Das bedeutet, daß sie sicher dort am effektivsten sind, wo sie einen schon existierenden Bedarf decken. Obwohl unsere Berichte natürlich nicht dafür gedacht sind, irgendein bestimmtes kommerzielles Modell für die Verwertung von elektronischen Inhaltsverzeichnissen darzustellen, setzten sie doch voraus, daß ihre Anwendung einen kommerziellen Wert besitzen wird. Die genaue Art dieses Wertes ist jedoch noch nicht ganz klar.

Während ich an dem EToC-Projekt gearbeitet habe, sprach ich auch ausführlich mit mehreren kommerziellen Anbietern von EToC-Daten für Bibliotheken. Ich entdeckte dabei, daß mindestens drei dieser Dienstleistungsunternehmen denselben Anbieter in den Philippinen benutzten, um immer wieder die selben Daten, fast zur selben Zeit, einzutippen. Diese mangelnde Effizienz ist für niemanden von Interesse, außer natürlich für den Anbieter auf den Philippinen. Auf den ersten Blick scheint es aber nicht jedem innerhalb der Angebotskette einsichtig zu sein, daß die Ineffizienz des einen jedem anderen auch schadet. Und wirklich: Oft erlebe ich, wenn ich mich mit Problemen dieser Art in der Angebotskette beschäftige, daß die Bereitschaft fehlt, auf Lösungen hinzuarbeiten, die offensichtlich nur jemand anderem in dieser Kette von Nutzen sein werden. Dabei gibt es nur eine Geldquelle in jeder Angebotskette. Demzufolge sollte es doch einleuchten, daß das Geld, welches nur ausgegeben wird, um die Infrastruktur zu erhalten, Geld ist, das jedem anderen in der Kette verloren geht. Ziel der Entwicklung von Standards ist es, diese Verschwendung zu begrenzen.

Bei der Beschäftigung mit Standards für elektronisches Publizieren müssen wir deshalb nach dem Punkt suchen, an welchem wir den ersten qualitätskontrollierten und standardisierten Arbeitsgang vorfinden. Dies ist der erste Arbeitsschritt beim Verleger.

Was ist ein Zeitschrifteninhaltsverzeichnis?

Als ich mit dem Zeitschriftenprojekt begann, hatte ich eine ziemlich genaue Vorstellung davon, wie ein Inhaltsverzeichnis aussieht: Eine Liste von Titeln und Autorennamen. Fast genauso wie die, die auf der ersten Seite einer typischen Zeitschrift stehen. Es wurde mir jedoch schnell klar, daß meine Idee von einem Inhaltsverzeichnis für das was gebraucht wird, ungenügend war. Wir brauchten tatsächlich einen Standard für die gesamte šberschrift des Artikels, einschließlich eines Abstracts.

Dies kompliziert die kommerziellen Belange zusätzlich, denn Verleger haben im zunehmenden Maße festgestellt, daß Abstracts als solche schon einen Wert haben, ebenso wie der gesamte Zeitschriftenartikel. Ich will aber nochmals betonen, daß die Entwicklung des Standards unabhängig von der Entwicklung des kommerziellen Modells ist.

Wenn es mir jedoch gestattet ist, diesen Punkt kurz beiseite zu stellen, so scheint mir, daß es doch sehr im Interesse der Verleger sein sollte, die Nutzung ihrer Inhaltsangaben in den Bibliotheken zu fördern, die ihre Zeitschriften abonnieren oder ihre Bücher kaufen. Ich bin deshalb schon sehr überrascht, daß einige Verleger versuchen, Bibliotheken davon abzuhalten, Inhaltsverzeichnisse von gedruckten Zeitschriften, die sie abonnieren, zu photokopieren und weiterzuleiten. Es würde mir gleichermaßen nützlich erscheinen, allen Nutzern einer bestimmten Bibliothek freien und unbegrenzten Zugang zum Inhaltsverzeichnis einer Publikation zu gestatten, welche die Bibliothek abonniert.

Die technologische Plattform

Nachdem wir entschieden hatten, daß wir einen Standard entwickeln müssen, der die gesamte Artikelüberschrift umfasst, bedeutete das, daß die Entscheidung über die technologische Plattform für den Standard im Wesentlichen schon für uns getroffen war. Da wir uns entschieden hatten, beim ersten Arbeitsschritt des Verlegers zu beginnen, bedeutete dies, eine Technologie zu nutzen, die in den Produktionsprozeß des Verlegers eingebettet sein kann. Das heißt also, daß wir keine andere realistische Möglichkeit hatten als SGML (Standard Generalised Markup Language) zu nutzen.

Wir wußten aber auch, daß der Einsatz von SGML-Standards nicht leicht ist. Viel Arbeit an Standards ist bereits von Verlegern geleistet worden und noch mehr wurde bereits begonnen. Die schon geleistete Arbeit hat die Schwierigkeiten für große Verlagshäuser aufgezeigt, eine einzige Standard-SGML DTD (Document Type Definition) innerhalb eines einzelnen Verlagsprogramms zu entwickeln. Ganz zu schweigen von einem Standard, der sich für mehrere Verlagshäuser eignen würde.

Die Europäische Arbeitsgruppe zu SGML, eine Gruppe europäischer Verleger und anderer, die an SGML interessiert sind, ist vielleicht der Entwicklung eines solchen Standards am nächesten gekommen. Diese Gruppe hat erfolgreich ein DTD entwickelt, genannt MAJOUR, auf den sich die DTDs, welche von den meisten Zeitschriftenverlagen genutzt werden, stützen. Ich möchte betonen, daß sie sich lediglich auf MAJOUR stützen. Kein Verleger, mit dem wir gesprochen haben, benutzt MAJOUR vollständig unverändert.

Zur selben Zeit, als wir an unserem Projekt gearbeitet haben, hat eine andere Gruppe von Verlegern, die OASIS-Gruppe (Organisation for Articles Standards in Science, eine lose Assoziation von STM-Verlegern), auch an der Entwicklung von Standards für ein "Minimum-Daten-Set" für Zeitschriftenüberschriften gearbeitet. Diese Arbeit war auch lose mit MAJOUR verbunden, zielte aber nicht darauf ab, eine SGML DTD zu entwickeln.

Auf einer gut besuchten offenen Zusammenkunft der Verleger, die im September 1994 in London stattfand, entschieden die Anwesenden überraschend einheitlich, daß wir die MAJOUR DTD als unseren Standard nutzen sollten - ein Standard für Speicherung und šbertragung. Das sollte aber nicht bedeuten, daß jeder Verleger die reine MAJOUR für die eigene, interne Nutzung anwenden müßte, ein Weg der sich als unbeschreitbar erwiesen hatte. Es bedeutete lediglich, daß alle Verleger DTDs nutzen sollten, die für Austauschzwecke in MAJOUR konvertiert werden konnten. Da die meisten Verleger eine erweiterte MAJOUR nutzen (um es noch komplexer zu machen), sollte diese rückwärtige Kompatibilität nicht zu schwierig zu erreichen sein.

Es gab eine wesentliche Voraussetzung, nämlich daß MAJOUR kompatibel mit dem "Minimum-Daten-Set" der OASIS-Gruppe sein mußte, welches bis zu diesem Zeitpunkt noch nicht vollständig war. Dies ist zweifelsohne eine der größten Schwierigkeiten, die entstehen, wenn man Standards entwickeln will - daß man, um ihre Akzeptanz zu sichern, häufig darauf warten muß, daß andere ihre Arbeit beenden, um die Ergebnisse in den zu entwickelnden Standard einzubauen.

Identifizierung einzelner Artikel

Dasselbe traf auch für ein anderes wesentliches Gebiet der Meta-Daten-Standards zu: das Problem der Identifizierung einzelner Artikel. In diesem Falle waren wir sehr daran interessiert, eng mit SISAC (Serials Industry Systems Advisory Committee), der amerikanischen Vereinigung für die Standards von Zeitschriften, zusammenzuarbeiten. Sie haben unsere Arbeit mit den EToCs sehr unterstützt. Und damit diese effektiv sein würde, brauchten wir ihre Zustimmung. Sie haben über mehrere Jahre hinweg einen Standard entwickelt, den viele Verleger für die Identifizierung von einzelnen Zeitschriftenausgaben und die Artikel innerhalb der Ausgaben angenommen haben; dies ist der SICI (Serials Item and Contribution Identifyer), NISO Standard Z39/56. Es gab auch andere Mitbewerber, unter ihnen die BIBLID (Bibliographic Identification of Contributions in Serials and Books). Jedoch hat der SICI den Vorteil, bereits aktiv genutzt zu werden. Etwas, was offensichtlich bei anderen Identifikationsschemen nicht der Fall ist.

Es hat sich jedoch herausgestellt, daß SICI vom Standpunkt des Verlegers aus einige wesentliche Nachteile aufweist, die hauptsächlich mit der Identifizierung einzelner Artikel bereits vor der Veröffentlichung zu tun hat. Es war uns versprochen worden, daß diese Probleme in einer šberarbeitung der SICI diskutiert werden und bis Ende 1994 gelöst sein sollte. Es wird Sie vielleicht nicht weiter überraschen, daß diese Revision jetzt schon 12 Monate Verspätung hat, was eine entscheidende Ursache für Verzögerungen bei uns ist.

Viele Anstrengungen werden gegenwärtig unternommen, um universelle Schemen für die Identifizierung von digitalem Inhalt jeglicher Art zu entwickeln: Text, Graphik, Ton, bewegliche Bilder. Die vorgeschlagenen Schemen können in zwei Gebiete unterteilt werden: diejenigen, die "intelligente" Zahlen verwenden und die, die komplett "nichtssagende" Zahlen nutzen. In meinem Vortrag habe ich jedoch keine Zeit, bei diesem Thema ins Detail zu gehen.

Es scheint jedoch klar zu sein, daß wir uns den Luxus, auf eine universelle Lösung zu warten, die möglicherweise Jahre oder noch Jahrzehnte dauern wird, nicht leisten können. Verleger und die Nutzer von Verlagsprodukten brauchen eine pragmatische Lösung, die sehr schnell angewendet werden kann.

Der SICI hat in seiner überarbeiteten Version, die nun wirklich in Kürze fertiggestellt sein soll, mehrere Vorteile:


Sekretariat der Bibliothek der Universität Bielefeld