Wenn Gutenberg heute lebte, hätte er wohl die Datenbank erfunden. Durch den Buchdruck gelang es ihm, Wissen aus der Bindung an einen Ort zu befreien und durch beliebige Vervielfältigung jedem Interessenten zugänglich zu machen. Heute stehen wir am Ende des Zeitalters, in dem das Buch (und die Zeitschrift) zur Informationsübermittlung dienen. Umgebracht hat den Buchdruck letztlich sein eigener Erfolg. Über 50.000 Neuerscheinungen nur an Büchern kamen allein in der BRD 1984 heraus, und die Zahl der für die Wissenschaft besonders wichtigen Zeitschriftenaufsätze geht ins Astronomische. Die Information ist zwar (materiell) da, aber nicht mehr auffindbar, weil in einem Berg ihresgleichen versteckt. Was macht der moderne Gutenberg, um Wissen wieder dem zu vermitteln, der es braucht?

Er steckt es in den Computer. Das heißt, er digitalisiert Titelangaben oder Texte, die bereits gedruckt sind (oder übernimmt sie vielleicht auch schon digital) und schließt den Computer an eine Daten- oder Telephonleitung an. Der Name 'Datenbank' für diese Einrichtung klingt technisch kühl, man stellt sich vielleicht vor, die Daten lagerten einzeln und tiefgefroren in einem etwas unheimlichen Mausoleum. Das ist zum Teil ein sprachliches Mißverständnis, denn im Englischen, wo der Begriff ja geprägt wurde, hat 'Daten' einen weniger speziellen Sinn als im Deutschen, meint allgemein Angaben, Unterlagen, Tatsachen. Eine Datenbankk sammelt also keineswegs vornehmlich Zahlen oder Statistik, sondern Texte. Sie beschränkt sich auf ein Sachgebiet und sammelt dazu fortlaufend Material wie eine Bibliothek.

Unter den 55 Datenbanken, die in der Bertelsmann Datenbankdienste GmbH von der Schweizer Firma `data-star übernommen werden, gibt es z.B. 6 für Chemie, 7 für Biologie, 11 für Medizin, Marktberichte liefern 16 und Managementinformationen 17 Datenbanken. Die Gebiete überschneiden sich natürlich, und um die richtige Datenbank zu wählen, hat der Benutzer eine Broschüre mit eingehenden Inhaltsangaben, Hinweisen auf die geographische und zeitliche Abdeckung und den sehr wichtigen Vermerk des Aktualisierungsstandes (genannt Up-date-Zyklus); er reicht von 'fallweise' über 'jährlich' bis zu 'täglich'.

Die meisten Datenbanken sind im Wesentlichen Kataloge zu Fachzeitschriften. So verarbeitet etwa die medizinische Datenbank Medline über 3000 internationale Fachzeitschriften. Sie registriert u.a. Titel, Autor und Datum von Aufsätzen, seit 1981 auch von Monographien, und von der Hälfte der Artikel gibt es sog. Abstracts, das sind kurze Inhaltszusammenfassungen. Diese Abstracts helfen dem Benutzer sehr bei der Orientierung, stellen die Recherche auf eine breitere Grundlage, denn die Maschine sucht einen eingegebenen Begriff dann eben nicht allein im Titel, sondern auch in den Abstracts. Noch besser wäre es, wenn in der Datenbank der ganze Text der Artikel gespeichert wäre, aber das verschlingt ungeheure Mengen an Speicherplatz und macht die Sache für den Benutzer teuer. Medline verarbeitet jährlich 250.000 Artikel. Was Volltextspeicherung hier bedeuten würde, kann sich jeder ausmalen.

Es gibt allerdings Datenbanken, die gleichsam von Natur aus den Volltext speichern, und das sind die Nachrichtenageturen. Jede Nachricht ist sozusagen ihr eigener Abstract. dpa bietet täglich etwa 150 Meldungen an; aufs Jahr gerechnet kommt man auf über 54.000 Meldungen. In diesem Nachrichtenberg 'Zeitunglesen' zu wollen, wäre etwas mühsam und teuer. Man muß nach etwas `Bestimmtem suchen und kann nicht einfach 'blättern' (es sei denn, man stört sich nicht an 20 Meter Papierausdruck). Jede angewählte Meldung läuft ganz über den Bildschirm, ist nicht mittendrin anzuhalten. Zum Augenblick zu sagen "Verweile doch, du bist so schön", gelänge Faust hier nicht. Man kommt also kaum ohne Drucker aus, der den Bildschirminhalt fotlaufend ausdruckt. Am Ende staunt man, wieviel Wissen man durchwandert hat; von meiner nur teilweise protokollierten Sitzung am Terminal nahm ich 7 Meter Papier mit nach Hause.

Was fängt nun der Computer mit dem gespeicherten Material an? Er sucht Wörter - oder Zahlen, was für ihn ja dasselbe ist, weil er 'zuinnerst' nur Zahlen kennt. Die Wörter sucht er `buchstäblich, d.h. die Deklination eines Substantivs oder Adjektivs 'versteht' er nicht. Wenn Sie "saures" suchen, findet er "saurer" nicht.

Nehmen wir also an, Sie wollen Material zum "sauren Regen" haben. Sie gehen - natürlich bildlich gesprochen - in die Umweltliteraturdatenbank, die vom Umweltbundesamt herausgegeben wird. (Hätten Sie gewußt, daß es eine solche Einrichtung gibt?) ULit, so die Abkürzung, meldet sich und gibt die Spanne der zeitlichen Abdeckung an: 1976 - 16.1.1985. Aktualisiert wird alle zwei Monate, wir recherchieren Anfang März. Die Maschine sagt SEARCH MODE - ENTER QUERY, zu deutsch etwa: Suchmodus - Frage eingeben (Query ist ein Kunstwort, aus question-reply zusammengezogen, heißt also eigentlich Frage-Antwort). Wir wollen nicht nur "saurer Regen", sondern auch "sauren, saurem, saure Regen" haben und ersetzen daher den letzten Buchstaben durch eine Variable. Das Zeichen dafür ist üblicherweise $, das Dollarzeichen.

Also "saure$ Regen". Ergebnis, RESULT: 125. Das ist viel zu viel, um sich auch nur die Aufsatztitel angeben zu lassen. Wir präzisieren unsere Suche auf "saurer Regen". Ergebnis: 80.

Sie sehen die Schwierigkeit, die hinter dieser Prozedur steckt. 45 von den Belegen sind nur deshalb weggefallen, weil bei ihnen der saure Regen nicht im Nominativ, sondern in irgend einem anderen Fall vorkommt. Aber diese Belege können für Sie genau so wichtig sein wie die übrigbleibenden. man sollte also mit dieser Art von Eingrenzung vorsichtig umgehen. Wie könnten wir weiter eingrenzen?

Nun, vielleicht wollen Sie wissen, welche Erklärungen es für den suaren Regen gibt; eine Zeitungsmeldung z.B. lautete kürzlich dahin, deutsche Wissenschafler hätten über 160 Hypothesen zur Erklärung des Waldsterbens beigebracht. Also, Sie lassen nach "saurer Regen" `und "Erklärung" suchen. Dieses `und - das natürlich als englisches `and eingegeben wird - ist kein gewöhnliches Und, sondern das logische Und, besagt demnach, daß nur Belege geboten werden, in denen `beide Wörter vorkommen. ('Durchschnittsmenge' heißt das in der Mengenlehre)

Siehe da: RESULT: 2. Diese beiden Belege lassen Sie sich ausdrucken. Der erste Aufsatz lautet "Rauchgasentschwefelung - Eine Maßnahme zur Verhinderung von Forstschäden?", der zweite "Zu den Immissionsschäden und zur Hochschornsteinpolitik". Zufällig geben die beiden Aufsätze die verschiedenen Perspektiven von Verschmutzer und 'Leidtragendem' wieder: der Autor des ersten gehört dem Gesamtverband des Deutschen Steinkohlebergbaus Essen an, der zweite ist in der 'Allgemeinen Forstzeitschrift' erschienen. Bereits dieses kleine Beispiel zeigt, wie rasch und frei von Einseitigkeit ein brisantes, aktuelles Thema aufgesucht werden kann. Die Objektivität hängt allerdings allein vom Betreiber der Datenbank ab, in diesem Fall als vom Umweltbundesamt. Und je mehr sich die digitale Speicherung von Texten durchsetzt, desto wichtiger wird es, daß alle wesentlichen Veröffentlichungen von Datenbanken erfaßt werden, dann was dann per Datenbank nicht mehr gefunden wird, wird wohl auch nicht mehr 'von Hand' gesucht. Man darf aber vermuten, daß die heute herrschende Presse- und Meinungsvielfalt sich im elektronischen System ebenso herstellen wird, wie in den Papiermedien.

Sorgen bereitet indes das gewaltige Übergewicht amerikanischer Datenbanken. Drei Viertel aller Datenbanken sind in den USA beheimatet, auf die BRD entfallen ganze 3%. Das hat vermutlich mit dem anderen Kulturverständnis der Amerikaner zu tun, für die sich Wissen und technische Prozedur nicht ausschließen, während im Deutschen Wissen (und Kultur) gern mit Geist assoziiert wird. Heute haben wir das Nachsehen, denn die Datenbanksprache ist kategorisch Englisch. Zwar findet man auch deutsche Volltextdatenbanken und bei den Referenzdatenbanken gelegentlich deutsche Abstracts, aber abgefragt wird immer in Englisch. Quellenangaben laufen unter 'Source', ein deutscher Aufsatz wird mit der Bezeichnung LG: GE ausgedrückt, language German, und am Ende jedes Belegs erscheint die Zeile 'End of Document'. Daß es in den deutschen Texten auch keine Umlaute gibt, sei nur am Rande vermerkt. (Umlaute sind Sonderzeichen, d.h. in der englischen, als Norm dienenden Tastatur, auch ASCII genannt, nicht enthalten).

Ein anderes noch kaum übersehbares Problem liegt in der kommerziellen Orientierung der meisten Datenbanken. Angeboten wird das, was auch nachgefragt wird und was nicht allzu teuer zu beschaffen ist. Mit Randphänomenen und volkswirtschaftlich unbedeutenden Gebieten wird sich ein privatwirtschaftlicher Datenbankanbieter also wenig befassen. Sie bleiben dem Staat, d.h. dem öffentlichen Bibliothekswesen überlassen, und hier sind die Aktivitäten zur Erschließung der neuen Technik noch sehr gering. Nur wenn das Datenbankangebot weitgehend vollständig ist, kann ein Wissenschaftler verläßlich damit arbeiten, denn um den Hauptvorteil der schnellen Recherche auszunützen, wird er nicht noch anderwärts suchen und muß sicher sein, in allen wesentlichen Quellen recherchiert zu haben.

Die Zweigliedrigkeit des Informationssystems, hie Bibliotheken, dort Datenbanken, macht noch schwer zu schaffen. Sofern man keine Volltextdatenbank zur Verfügung hat, bleibt ja der Gang zur Bibliothek nicht erspart, denn die 'normale' Referenzdatenbank liefert ja nur Quellenangaben und Abstracts. Die Literaturbeschaffung aber kostet Tage und Wochen; und wenn das betreffende Werk ausgeliehen oder beim Binden ist (Zeitschriftenjahrgänge), kann es Monate dauern. Sobald man also das Terminal verläßt und sich in die ehrwürdigen Hallen der nach Jahrhunderten rechnenden Bayerischen Staatsbibliothek begibt, um Gefundenes zu erlangen, fühlt man sich in die Steinzeit zurückversetzt, und alle Zeitersparnis wird mühelos zuschanden.

Das fast völlige Fehlen der Geisteswissenschaften im Datenbankenangebot - das ich als Germanist verständlicherweise sehr bedauere - geht einerseit auf die geringe volkswirtschaftliche Bedeutung dieses Bereichs zurück (der in die Sparte 'brotlose Kunst' gehört), andererseits auf den Mangel an verbindlichen Begriffen, wie man sie für die Recherche benötigt. Die Medizin beispielsweise hat es da viel einfacher. Es gibt eine international einheitliche, auf dem Lateinischen basierende Nomenklatur, die sogar in einer eigenen Datenbank, Medline Vocabulary File, abgelegt ist. Chemische Substanzen erhalten eine Registriernummer der 'Chemical Abstracts', und Enzyme werden von der 'Enzyme Commission' numeriert.

Ein Arzt, der sich rasch über Therapien und Medikamente orientieren will, ist mit einer Datenbank sicherlich gut bedient. Eingabe z.B. "uteruscarcinoma". RESULT: 228. "uteruscarcinoma and radiation" (also: Bestrahlung von Gebärmutterkrebs), RESULT: 27. Und auf Knopfdruck sind die 27 Titel da. Daß die Bedienungsanleitung, GUIDE TO MEDLINE, 1,5 Meter lang ist irritiert anfangs zwar ein wenig, aber nach ein bißchen Übung braucht man sie nicht mehr.

Die Kenntnis der Fachsprache ist allerdings unabdingbar, andernfalls bleibt alle Information unzugänglich. Ich versetzte mich in die Lage eines Wirtschaftsmanagers, eines Post- oder Bibliotheksbeamten und fragte: welche Verbreitungschancen sieht man in den USA für Btx? Als Datenbank wählte ich PREDICASTS PROMT, ein Unternehmen für Markt- und Wirtschaftsprognosen. Im ersten Eifer gab ich als Frage "Btx" ein, obwohl ich dunkel wußte, daß Btx auf Englisch anders heißt. Die Maschine aber liefert RESULT: 2. Ich lasse ausdrucken: Japan Chem, BTX derivative equipment ("Derivationsausrüstung"), das zweite: BTX aromatics capacity (ich wage das kaum mehr zu übersetzen: Kapazität von BTX-Aromaten?). Offenbar bin ich in die Petrochemie geraten, wo es einen Stoff namens BTX gibt.

Nun aber, wie heißt Bildschirmtext auf Englisch? Wer es nicht weiß, hat so gut wie keine Chance, es in annehmbarer Zeit herauszufinden. Die Datenbank weiß es nicht, kein Lexikon liefert die Übersetzung, beim Nachsehen in der Fachliteratur wäre man auf sehr viel Glück angewiesen. Ich tippe "Video-Text". KEYWORD NOT IN DICTIONARY (Begriff nicht im Wörterbuch). Neuer Versuch: "videotex". RESULT: 121. Eingrenzen: videotex and connection. 0. videotex and communication and development. 0. videotex and standard. 0. videotex and PC (Personalcomputer). 1. Ich lasse ausdrucken: PC videotex software sales, zu deutsch umständlich 'Verkaufsziffern von Btx-Software für Personalcomputer'. Für die USA und das Jahr 1984 sind 13,9 Mio.$ angegeben, für 1988 246 Mio.$ geschätzt, mit einer Wachstumsrate von 105%. Ich suche noch nach "videotex and equipment" und bekomme 12 Titel angeboten. In Nr. 1 findet sich eine Prognose der Verbreitung von Btx und Videotext als Prozente amerikanischer Fernsehhaushalte, VIDEOTEX & TELETEXT SERVICES SUBSCRIBERS heißt das im Original: für 1990 20%, Nr. 3 rechnet auf 45% hoch, Nr. 2 gibt für Btx allein 10% an. So gewinnt man in Sekundenschnelle Einblick in Entwicklungsvorgänge und absehbare gesellschaftliche Veränderungen.

Das Beispiel Btx führt zu einem der wichtigsten Aspekte des ganzen Datenbankwesens, dem Problem der Normierung und der Geräteausrüstung. Die Verbindung mit einer Datenbank läuft über das sog. Datex-P-Netz der Post und unterliegt deren "Höheren Kommunikationsprotokollen". Das Terminal braucht entsprechende Software zur Kommunikation mit dem Datenbankrechner, und der Anschluß an Datex-P ist nicht billig. Er variiert mit der verlangten Übertragungsgeschwindigkeit. Zu diesen Gebühren kommen noch die Anschlußgebühren an den 'Host', den Datenbankanbieter, sowie die Recherchegebühren in den jeweiligen Datenbanken, die beide in Stunden verrechnet werden; außerdem wird für jedes Zitat ein Betrag verlangt. So kostet eine mehrstündige Recherche rasch einige hundert DM.

Durch Btx fallen zumindest die Datex-P-Gebühren weg, und die Hard- und Softwareanforderungen sind wesentlich geringer. Technisch ist es möglich, per Btx auf jeden Datenbankrechner zuzugreifen, sofern der Datenbankanbieter das zuläßt; Btx dient gewissermaßen als Vermittlungsinstanz. Damit würde das Informationsangebot der Datenbanken einer gröBeren Allgemeinheit zugänglich, was in unserem, von Fachwissen so lebensnotwendig abhängenden Land ein groBer Fortschritt wäre.

Daß ein Verlag wie Bertelsmann Datenbankdienste anbietet, ist somit keineswegs Zufall oder Hobby, sondern entspringt der Einsicht in die künftigen Strukturen der Wissensvermittlung. Zu dieser Vorreiterrolle kann man nur Glück und Erfolg wünschen.