Google Buchsuche & Co. - Segen und Herausforderung der Digitalisierung

von Kai Drewes

 

 

Es ist schon atemberaubend, in welchem Umfang die Welt durch das Internet innerhalb von nur einem Jahrzehnt vernetzt worden ist. Zu praktisch jedem Thema lässt sich mittlerweile etwas oder wenigstens der Weg zu etwas finden; die hohe Kunst besteht allerdings darin zu wissen, wo und wie, und natürlich auch zu bewerten, ob die jeweiligen Informationen tatsächlich etwas taugen. Ohne Suchmaschinen, Kataloge und Datenkbanken (zu letzteren siehe den H-Soz-u-Kult-Bericht über die Tagung "Sinn und Nutzen von Datenbanken in den Geisteswissenschaften" im März 2006) sowie den richtigen Umgang mit ihnen nützt uns die Flut an Möglichkeiten nämlich nicht nur nicht, sondern schadet letztlich: Einmal mehr dürfte das Internet die Klugen klüger und die Dummen dümmer machen. Eine neue Dimension des Recherchierens nicht zuletzt für historisch Interessierte bietet dabei seit einigen Jahren u.a. die Digitalisierung von Buchbeständen in großem Umfang und damit immer häufiger auch die Möglichkeit intensiver Volltextrecherche - ungeahnte Möglichkeiten tun sich da auf, nachdem ja bereits seit einigen Jahren auch online abgelegte Text- und pdf-Dateien von Suchmaschinen erfasst werden. Das Internet ist von seiner Struktur her wie kein anderes Kommunikationsmittel dazu geeignet, die Demokratisierung und Dezentralisierung von Wissen und Bildung voranzutreiben. Auf der anderen Seite besteht aber auch die große Gefahr der rein kommerziell ausgerichteten Selektion von Informationen.

 

In letzter Zeit erfährt die ganze Entwicklung eine spürbare Beschleunigung, denn die mittlerweile milliardenschwere Suchmaschine Google macht nicht nur durch Google Earth von sich reden: Das ambitionierte, bislang allerdings auf die Bestände einiger großer angelsächsischer Bibliotheken beschränkte Digitalisierungsprojekt Google Buchsuche (vormals Google Print) entwickelt sich zu einer enormen kulturellen, ökonomischen und urheberrechtlichen Herausforderung für europäische Bibliotheken und Verlage. Die Diskussion darum kann und soll hier nicht erschöpfend referiert werden, deshalb sei auf einen ZEIT-Artikel vom August 2005 und einen Artikel aus der WELT vom Dezember 2005 verwiesen. Im Februar 2006 auf deutsch erschienen ist auch die flammende Streitschrift über "Googles Herausforderung" von Jean-Noël Jeanneney (s.u.), seines Zeichens Präsident der Französischen Nationalbibliothek. Aus französischer und europäischer Sicht legt er profund dar, weshalb ein öffentliches bzw. staatliches Digitalisierungsprojekt als Alternative zur Google Buchsuche notwendig ist.

 

Die von der DFG geförderte Digitalisierung deutscher Bibliotheksbestände geht vergleichsweise langsam voran - Vorreiter ist die SUB Göttingen -, hat aber immerhin z.B. das Deutsche Digitalisierte Zeitschriftenarchiv (DigiZeitschriften) hervorgebracht. Nachweise über "grundsätzlich alle vollständig digitalisierten Druckwerke [...], die frei über das Internet zur Verfügung gestellt werden und einem gewissen wissenschaftlichen Qualitätsstandard genügen[,]" bietet das Zentrale Verzeichnis digitalisierter Drucke (zvdd). Siehe dazu auch die Übersicht über den Retrodigitalisierungs-Projektserver des DFG-Förderschwerpunktes "Retrospektive Digitalisierung von Bibliotheksbeständen" (und dazu auf H-Soz-u-Kult Informationen über eine Evaluierung des DFG-Projekts).

 

Einem Verbund europäischer Nationalbibliotheken verdankt sich außerdem das Projekt The European Library. Dies Portal eröffnet bereits den Weg zu digitalen Online-Versionen von einigen Millionen europäischen Büchern, komplett kostenfrei ist es freilich nicht - hieran zeigt sich eine entscheidende Problematik des Ganzen. Um Googles Vormachtstellung zu relativieren, haben die deutsche und französische Regierung im April 2005 überdies beschlossen, eine europäische Suchmaschine namens Quaero (lateinisch für "ich suche") ins Leben zu rufen, und zwar mit digitalisierten Bibliotheksbeständen als Schwerpunkt. Noch 2006 soll das Projekt online gehen.

 

Wie auch immer die brisante Digitalisierungsdebatte weitergeht, für den versierten Nutzer bietet die Möglichkeit der Volltextrecherche ungeahnte Möglichkeiten. Zu beachten ist, dass die Schreibweise von Eigennamen in früheren Zeiten stark schwanken konnte, weshalb bei der Suche nach Personen, Familien und Orten ggf. verschiedene Varianten in Rechnung zu stellen sind. Hinzu kommt, dass bei Google Buchsuche die automatische Schrifterkennung hinsichtlich der gescannten Bücher wie auch die zur Verfügung gestellten Metainformationen noch stark zu wünschen übrig lassen. Und da Nutzer außerhalb der USA Nutzungsbeschränkungen unterliegen, empfiehlt sich im Übrigen der virtuelle Umweg über einen US-Proxy wie z.B. Guardster Free Web Proxy. (Weitere nützliche Gebrauchshinweise - nicht nur für den Genealogen - gibt's bei Klaus Graf, Googles stattliche Online-Bibliothek, in: Computergenealogie, H. 1/2006, S. 9 f.)

 

Ansonsten: Die Universitätsbibliothek Braunschweig betreibt zusammen mit dem TU-Rechenzentrum die Digitale Bibliothek Braunschweig, in die neben neueren wissenschaftlichen Arbeiten (z.B. in Form von pdf-Files) auch Retro-Digitalisierungen wertvoller Altbestände (momentan ca. 800 Bücher) aufgenommen werden. Auch die Herzog August Bibliothek Wolfenbüttel bietet mit der Wolfenbütteler Digitalen Bibliothek wichtige und seltene Teile ihres exzellenten Altbestandes online an. Im Frühjahr 2006 neu hinzugekommen ist beispielsweise der Prachtstammbaum des braunschweig-lüneburgischen Welfenhauses von Franz Algermann aus dem Jahr 1584 (ediert von Dr. Christian Lippelt, einem Absolventen unseres Historischen Seminars). Desgleichen ist die HAB prominente Beiträgerin des Projekts VD 17 (Verzeichnis der im deutschen Sprachraum erschienenen Drucke des 17. Jahrhunderts), das in den meisten Fällen zumindest ausgewählte Seiten der erfassten Titel als Digitalisate beinhaltet.

 

Darüber hinaus können u.a. über die UB Braunschweig für den wissenschaftlichen Gebrauch einige ganz hervorragende, von der DFG lizensierte Datenbanken in Anspruch genommen werden, darunter The Times Digital Archive 1785-1985 und das World Biographical Information System (WBIS Online), das die national ausgerichteten, bislang auf Mikrofiche zugänglichen Kompilationen des Saur Verlages hübsch zusammenfasst. Auch sind mittlerweile ca. 250.000 britische Druckwerke für die Zeit vor 1800 online zugänglich, nämlich in Form der Datenbanken Early English Books Online und Eighteenth Century Collections Online. A propos Times Digital Archive: Freien Zugang gibt es zum Internetarchiv jüdischer Periodika (Compact Memory) mit weit mehr als 100 Zeitungen und Zeitschriften, an die sonst nur schwer heranzukommen ist.

 

    

Links: Keilschrift-Tontafel aus Mesopotamien, ca. 2000 v. Chr.

Rechts: CD-ROM, ca. 2000 n. Chr.

 

Preisfrage: Welches der beiden abgebildeten Speichermedien kann

potenziell auch noch in 4000 Jahren sowohl existieren als auch lesbar sein?

 

Trotz aller Erleichterungen, die digitale Medien im Hinblick auf Informationsbeschaffung mit sich bringen, gilt aber das scheinbare Paradoxon: je neuer das Speichermedium, desto kurzlebiger; je älter, desto haltbarer! (Siehe dazu den fast schon klassisch gewordenen ZEIT-Artikel Das große Datensterben von Dieter E. Zimmer aus dem Jahr 1999 und den Wikipedia-Artikel Digitales Vergessen / Langzeitarchivierung.) Babylonische Keilschriften werden noch so manches Jahrtausend überdauern, während vom physikalischen Standpunkt her nichts so anfällig ist wie digitale Informationsträger; vom anhaltenden Konversionsproblem einmal ganz abgesehen, das die Weiterentwicklung im Softwarebereich stets aufs neue mit sich bringt. Wer also glaubt, künftige Gesellschaften könnten buch- oder gar papierlos auskommen, unterliegt einem grandiosen Denkfehler, auch wenn Platzmangel bereits heute eines der größten Probleme wissenschaftlicher Bibliotheken ist. Immerhin, die Dezentralität des Internets mit seinen RAID-Systemen relativiert durch permanenten Datenaustausch die Gefahr des physikalischen Datenverlusts.

 

Hier noch einige interessante Links zu umfangreicheren deutschen Lexikonwerken, die mittlerweile komplett online zugänglich sind, oftmals auch in Form von Digitalisaten:

 

 

 

Buch(!)tipps:

 

Nachträge:

Über den aktuellen Stand der Entwicklung rund um Google Buchsuche, die Konkurrenz Open Content Alliance (OCA), an der sich Microsoft beteiligt, und das Projekt Volltextsuche Online (VTO) des Börsenvereins des deutschen Buchhandels informiert ein Artikel aus der ZEIT vom 9. November 2006.

Am 6. März 2007 hat die Bayerische Staatsbibliothek bekannt gegeben, sie werde "alle Bücher aus dem Bibliotheksbestand digitalisieren, die nicht mehr dem Urheberschutz unterliegen, und in die Google Buchsuche integrieren". Siehe dazu eine Pressemitteilung der Bayerischen Staatsbibliothek und einen Artikel auf SPIEGEL Online vom 7. März 2007. Demnach haben sich entgegen der Hoffnung von Jean-Noël Jeanneney in Europa bereits wissenschaftliche Bibliotheken u.a. in Oxford, Madrid und Barcelona dem Google-Projekt angeschlossen. Siehe dazu auch die Umfrage "Wer hat Angst vor Google?" in der ZEIT vom 15. März 2007 mit Antworten u.a. von Ulrich Johannes Schneider, Direktor der UB Leipzig und ehemals Leiter der Forschungsabteilung der HAB Wolfenbüttel.

Auch die British Library weist in ihrem Reader Bulletin vom August 2007 auf ihr umfangreiches Digitalisierungsprogramm hin: In Zusammenarbeit mit Microsoft werden derzeit ca. 100.000 Copyright-freie Bücher bzw. über 25 Millionen Seiten digitalisiert.