Google Books

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Google Books
Google Book Search Beta logo.png

Logo

Gründung April 2005
Bibliothekstyp digitale Bibliothek
Website books.google.de

Google Books (auch Google Bücher oder Google Buchsuche) ist die weltweit umfangreichste digitale Bibliothek. Sie wird vom US-amerikanischen Unternehmen Google Inc. betrieben, das sich zum Ziel gesetzt hat, das in Büchern gespeicherte Wissen der Welt vorwiegend durch Digitalisierung für die Volltextsuche verfügbar zu machen. Der Zugang zu den Volltexten ist allerdings nur bei einem Teil der Bücher möglich. Das Unternehmen gibt nicht bekannt, über wie viele digitale Bücher es bereits verfügt.

Vorrügergehend leere Bücherregale in der Universität von Michigan: "Digitization in progress" für Google Bücher, 2008

Beschreibung[Bearbeiten]

Google Books speist sich aus zwei Quellen:

  • Google Print im engeren Sinn, dem – nicht weiter kontroversen – Kooperationsprojekt mit Verlagen, und
  • Google Library, bei dem Bücher großer akademischer Bibliotheken auch ohne vorherige Zustimmung der Rechteinhaber massenweise gescannt werden, was juristisch umstritten war und ist.[1]

Geschichte[Bearbeiten]

Im Oktober 2004 stellte sich Google Print auf der Frankfurter Buchmesse vor (Pressekonferenz mit den Google-Gründern Sergey Brin und Larry Page).[2] Im Dezember 2004 begannen Suchergebnisse aus gescannten Büchern in den Ergebnislisten der englischen Suchoberfläche Google.com zu erscheinen. Google hat sich vorgenommen 15 Millionen Bücher bis 2015 zu scannen.[3] Das entspricht etwa 4,5 Milliarden Seiten.

Seit April 2005 existiert eine eigene Suche für die Inhalte des Programms. Im Oktober 2005 präsentierte man zur Frankfurter Buchmesse deutsche und anderssprachige Benutzungsoberflächen.

Am 4. November 2005 wurde die Suchseite, nunmehr mit einer erweiterten Suche versehen (Abfrage nach Zeiträumen nun möglich), offiziell vorgestellt. Am 17. November 2005 kündigte Google die Umbenennung des Dienstes im unternehmenseigenen Weblog an.[4] Seit diesem Zeitpunkt werden Anfragen von print.google.com nach books.google.com weitergeleitet.

Im September 2008 kündigte Google an, gemeinsam mit nordamerikanischen Zeitungsverlagen Zeitungen zu digitalisieren. Die digitalisierte Version soll durchsuchbar sein, mit dem Webbrowser navigierbar und erscheinen wie in der Printausgabe mitsamt den Fotografien, Schlagzeilen und Werbeanzeigen.[5]

Inzwischen gibt es bei einer Reihe von Büchern eine Kooperation mit Internet Archive. Dort gibt es Ausgaben in verschiedenen Formaten, für das PDF wird auf Google verwiesen (wo es für Werke nach 1864 für Nicht-US-Nutzer dann nicht verfügbar ist, siehe Kontroversen).

Aus dem Korpus von Google Bücher wurden 2009 und 2012 die Datensätze für den Ngram Viewer in verschiedenen Sprachen erstellt.

Kooperation mit den Verlagen[Bearbeiten]

Google erhält von den Verlagen Bücher oder bekommt PDF-Dateien zugesandt. Die Bücher werden gescannt und durch OCR als E-Texte in den Index aufgenommen. Nutzer können jeweils nur vergleichsweise wenige Seiten des einzelnen Buchs einsehen. Nach einigen Seiten können nur (kostenfrei) registrierte Nutzer eine Anzahl weiterer Seiten einsehen. Eine Reihe von Seiten ist von vornherein für den Zugriff gesperrt. Nach Erschöpfung des Tageskontingents können keine weiteren Seiten betrachtet werden. Frei zugänglich sind in der Regel das Inhaltsverzeichnis, nicht selten auch das Register.

Google versucht die Inhalte durch eine Art Kopierschutz (sogenanntes „Digital Rights Management“ rsp. Digitale Rechtevergabe) zu schützen. Dass dies jedoch nicht immer vollständig angewandt wird, kann man an verschiedenen Fachbüchern problemlos nachvollziehen.[6] Angeschaute Seiten lassen sich nach dem Anzeigen im Internet-Browser mittels bestimmter Methoden dann sogar aus dessen Browser-Cache herauslesen und können mit entsprechenden Tools dann zu einer PDF-Datei zusammengeführt werden.

Kooperation mit Bibliotheken[Bearbeiten]

Google Books Hinweis in der Michigan University Library, 2007.

Google scannt seit etwa 2005 den kompletten Bestand der Bibliothek der University of Michigan (über 7 Millionen Bände) sowie große Teile der US-Universitätsbibliotheken der Harvard University und der Stanford University, der New York Public Library sowie in Europa der Bodleian Library der Oxford University. Auch die Bibliotheken der University of Virginia, der University of Wisconsin-Madison, der Princeton University, der University of California und der University of Texas at Austin beteiligen sich.

Ende 2006 traten zwei weitere Institutionen dem Verbund der Bibliotheken bei, die Bücher bei Google digitalisieren lassen: Die Nationalbibliothek von Katalonien (Biblioteca de Catalunya) in Barcelona und die Bibliothek der Universidad Complutense Madrid.

Am 6. März 2007 gab die Bayerische Staatsbibliothek in München bekannt, als erste deutsche Bibliothek mit dem Projekt zu kooperieren. Es sollen nun etwa eine Million urheberrechtsfreier Werke aus den historischen Beständen und aus Spezialsammlungen digitalisiert werden.[7] Ausgenommen von dem Digitalisierungsprojekt sind nur die Handschriften- und Inkunabelbestände sowie seltene und besonders wertvolle historische Drucke.[8]

Im Juli 2008 gab die Bibliothèque Municipale de Lyon als erste französische Bibliothek bekannt, ihre Bücher digitalisieren zu lassen.[9]

Am 15. Juni 2010 gab die Österreichische Nationalbibliothek (ÖNB) bekannt, dass Google ihren urheberrechtsfreien Buchbestand digitalisiert. Die Kosten für die Digitalisierung der rund 400.000 Bücher betragen etwa 30 Mio. Euro und werden von Google getragen. ÖNB-Generaldirektorin Johanna Rachinger bezeichnete dieses Vorhaben als eines der größten Public Private Partnership in der österreichischen Kulturlandschaft. 400.000 Bände vom 16. bis ins 19. Jahrhundert (mit Ausnahme jener Bücher, bei denen konservatorische Bedenken dagegen sprechen) sollen dabei im Volltext erfasst werden – rund 120 Millionen Buchseiten sind danach online und kostenlos abrufbar.[10]

Heftige Kritik von Autoren- und Verlegerseite brachte Google dazu, das Scannen von urheberrechtlich geschützten Büchern bis November 2005 auszusetzen. Bis zu diesem Zeitpunkt sollten die Rechteinhaber angeben, welche Bücher sie nicht zugänglich gemacht haben möchten (Opt-out-Lösung). Während Google sich auf den fair use des US-Rechts beruft und dabei von renommierten Juristen unterstützt wird, fordern die Verleger und Autorenverbände, dass kein Buch ohne Zustimmung ins Programm eingestellt wird (Opt-in). Im Oktober 2005 wurden in den USA Klagen von Autoren und Verlegern gegen Google eingereicht.

Anwendung in der Forschung[Bearbeiten]

Ein im Dezember 2010 in Science veröffentlichter Aufsatz berichtet über die Möglichkeiten, Google Books zur quantitativen Analyse von Kultur zu nutzen (Culturomics). Den Wissenschaftlern standen für ihre Analysen etwa 4 % aller Bücher, die jemals gedruckt wurden, zur Verfügung. Sie konvertierten die Bücher in eine massive Datenbank der in den Büchern enthaltenen Wörter (N-Gramm). Die Herangehensweise lasse sich für Forschungen auf verschiedenen Gebieten nutzen, wie Lexikographie, Evolution von Grammatik, kollektivem Gedächtnis, Technologieadoption, Ruhm, Zensur, oder historischer Epidemiologie. Das Forscherteam schätzte z. B. auf Basis der Datenbank, dass sich die Größe des englischen Wortschatzes innerhalb des letzten Jahrhunderts fast verdoppelte. In einer anderen Untersuchung wurde der kulturelle Einfluss Freuds mit dem Darwins verglichen. Freud verlor an Einfluss; Darwin überholte Freud im Jahr 2005.[11][12]

Kontroversen[Bearbeiten]

Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Die fraglichen Angaben werden daher möglicherweise demnächst entfernt. Bitte hilf der Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst. Näheres ist eventuell auf der Diskussionsseite oder in der Versionsgeschichte angegeben. Bitte entferne zuletzt diese Warnmarkierung.

Probleme der Auswahl der Digitalisate[Bearbeiten]

Der Historiker Jean-Noël Jeanneney - ehemaliger Direktor der Französischen Nationalbibliothek, der mit Gallica ein freies europäisches Digitalisierungsprojekt betreibt - plädiert dafür, dass Europa eine Alternative zum Google-Digitalisierungsprojekt auf die Beine stellt. An Google kritisiert er vor allem die Hegemonie des Englischen und den Kumulationseffekt (bei ihm genannt die „Blickfang-Methode“, üblich ist der Begriff „Ranking“, siehe: PageRank), der dazu führe, dass im Kampf um die Aufmerksamkeit des Lesers eine gewollte Konzentration auf die Listenführer stattfinde. Der stärkere Anbieter wird immer noch stärker auf Kosten des Schwächeren. Dadurch werde Google besonders für die Werbung wichtig. Diesem „kapitalistischen“ Google-Prinzip möchte Jeanneney ein Modell entgegensetzen, bei dem der Staat das Sagen in Dingen des kulturellen Gedächtnisses hat. 19 National- und Universitätsbibliotheken in Europa haben den Appell der französischen Nationalbibliothek unterzeichnet, um eine drohende geistige und kulturelle Vorherrschaft der USA zu verhindern.

Das Problem, dass Google Books mit seiner Marktdominanz durch seine Selektionspraxis Alternativen verstellt, wird auch in Deutschland gesehen, insbesondere bei der Recherche auf Spezialgebieten wie etwa der Lokalgeschichte oder der Mundartforschung.[13]

Probleme bei den Suchfunktionen[Bearbeiten]

Eine Zuordnung von systematischen Sachgruppen und Schlagworten zu den Büchern wie in Bibliothekskatalogen erfolgt nicht. Bücher eines bestimmten Fachgebietes zu selektieren, ist nicht möglich. Google geht davon aus, es genüge für die thematische Suche, alle Wörter in den Büchern zu erfassen. Die Eingabe eines Stichworts kann aber immer nur Ergebnisse in der verwendeten Sprache liefern. Es wird nicht berücksichtigt, dass oft auch sprachübergreifend gesucht wird und dass ein Wort in mehreren Fachgebieten verwendet werden und unterschiedliche Bedeutungen haben kann.[14]

Probleme bei der Texterkennung[Bearbeiten]

Digitalisat von Google. Sichtbare Finger des Personals am Scanner.

Der Spiegel bemängelte im Jahr 2007 die oft miserable OCR-Qualität und die mangelhaften Metadaten.[15]

Es gibt Fälle, in denen sogar der Autorenname vom OCR falsch erkannt wurde, so dass das Werk unter dem Autorennamen nicht gefunden werden kann.[14] Die sichtbare Qualität der Seiten wird wiederholt kritisiert. Dies betrifft die Punkte fehlende Textstellen und sichtbare Finger des Personals am Scanner.[16]

2009 kaufte Google den weltweit auf verschiedenen Websites eingesetzten CAPTCHA-Dienst reCAPTCHA, um die automatische Texterkennung als Nebenprodukt von Menschen überprüfen zu lassen.

Urheberrechte[Bearbeiten]

Mitglieder des Konkurrenzprojektes der Open Content Alliance kritisieren das Vorgehen von Google, das keine Rücksicht auf Copyright nehme.

In Deutschland fordern im Heidelberger Appell Schriftsteller, Verlage und Wissenschaftler den Schutz des Urheberrechts gegen seine Aushöhlung. In dem Manifest werden zwei Dinge miteinander verbunden: die Kritik an der Google-Buch-Digitalisierung mit einer Kritik an Open-Access-Politik im Allgemeinen. Dies hat zu einer Zersplitterung der Kritiker des rasch voranschreitenden Google-Digitalisierungsprojekts geführt. Ein großes Problem sieht der Heidelberger Appell insbesondere im sogenannten Google Book Settlement.

Google Book Settlement[Bearbeiten]

Das Google Book Settlement[17] ist ein Vergleichsvorschlag, den Google Inc. auf eine Sammelklage US-amerikanischer Verlage und Autoren gegen sie ausgearbeitet hat. Sollte dieser Vergleich vor dem New Yorker Gericht zustande kommen, so betrifft er auch nicht-amerikanische Verlage und Autoren, da Google über das Internet weltweit erreichbar ist. Zudem könnten Autoren gegen die Vergleichsvereinbarungen nach amerikanischem Recht nicht mehr nachträglich prozessieren, sofern sie sich nicht zuvor durch individuellen Einspruch aus der Sammelklage ausgeschlossen haben.[18][19][20] Google könnte dann jedes Werk deutschsprachiger Autoren, die keinen Einspruch in den USA eingelegt haben, in digitalisierter Form auf seiner Plattform zur Ansicht stellen, ohne dass hiergegen noch rechtlicher Einspruch der Autoren möglich wäre.

Anfang Mai 2009 wurde das abschließende Anhörungsverfahren für das Google Book Settlement vom 11. Juli 2009 auf den 6. Oktober 2009 vertagt. Die Widerspruchsfrist für Verlage und Autoren („Nicht-Teilnahme-Frist“) wurde vom 5. Mai 2009 bis zum 4. September 2009 verlängert.[17][21][22] Für den deutschen Buchmarkt hat die VG Wort einen eigenen Regelungsvorschlag ausgearbeitet. VG Wort kritisiert und klagt auf der einen Seite gegen Aspekte dieser möglichen Einigung vor einem amerikanischen Gericht. Auf der anderen Seite arbeitet die VG Wort auch mit Google bei der geplanten Umsetzung der Einigung zusammen.

Am 1. September 2009 kritisierte die Bundesregierung den Einigungsvorschlag. Sie forderte, dass man zumindest eine eigene Klasse für die deutschen Rechteinhaber bilden solle und diese von der pauschalen Einigung ausnehme. Zudem behindere Googles Copyright-Verletzungen und das Verhalten „Erst tun, dann fragen“ Projekte wie die europäische Online-Bibliothek Europeana, die Autorenrechte vorab wahre.[23]

In den USA kritisierte etwa die American Society of Journalists and Authors die Einigung als einen internen Handel zugunsten der daran Beteiligten.[22] Auch in der FAZ wird der Verdacht eines sogenannten „Coupon-settlements“ nahegelegt, bei dem selbsternannte Klägeranwälte mit Google eine „Einigung“ aushandeln, um ein üppiges Honorar und eine marktdominierende Stellung für Google zu erreichen.[24]

Anlässlich einer Expertenanhörung durch die EU-Kommission am 7. September 2009 erklärte Google, auf die Bedenken von Verlegern und Autoren eingehen zu wollen und deren Vertreter an der Beaufsichtigung des Projekts Google Books zu beteiligen. In Europa urheberrechtlich geschützte und lieferbare Bücher sollen nicht ohne ausdrückliche Erlaubnis gescannt und online zugänglich gemacht werden.[25] Gleichzeitig kündigte die EU-Kommission an, das Urheberrecht ändern zu wollen, da aufgrund der Gesetzeslage nur die USA von den Vorteilen der Digitalisierung und Online-Vermarktung profitieren würden.[26]

Im September 2011 wurde bekannt:

„In einem überraschenden Vorgehen verpassten Autorenverbände ihren ehemaligen Bündnispartnern, den Universitäten, eine gerichtliche Klage, in der sie verlangen, dass die Hochschulen die digitalen Büchersammlungen aufgeben und die Zusammenarbeit mit Google einstellen. Die Klage eröffnet eine neue Runde im Kampf um digitale Büchereien und kommt in derselben Woche, in der dem umstrittenen "Google book settlement" voraussichtlich vor Gericht der Garaus gemacht wird.[27]

Im November 2013 wurde im Urheberrechtsverfahren der amerikanischen Authors Guild gegen Google der Antrag auf einen Geschworenenprozess abgewiesen und gleichzeitig festgehalten, dass Google Books grundsätzlich durch das "Fair Use"-Prinzip gedeckt sei.[28]

Andere Projekte[Bearbeiten]

  • Die Open Content Alliance u. a. mit Konkurrent Yahoo, dem Internetarchiv und der University of California hat im Rahmen der Open Library in großem Umfang Bücher katalogisiert und digitalisiert, als Open Content und unter strikter Wahrung des Urheberrechts.
  • Auch der Konkurrent und mögliche Partner von Google, das Internet-Versandhaus Amazon bietet gescannte Bücher im Volltext an, konzentriert sich jedoch auf aktuell im Handel erhältliche Bücher, und will damit den Verkauf gedruckter Bücher fördern. Mit seiner Suche „Search Inside the Book“[29] macht Amazon Titelseite, Klappentext, Inhaltsverzeichnis, Register und zwei Seiten vor und hinter einem Suchergebnis verfügbar.
  • Die Suchmaschine A9.com, eine Amazon-eigene Suchmaschine, die Microsofts Suchtechnologie mit Amazons „Search Inside the Book“ verknüpft, zeigt auf der Basis eines noch kleinen, englischsprachigen Katalogs, wie sich in eingescannten Büchern, Bildern und Websites übergreifend suchen lässt.
  • In Deutschland gibt es zwei große universitäre Digitalisierungszentren: in Göttingen und in München. Bis zum Mai 2006 wurden im Göttinger Digitalisierungszentrum 4.487.815 Seiten in 11.726 Bänden digitalisiert. Rund die Hälfte davon ist frei zugänglich. Das Göttinger Vorzeigeobjekt ist die Digitalisierung der Gutenberg-Bibel. Das Münchener Digitalisierungszentrum hatte im Februar 2010 ca. 184.000 Titel frei zugänglich im Netz bereitgestellt.
  • MINERVA
  • die Internetprojekte Wikisource und Project Gutenberg
  • Gallica
  • The European Library, eine europäische Initiative, die den Zugang zu den digitalisierten Werken der Mitgliedsländer verbessern soll.
  • Auch große Verlage wie Random House (Bertelsmann) beginnen, ihre Buchbestände zu digitalisieren und für Suchmaschinen auffindbar zu machen. Random House stellte im Februar 2007 Teile seiner Buchbestände (5.000 Titel, weitere sollen folgen) online.[30] Mit Insight ermöglicht das Unternehmen seinen Kunden eine festgelegte Anzahl von Seiten pro Titel zu durchsuchen.[31]
  • Seit Oktober 2007 ist mit Zeno.org eine weitere Online-Bibliothek verfügbar.
  • Libreka – die deutsche Antwort des Börsenvereins des Deutschen Buchhandels auf Google Book Search

Literatur[Bearbeiten]

Weblinks[Bearbeiten]

 Commons: Google Bücher – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise[Bearbeiten]

  1. Google-Books: US-Gericht bremst Googles Bücherpläne. zeit online, 23. März 2011, abgerufen am 17. Mai 2012.
  2. Google-Gründer stellen in Frankfurt Google Print vor. heise online, 8. Oktober 2004, abgerufen am 17. Mai 2012.
  3. Google-Books: Richter setzt Streitparteien unter Druck. zeit Online, 9. April 2010, abgerufen am 17. Mai 2012.
  4. Jen Grant: Judging Book Search by its cover. Official Google Blog, 17. November 2005, abgerufen am 17. Mai 2012.
  5. Punit Soni: Bringing history online, one newspaper at a time. googleblog.blogspot.com 8. September 2008
  6. So steht von dem Buch „Active Directory für Windows Server 2008“ von Addison-Wesley, ISBN 978-3-8273-2740-6, an manchen Tagen fast der gesamte Inhalt des Buches offen im Internet
  7. Vorlage:Internetquelle/Wartung/Zugriffsdatum nicht im ISO-FormatVorlage:Internetquelle/Wartung/Datum nicht im ISO-FormatJens Redmer: The Bavarian State Library becomes largest non-English library partner. In: Inside Google Book Search. 6. März 2007, abgerufen am 11. März 2007.
  8. Klaus Ceynowa: DER „BSB-GOOGLE-DEAL“. Eine Million Bücher der Bayerischen Staatsbibliothek online. In: BibliotheksMagazin. Mitteilungen aus den Staatsbibliotheken in Berlin und München Nr. 1/2008. S. 4-8, abgerufen am 17. Mai 2012 (PDF; 3,5 MB).
  9. Google digitalisiert Stadtbibliothek von Lyon, derstandard.at, 13. Juli 2008
  10. APA: Google digitalisiert Nationalbibliothek. Abgerufen am 13. Februar 2012.
  11. John Bohannon: Google Opens Books to New Cultural Studies (PDF; 184 kB). In: Science, Vol. 330, 17. Dezember 2010. S. 1600.
  12. Jean-Baptiste Michel, Yuan Kui Shen, Aviva Presser Aiden, Adrian Veres, Matthew K. Gray, The Google Books Team, Joseph P. Pickett, Dale Hoiberg, Dan Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak, Erez Lieberman Aiden: Quantitative Analysis of Culture Using Millions of Digitized Books. In: Science, Vol. 331, 16. Dezember 2010. S. 176-182.
  13. Peter Bürger: Grimmiges über Google Books telepolis, 6. Januar 2012.
  14. a b Für Beispiele siehe: Bücher suchen mit Google. In: Grüner Anzeiger, 12, November 2009, S. 30!
  15. Malte Herwig: Die entleibte Bibliothek. In: Der Spiegel, 12/2007, S. 186 f.
  16. Kritik auf Blogseite des VÖBB (Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare); abgerufen am 10. Februar 2013
  17. a b Google Book Settlement, Google
  18. Amerikanische Justiz prüft Googles Vergleich, F.A.Z, 29. April 2009
  19. Michael W. Perry: Alles hängt jetzt von Europa ab, F.A.Z., 5. Mai 2009
  20. Burkhard Hess: Es wird Zeit, dass die Bundesregierung eingreift, F.A.Z., 7. Mai 2009
  21. Anhörung zum Google-Vergleich verschoben, Warten auf Settlement 2.0. Abgerufen am 17. Mai 2012.
  22. a b ASJA Opposes Google Settlement. Abgerufen am 17. Mai 2012.
  23. Google-Buchsuche Bundesregierung erhebt Einspruch - Spiegel Online. Abgerufen am 17. Mai 2012.
  24. Google Book Settlement Es wird Zeit, dass die Bundesregierung eingreift - FAZ. Abgerufen am 17. Mai 2012.
  25. Zugeständnisse an europäische Verlage? Focus Online, 7. September 2009
  26. EU-Kommission will das Urheberrecht novellieren Handelsblatt, 7. September 2009
  27. In a surprise move, authors’ groups slammed their one-time university partners with a lawsuit demanding that the schools surrender digital collections and stop working with Google (NSDQ: GOOG). The lawsuit opens a new phase in the fight over digital libraries and comes the same week that Google’s controversial books settlement is expected to die in court.Authors To Universities: Give Up Your Google Books - paidContent. Abgerufen am 17. Mai 2012.
  28. heise.de: Google Books nach acht Jahren vor Gericht für legal erklärt. 15. November 2013, abgerufen am 15. November 2013.
  29. Amazon „Search Inside the Book“
  30. Stuart Applebaum: Insight, newly launched digital search & browsing service to offer 5,000-plus Random House, Inc. U.S. titles (PDF-Datei; 31 kB), Pressemitteilung, 27. Februar 2007
  31. Insight Web Service, Random House