reCAPTCHA

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Logo von reCAPTCHA
Beispiel einer reCAPTCHA-Eingabebox

reCAPTCHA ist ein CAPTCHA-Dienst, also ein Verfahren, um sicherzustellen, dass eine bestimmte Handlung im Internet von einem Menschen und nicht von einem Bot vorgenommen wird. reCAPTCHA wird gleichzeitig zum Digitalisieren von Büchern und Zeitschriften verwendet.

Geschichte[Bearbeiten]

Laut einer Hochrechnung der Carnegie Mellon University verbringen Internetnutzer weltweit pro Tag 150.000 Stunden[1] damit, CAPTCHAs zu lösen. Die Regelmäßigkeit und Unentgeltlichkeit dieser Arbeitsleistung führte zu der Idee, sie für sinnvolle Zwecke einzusetzen. Der Informatiker Luis von Ahn, der im Jahr 2000 maßgeblich an der Erfindung des CAPTCHA-Verfahrens beteiligt war, entwickelte daraus im Jahr 2007 ein System namens reCAPTCHA, das bei der Buch-Digitalisierung eingescannte Wörter, die die Texterkennungssoftware nicht erkennt, durch die Eingabe von CAPTCHAs optimiert. Das System bezog seine Wörter anfangs aus einem Bereich des Internet Archive, der sich mit dem Digitalisieren von Büchern beschäftigt. Zudem half der Dienst bei der Digitalisierung des Archives über alle verfügbaren 130 Jahrgänge der New York Times:[2] Innerhalb weniger Monate nach Beginn dieses Projekts im Jahr 2009 waren bereits 20 Jahrgänge digitalisiert.

Am 16. September 2009 wurde bekannt, dass Google das Unternehmen reCAPTCHA gekauft hat.[3] Google profitiert dadurch, weil es Teil seines Betätigungsfeldes ist, Bücher und andere Druckerzeugnisse zu digitalisieren.[4][5] Im März 2012 wurde bestätigt, dass Google inzwischen auch Hausnummern von Google Street View erkennen lässt, um die Datenbasis für Google Maps zu optimieren.[6][7]

Funktion und Verwendung[Bearbeiten]

Auf jedem CAPTCHA sind zwei Wörter abgebildet: Eines ist dem System bereits bekannt und bestätigt, das andere ist ein unerkanntes Wort aus einem Digitalisierungsprojekt.

Der Nutzer beteiligt sich daran, durch dieses CAPTCHA kostenlos am Schrifterkennungsprojekt reCAPTCHA mitzuwirken (siehe Crowdsourcing). Es ist aber durch die Eingabe nur eines Wortes auch möglich das Captcha erfolgreich zu lösen. Dazu muss das offensichtlich aus einem Digitalisat stammende Wort einfach weggelassen werden. Es gibt Plugins zur Integration in populäre Webapplikationen wie Lifetype, WordPress, TYPO3, Drupal, vBulletin, phpBB, Joomla oder MediaWiki. Viele Millionen Menschen beteiligen sich so an dem Projekt, ohne die genaue Absicht des Projekts zu kennen, und stellen ihre Leistung, die sie ohnehin zur Eingabe erbringen müssen, zur Verfügung.

Das Problem, herauszufinden, ob die Eingabe eines Nutzers korrekt ist, lässt sich statistisch lösen: Die Wortkombination wird innerhalb eines sehr kurzen Zeitraums mehreren Benutzern zugleich präsentiert und die häufigste Eingabe wird als richtig angenommen.

Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]

 Commons: ReCAPTCHA – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise[Bearbeiten]

  1. Carnegie Mellon University: What is reCAPTCHA., 27. Januar 2004. [31. März 2006]
  2. Jessie Scanlo: Luis von Ahn: The Pioneer of "Human Computation", BusinessWeek, 3. November 2008, Zugriff am 28. Januar 2012
  3. Vorlage:Internetquelle/Wartung/Datum nicht im ISO-FormatTeaching computers to read: Google acquires reCAPTCHA. In: Official Google Blog. Google Inc., 16. September 2009, abgerufen am 5. November 2011 (englisch).
  4. http://googleblog.blogspot.com/2009/09/teaching-computers-to-read-google.html
  5. http://www.zdnet.de/news/wirtschaft_unternehmen_business_google_kauft_recaptcha_story-39001020-41502845-1.htm
  6. Google nutzt Streetview-Fotos für reCAPTCHA
  7. Sarah Perez: Google Now Using ReCAPTCHA To Decode Street View Addresses | TechCrunch, techcrunch.com, 29. März 2013, abgerufen am 9. September 2013