Digitalisierung der New York Times
CAPTCHA steht für Completely Automated Public Turing Test to Computers and Humans Apart Tell und wurde im Jahr 2000 von Luis von Ahn, Manuel Blum, Nicholas Hopper und John Langford von der Carnegie Mellon University, der die CAPTCHA-Programms entwickelt geprägt. Um uns Sterblichen es oft den Anschein, als hemetic arabisch-sprachigen Schriftart, so stark sogar verzerrt Menschen können nicht lesen. Allerdings haben sie einen Schritt weiter gegangen, und während ich auf aufgreifen merkte ich, die "leichter" Captcha-Code sieht so aus alten Typs Schrift gelesen werden langsam und sicher genug ist!
CAPTCHA ist ein Programm, durch das zu sagen, ob der Benutzer entwickelt ein Mensch oder ein Computer. CAPTCHAs werden von vielen Webseiten genutzt, um Missbrauch durch "Bots" oder automatische Programme in der Regel geschrieben, um Spam zu generieren, zu verhindern. Kein Computer Programm kann verzerrten Text zu lesen, wie auch Menschen können so Bots können nicht navigieren Websites durch Captchas geschützt.
Über 200 Millionen CAPTCHAs werden von Menschen auf der ganzen Welt jeden Tag gelöst. In jedem Fall werden, etwa zehn Sekunden der menschlichen Zeit ausgegeben werden. Individuell, das ist nicht viel Zeit, aber in Summe diese kleinen Rätsel verbrauchen mehr als 150.000 Stunden Arbeit pro Tag. Was passiert, wenn wir positive Nutzung dieser menschliche Anstrengung zu machen? reCAPTCHA tut genau, dass durch die Kanalisierung der Aufwand beim Lösen CAPTCHAs online in "Lesen" Bücher.
In einem Versuch, menschliche Wissen digital Archiv Archiv Materialien, mehrere Projekte, die derzeit die Digitalisierung gedruckte Bücher, die vor dem Computer-Zeitalter geschrieben wurden. Die Buchseiten werden als Bilder gescannt und dann in Text mit "Optical Character Recognition verwandelt" (OCR). Während die Bilder von Menschen der Text ist nicht suchbar und kann nicht indiziert werden lesbar, auch die Dateigröße als die Bilder sind viel größer und schwerer zu speichern beeinträchtigt.
reCAPTCHA verbessert den Prozess der Digitalisierung von Bücher, indem Sie Wörter, die nicht von Computern im Web gelesen werden kann in Form von CAPTCHAs für den Menschen zu entschlüsseln. Genauer gesagt, ist jedes Wort, das nicht korrekt per OCR gelesen werden kann auf ein Bild gebracht und als ein CAPTCHA verwendet. Dies ist möglich, weil die meisten OCR-Programme, die Sie warnen, wenn ein Wort nicht richtig gelesen werden.
Ich war zu diesem Zeitpunkt verkauft und hielt es für absolut neuartigen und twee, aber ich konnte nicht umhin, sich fragen, wie sie wissen, was wir sind die Eingabe korrekt ist. Der Trick ist, eines der Worte ist ein Steuerwort, bereits bekannt und bewusst zurück gesetzten und in der Regel aus der gleichen Quelle wie das zweite Wort, das Projekt geht davon aus, dass Sie es korrekt eingegeben haben und speichert das Wort, wenn genügend Menschen die gleichen eingegeben haben Wort in der gleichen Weise und nimmt es mit einem höheren Vertrauen zu korrigieren.
Der einzige Nachteil an diesem Projekt ist, dass sie gegenwärtig sind Digitalisieren von alten Ausgaben der "New York Times, die nicht von großem Nutzen für die Menschheit als Ganzes IMHO, aber so ist das Leben. Wenn Sie wirklich langweilen, können Sie hier klicken, um Antwort reCAPTCHA, nur um zu dem Projekt beitragen.
Mehr von von Ahn
Matchin 'ist eine verdeckte Experiment in der künstlichen Intelligenz. Jedes Mal, wenn Spieler sich auf ein Bild, es ist schöner, als hat. Von Ahn, eine 28-jährige Professor für Informatik an der Carnegie Mellon, wird das Spiel online zu stellen in diesem Sommer, und Tausende von Menschen spielen, es wird seine Datenbank mit 100.000 Fotos mit etwas typisch Mensch: eine ästhetische Sensibilität durchdrungen sein, kodiert als ein Ranking der Attraktivität.
Das Spiel im Grunde Tricks Mensch-Computer in den Unterricht, was Hübsche darstellt. Wenn genug Leute spielen Matchin "- und von Ahn's vorherigen Spiele haben Millionen von Spiel-Stunden sammelte - es könnte auch die Attraktivität des rate jedem Bild im Internet. Google könnte die Bewertungen in seine Suchmaschine zu übernehmen, so können Sie speziell für die "schöne" Bilder der Häuser, Menschen oder Landschaften suchen.
"Menschen an, herauszufinden, was die attraktive gut sind, und Computer sind gut schnell das Suchen und Finden", sagt von Ahn. "Sie stellen sie zusammen und bang!"
Das ist "Human Computation", die Kunst, mit massiven Gruppen von vernetzten menschlichen Geist, Probleme zu lösen, dass Computer nicht können. Stellen Sie eine Maschine, dass sie auf ein Bild von einem Vogel oder suchen Sie sich eine bestimmte Stimme in einer Menge, und es in der Regel nicht. Aber auch die dämlich Menschen kann ich gut und leicht. Von Ahn hat erkannt, dass unsere normalen Ansicht der Mensch-Computer-Verhältnis umgekehrt werden kann. Die meisten von uns annehmen Computer die Menschen klüger. Er sieht die Menschen als einen Weg zu einem Computer intelligenter zu machen.
Quoten sind Sie bereits von der Arbeit von Ahn profitiert. Wie, wenn Sie in einem dieser gestreckt und verzerrt Worte, bevor sie Zugang zu einer Yahoo-Mail-Konto oder die Ticketmaster zu speichern. Das ist ein Captcha, die von Ahn entwickelte im Jahr 2000 auf Spambots zu verhindern. Oder gibt es von Ahn Die Bild-Beschriftung Spiele, die Tausende von Langeweile Web-Surfer in Tagging 300.000 Fotos online - tun es so effektiv, dass Google seine Idee letztes Jahr gekauft, um sein Image zu verbessern Suchmaschine gelockt haben.
Vor Auszug vom "Wired Magazine (16,07) für bestimmte Aufgaben, die Cortex Still Beats die CPU von Clive Thompson
Kategorien: allgemeine, Nachrichten, Technik
Tags: Digitalisierung, Nachrichten, Fotografie, Technologie
Kommentare: Keine Kommentare.


























