0% utsläpp, 100% förnybar energi!

Digitalisera New York Times

CAPTCHA står för Completely Automated Public Turing Test to Tell Computers and Humans Apart och myntades 2000 av Luis von Ahn, Manuel Blum, Nicholas Hopper och John Langford av Carnegie Mellon University, som utvecklade CAPTCHA programmet. För oss vanliga dödliga att det ofta verkar som hemetic arabiska typsnitt, så kraftigt störas även människor kan inte läsa det. Men de har gått ett steg längre, och även om jag kan vara långsam på att plocka upp det jag märkte det "lättare" KAPTEN koden för att läsa ser ut som gamla typsnitt, och visst är den!

KAPTEN är ett program utvecklat av som kan avgöra om användaren är en människa eller en dator. CAPTCHAs används av många webbplatser för att förhindra missbruk av "bots", eller automatiserade program vanligen skrivet att generera spam. Inga datorprogram kan läsa förvrängd text liksom människor kan, så botar inte kan navigera webbplatser som skyddas av CAPTCHAs.

Cirka 200 miljoner CAPTCHAs löses av människor runt om i världen varje dag. I varje fall är ungefär tio sekunder av människors tid spenderas. Individuellt, det är inte mycket tid, men sammanlagt dessa små pussel konsumera mer än 150.000 timmars arbete varje dag. Tänk om vi kunde göra positiva utnyttja denna mänskliga ansträngning? recaptcha gör exakt som genom att förmedla den ansträngning tillbringade lösa CAPTCHAs online i "läsa" böcker.

I ett försök att arkivera mänsklig kunskap digitalt arkivmaterial, finns flera projekt som digitaliserar närvarande fysiska böcker som skrevs före dataåldern. Boken sidor som skannas in bilder och sedan omvandlas till text med "Optical Character Recognition (OCR). Även bilder går att avläsa av människor texten inte är sökbar och kan inte indexeras, även filstorleken äventyras eftersom bilderna är mycket större och svårare att lagra.

recaptcha förbättrar arbetet med att digitalisera böcker genom att skicka ord som inte kan läsas av datorer till Internet i form av CAPTCHAs för människor att dechiffrera. Mer specifikt är varje ord som inte kan läsas av OCR placeras på en bild och användas som en CAPTCHA. Detta är möjligt eftersom de flesta OCR-program varnar dig när ett ord inte kan läsas korrekt.

Jag sålde detta och ansåg det helt nytt och twee, men jag kunde inte låta bli att undra hur de vet vad vi skriver in är korrekt. Den knep är ett av orden är en kontroll ord, redan är kända och avsiktligt seedade tillbaka och oftast från samma källa som andra ord, förutsätter det projekt som du har angett den korrekt och sparar ordet med tillräckligt många människor har kommit in på samma ord på samma sätt och antar att det stämmer med högre förtroende.

Den enda nackdelen med detta projekt är att de för närvarande är att digitalisera gamla utgåvor av New York Times, vilket inte är till stor nytta för hela mänskligheten IMHO, men sådant är livet. Om du verkligen uttråkad, kan du klicka här för att svara recaptcha är bara att bidra till projektet.

Mer av von Ahn

Matchin "är ett förtäckt experiment i artificiell intelligens. Varje gång spelare enas om en bild, det är taggade som vackrare. Von Ahn, en 28-årig professor i datavetenskap vid Carnegie Mellon, kommer att sätta spelet online i sommar, och som tusentals människor spelar det, kommer hans databas över 100.000 bilder genomsyras med något klassiskt människa: en estetisk sensibilitet kodas som en rangordning av attraktivitet.

Spelet grunden tricks människor i undervisningen datorer vad som utgör SKÖNHET. Om tillräckligt många människor spelar Matchin "- och von Ahn tidigare spel har samlat miljontals play-timmar - det så småningom kan betygsätta överklagande av varje bild på Internet. Google skulle införa betyg i sin sökmotor, så att du kan söka specifikt efter "vackra" bilder av hus, människor eller landskap.

"Folk är bra på att räkna ut vad som attraktiv och datorer är bra på att snabbt söka och hitta, säger von Ahn säger. "Du lägger ihop dem, och pang!"

Detta är "mänsklig beräkning," konsten att använda stora grupper av nätverkssystem människors hjärnor för att lösa problem som datorer kan inte. Fråga en maskin för att peka på en bild av en fågel eller plocka ut en viss röst i en folkmassa, och brukar misslyckas. Men även de mest dumma människa kan göra detta enkelt. Von Ahn har insett att våra normala hänsyn till människa-dator relation kan inverteras. De flesta av oss anta datorer göra människor smartare. Han ser människor som ett sätt att göra datorer smartare.

Oddsen är du redan har dragit nytta von Ahn arbete. Som när du skriver i en av dessa sträcks och skev ord innan de får tillgång till ett Yahoo-e-postkonto eller Ticketmaster butik. Det är en Captcha, som von Ahn utvecklats under 2000 för att motverka spam bots. Eller finns von Ahn's picture-märkning spel, som lockade tusentals borrade webbsurfare till taggning 300.000 bilder online - gör det så effektivt att Google köpte hans idé förra året att förbättra sin sökmotor.

Ovanför utdrag från tidskriften Wired (16,07) för vissa uppgifter, slår Cortex Still the CPU av Clive Thompson

Posted: 15 December 2009
Kategorier: allmänt, nyheter, teknologi
Tags:
Kommentarer: Inga kommentarer.












Twitter Facebook MySpace Flickr YouTube RSS2