0% emissioner, 100% vedvarende energi!

Digitalisering af New York Times

CAPTCHA står for Completely Automated Public Turing Test til Tell Computers and Humans Apart og blev opfundet i 2000 af Luis von Ahn, Manuel Blum, Nicholas Hopper og John Langford af Carnegie Mellon University, som har udviklet CAPTCHA-programmet. For os almindelige dødelige er det ofte fremstår som hemetic arabisk skrift, så stærkt fordrejet selv mennesker kan ikke læse det. Men de har gået et skridt videre, og selv om jeg kan være langsom om at afhente på dette bemærkede jeg den 'lettere' ANFØRER kode til at læse ligner gamle type skrifttype, og ganske rigtigt det er!

CAPTCHA er et program udviklet af der kan fortælle om dens bruger er et menneske eller en computer. CAPTCHAs bruges af mange websteder for at forhindre misbrug fra "bots" eller automatiske programmer, der normalt er skrevet for at generere spam. Ingen edb-program kan læse forvrænget tekst såvel som mennesker kan, så bots kan ikke navigere lokaliteter er beskyttet af CAPTCHAs.

Omkring 200 millioner CAPTCHAs løses af mennesker rundt omkring i verden hver dag. I hvert tilfælde er rundt regnet ti sekunder af menneskers tid bliver brugt. Individuelt, det er ikke en masse tid, men i samlet disse små puslespil forbruge mere end 150.000 timers arbejde hver dag. Hvad hvis vi kunne gøre en positiv brug af denne menneskelige indsats? reCAPTCHA gør netop, at ved at kanalisere den indsats brugt løse CAPTCHAs online til "læse" bøger.

I et forsøg på at arkivere den menneskelige viden digitalt arkiv materialer, er flere projekter i øjeblikket digitalisering af fysiske bøger, der blev skrevet før computeren alder. Bogen sider er at blive scannet som billeder, og derefter omdannet til tekst ved hjælp af "Optical Character Recognition" (OCR). Selv om billederne kan læses af mennesker i teksten er ikke søgbare og kan ikke indekseres, også filstørrelse er kompromitteret som billeder er meget større og sværere at gemme.

reCAPTCHA forbedrer processen med digitalisering af bøger ved at sende ord, der ikke kan læses af computere til internettet i form af CAPTCHAs for mennesker at dechifrere. Mere specifikt, hvert ord, der ikke kan læses korrekt af OCR er placeret på et billede og bruges som en CAPTCHA. Dette er muligt, fordi de fleste OCR-programmer advare dig, når et ord kan ikke læses korrekt.

Jeg var solgt af dette punkt, og fandt det helt nye og twee, men jeg kunne ikke lade være med at spekulere på, hvordan de ved, hvad vi kommer ind er korrekt. Den fidus er, et af ordene er en kontrol-ord, der allerede er kendt og forsætligt seedede tilbage og som regel fra samme kilde som det andet ord, at projektet forudsætter, at du har indtastet det korrekt og gemmer ord efter tilstrækkeligt mange mennesker er kommet ind på samme ord på samme måde, og antager, det er korrekt med højere tillid.

Den eneste ulempe med dette projekt er, at på nuværende tidspunkt de er digitalisering af gamle udgaver af New York Times, som ikke er af stor gavn for hele menneskeheden IMHO, men sådan er livet. Hvis du virkelig keder sig, kan du klikke her for at besvare reCAPTCHA bare for at bidrage til projektet.

Flere af von Ahn

Matchin 'er en skjult eksperiment i kunstig intelligens. Hver gang spillerne enige om et billede, det er tagget smukkere. Von Ahn, en 28-årig professor i datalogi ved Carnegie Mellon, vil sætte spillet online denne sommer, og som tusinder af mennesker spiller det, vil hans database på 100.000 billeder være gennemsyret med noget indbegrebet af menneskelig: en æstetisk sensibilitet, kodet som en rangordning af tiltrækningskraft.

Spillet grundlæggende tricks mennesker i undervisningen computere, hvad der udgør prettiness. Hvis tilstrækkeligt mange spiller Matchin «- og von Ahn's tidligere spil har høstet millioner af spille-timer - det kan i sidste ende sats appellen af hvert billede på internettet. Google kunne optage stemmer i sin søgemaskine, så du kan søge specifikt efter "smukke" billeder af huse, mennesker eller landskaber.

"Folk er gode til at regne ud, hvad der er attraktivt, og computere er gode til hurtigt at søge og finde," von Ahn siger. "Du sætte dem sammen, og bang!"

Dette er "menneskelig beregning," kunsten at bruge massive grupper af netværksbaserede menneskelige sind til at løse problemer, som computere ikke kan. Spørg en maskine til at pege på et billede af en fugl eller udvælge en bestemt stemme i en menneskemængde, og det som regel ikke. Men selv de mest dunkle-opfattende menneske kan gøre det nemt. Von Ahn har indset, at vores normale opfattelse af human-computer forholdet kan være inverteret. De fleste af os antage computere gøre folk klogere. Han ser mennesker som en måde at gøre computere smartere.

Odds er du allerede har nydt godt af von Ahn's arbejde. Ligesom når du skriver i en af disse strækkes og skæv ord, før at få adgang til en Yahoo mail-konto eller Ticketmaster butikken. Det er en Anfører, som von Ahn udviklet i 2000 for at forpurre spambots. Eller er der von Ahn's billede-mærkning spil, som har lokket tusindvis af borede Surfere i kodning 300.000 billeder online - at gøre det så effektivt, at Google har købt hans ide sidste år for at forbedre sit image søgemaskine.

Ovenstående uddrag fra Wired Magazine (16,07) til visse opgaver, Stadig den Cortex Beats CPU af Clive Thompson

Posted: 15 December 2009
Kategorier: Generelt, nyheder, teknologi
Tags:
Kommentarer: Ingen kommentarer.












Twitter Facebook MySpace Flickr YouTube RSS2