0% utslipp, 100% fornybar energi!

Digitalisering New York Times

CAPTCHA står for "Completely Automated Public Turing test for å Tell Computers and Humans Apart, og ble skapt i 2000 av Luis von Ahn, Manuel Blum, Nicholas Hopper og John Langford ved Carnegie Mellon University, som utviklet KAPTEIN programmet. For oss mer dødelige det ofte vises som hemetic arabisk skrift, så tungt forvrengt selv mennesker kan ikke lese den. Men de har gått et skritt videre, og mens jeg kan være treg på å plukke opp på denne jeg la merke til den "lettere" KAPTEIN koden for å lese ser ut som gammel type skrift, og at nok er det!

CAPTCHA er et program utviklet av som kan fortelle om sin brukeren er et menneske eller en datamaskin. CAPTCHAs brukes av mange nettsteder for å hindre misbruk av "bots", eller automatiserte programmer vanligvis skrevet for å generere spam. Ingen dataprogram kan lese fordreid tekst så vel som mennesker kan, slik at roboter kan ikke navigere nettsteder beskyttet av CAPTCHAs.

Om lag 200 millioner CAPTCHAs løses av mennesker over hele verden hver dag. I hvert fall er omtrent ti sekunder av menneskers tid blir brukt. Individuelt, det er ikke mye tid, men i samlet disse små puslespill konsumere mer enn 150.000 timers arbeid hver dag. Hva om vi kunne få en positiv bruk av menneskelig innsats? reCAPTCHA gjør nøyaktig at ved å kanalisere innsatsen brukte løse CAPTCHAs online i "reading" bøker.

I et forsøk på å arkivere menneskelig kunnskap digitalt arkiv materialer, er flere prosjekter for tiden digitalisere fysiske bøker som ble skrevet før dataalderen. Boken sider blir skannet som bilder, og deretter omgjort til tekst ved hjelp av "Optical Character Recognition (OCR). Mens bildene er lesbar av mennesker teksten ikke er søkbare og kan ikke indekseres også filstørrelsen er kompromittert som bilder er mye større og vanskeligere å lagre.

reCAPTCHA forbedrer prosessen med å digitalisere bøker ved å sende ord som ikke kan leses av datamaskiner til Internett i form av CAPTCHAs for mennesker å dechiffrere. Mer spesifikt, er hvert ord som ikke kan leses riktig av OCR plassert på et bilde og brukes som en CAPTCHA. Dette er mulig fordi de fleste OCR planer varsle deg når et ord ikke kan leses riktig.

Jeg ble solgt av dette punktet og mente det absolutt romanen og twee, men jeg kunne ikke hjelpe, men lurer på hvordan de vet hva vi går inn er riktig. Den gimmick er et av ordene er en kontroll ord, allerede kjent og vilje seeded tilbake og vanligvis fra samme kilde som det andre ordet, forutsetter prosjektet at du har skrevet den riktig og lagrer ordet etter nok folk har skrevet det samme ordet på samme måte, og antar det er riktig med høyere selvtillit.

Den eneste ulempen med å bruke dette prosjektet er at i dag er de digitalisere gamle utgaver av New York Times, som ikke er for mye nytte for menneskeheten som helhet IMHO, men slik er livet. Hvis du virkelig kjeder deg, kan du klikke her for å svare reCAPTCHA er bare å bidra til prosjektet.

Flere av von Ahn

Matchin 'er et hemmelig eksperiment i kunstig intelligens. Hver gang spillerne enige om et bilde, er det merket som penere. Von Ahn, en 28 år gammel professor i informatikk ved Carnegie Mellon, setter spillet online i sommer, og som tusenvis av mennesker spille det, vil hans database på 100.000 fotografier være gjennomsyret med noe quintessentially menneske: en estetisk følsomhet, kodet som en rangering av attraktivitet.

Spillet utgangspunktet triks mennesker inn i undervisningen datamaskiner hva som prettiness. Hvis nok personer spiller Matchin '- og von Ahn tidligere spill har fått millioner av spille-timer - det kan eventuelt vurdere klagen på alle bilder på internett. Google kunne innarbeide stemmer i sin søkemotor, så du kan søke spesielt etter "vakre" bilder av hus, folk og landskap.

"Folk er flinke til å finne ut hva som er attraktive, og datamaskiner er gode til raskt søke og finne," von Ahn sier. "Du setter dem sammen, og bang!"

Dette er "menneskelig beregning," kunsten å bruke enorme grupper av nettverk menneskesinn å løse problemer som datamaskiner ikke kan. Spør en maskin til å peke på et bilde av en fugl eller plukke ut en bestemt stemme i en folkemengde, og det vanligvis mislykkes. Men selv de mest spesielt gløgge menneske kan gjøre dette enkelt. Von Ahn har innsett at vårt vanlige syn på menneske-maskin forholdet kan bli invertert. De fleste av oss anta datamaskiner gjøre folk smartere. Han ser folk som en måte å gjøre datamaskiner smartere.

Odds har du allerede dratt nytte av von Ahn arbeid. Som når du skriver inn en av de strukket og skjevt ord før du får tilgang til Yahoo e-postkonto eller Ticketmaster butikken. Det er en Captcha som von Ahn utviklet i 2000 for å hindre programmer som samler. Eller er det von Ahn's picture-merking spill, som har lokket tusenvis av boret surfere til merking av 300000 bilder på nettet - gjør det så effektivt at Google kjøpte ideen i fjor for å bedre sitt image søkemotor.

Over utdrag fra Wired Magazine (16.07) For enkelte oppgaver, slår Cortex Fortsatt CPU av Clive Thompson

Skrevet: 15 desember 2009
Kategorier: generell, nyheter, teknologi
Tags:
Kommentarer: Ingen kommentarer.