0%-uitstoot, 100% hernieuwbare energie!

Digitalisering van de New York Times

CAPTCHA staat voor volledig geautomatiseerd Public Turing Test van elkaar te onderscheiden Computers en Mensen en werd bedacht in 2000 door Luis von Ahn, Manuel Blum, Nicholas Hopper en John Langford van de Carnegie Mellon University, die de CAPTCHA-programma ontwikkeld. Voor ons gewone stervelingen vaak weergegeven als hemetic Arabisch lettertype, zo zwaar zelfs vervormd mens kan het niet lezen. Maar ze hebben een stap verder gegaan, en terwijl ik langzaam op inhaken op dit merkte ik het "makkelijker" CAPTCHA code ziet eruit als oude type font te lezen, en zeker genoeg is!

CAPTCHA is een programma ontwikkeld door die kan vertellen of de gebruiker is een mens of een computer. CAPTCHA's worden gebruikt door vele websites om misbruik van "bots te voorkomen," of geautomatiseerde programma's meestal geschreven om spam te genereren. Geen computerprogramma kan lezen vervormde tekst evenals de mens kan, dus kan het niet navigeren bots sites beschermd door captcha.

Ongeveer 200 miljoen captcha worden opgelost door mensen over de hele wereld elke dag. In elk geval, ongeveer tien seconden van menselijke tijd worden besteed. Individueel, dat is niet veel tijd, maar in het totaal van deze kleine puzzels verbruiken meer dan 150.000 uur werk per dag. Wat als we kunnen een positieve manier gebruik van deze menselijke inspanning te maken? reCAPTCHA doet precies dat door het kanaliseren van de moeite die besteed het oplossen van captcha online in "lezen" boeken.

In een poging om de menselijke kennis digitaal archief archiefmateriaal, zijn meerdere projecten die momenteel het digitaliseren van fysieke boeken die geschreven waren voordat de computer leeftijd. Het boek pagina's worden gescand als afbeeldingen, en vervolgens omgezet in tekst met behulp van "Optical Character Recognition" (OCR). Hoewel de beelden leesbaar zijn door de mens is niet de tekst doorzoekbaar en kunnen niet worden geïndexeerd, ook de grootte van het bestand in het gedrang komt als beelden zijn veel groter en moeilijker op te slaan.

reCAPTCHA verbetert het proces van het digitaliseren van boeken door het sturen van woorden die niet door computers kan worden gelezen op het web in de vorm van captcha te ontcijferen voor de mens. Meer in het bijzonder, is elk woord dat niet correct kunnen worden gelezen door OCR geplaatst op een afbeelding en wordt gebruikt als een CAPTCHA. Dit is mogelijk omdat de meeste OCR programma waarschuwt u wanneer een woord niet correct kan worden gelezen.

Ik was verkocht door dit punt en dacht dat het absoluut nieuw en Twee, maar ik kon het niet helpen, maar vraag me af hoe ze weten wat we binnenkomen is juist. De gimmick is, een van de woorden is een controle-woord, die al bekend en opzettelijk terug zaadjes en meestal uit dezelfde bron als het tweede woord, het project gaat ervan uit dat u het correct ingevuld en slaat het woord na genoeg mensen zijn het dezelfde woord op dezelfde manier en neemt aan dat het correct is met hogere vertrouwen.

Het enige nadeel aan dit project is dat op dit moment ze oude edities van de New York Times, die niet is van veel voordeel voor de mensheid als geheel IMHO digitaliseren, maar zo is het leven. Als je echt vervelen, dan kunt u hier klikken om te antwoorden reCAPTCHA is gewoon om bij te dragen aan het project.

Meer door von Ahn

Bijpassende 'is een verkapte experiment in kunstmatige intelligentie. Iedere keer dat spelers het eens op een foto, het is gemarkeerd als mooier. Von Ahn, een 28-jarige professor in de computerwetenschappen aan de Carnegie Mellon, zal het spel online deze zomer, en duizenden mensen spelen, zijn databank van 100.000 foto's zullen worden doordrongen met iets typisch menselijk: een esthetische sensibiliteit, gecodeerd als een rangorde van aantrekkelijkheid.

Het spel houdt trucs mensen in het onderwijs computers wat schoonheid. Als er genoeg mensen spelen voor bijpassende '- en de vorige games von Ahn's hebben vergaard miljoenen play-uur - het kan uiteindelijk het rentetarief van de aantrekkingskracht van elke afbeelding op het internet. Google zou kunnen nemen in de beoordelingen in de zoekmachine, dus je zou kunnen gericht op zoek naar "mooie" foto's van huizen, mensen of landschappen.

"Mensen zijn goed in het uitzoeken wat aantrekkelijk is, en computers zijn goed in het snel zoeken en vinden," zegt von Ahn. "Je zet ze samen, en paf!"

Dit is "de menselijke berekening," de kunst van het gebruik van grote groepen van de menselijke geest een netwerk om problemen op te lossen die computers niet kunnen. Vraag een machine om te verwijzen naar een plaatje van een vogel of een bepaalde uitzoeken stem in een menigte, en het lukt meestal niet. Maar zelfs de meest domme mens kan dit gemakkelijk doen. Von Ahn heeft ingezien dat ons normale weergave van de relatie mens-computer kunnen worden omgedraaid. De meesten van ons nemen computers maken de mensen slimmer. Hij ziet mensen als een manier om computers slimmer.

Kansen zijn u al geprofiteerd van het werk von Ahn's. Net als wanneer u typt in een van die uitgerekt en scheef woorden voordat je toegang krijgt tot een Yahoo-account of de Ticketmaster te slaan. Dat is een Captcha, die von Ahn ontwikkeld in 2000 te dwarsbomen spambots. Of er von Ahn's foto-etikettering spellen, die duizenden van verveelde surfers van het Web verleid zijn tot tagging 300.000 foto's online - doet het zo effectief dat Google zijn idee kocht vorig jaar haar afbeelding zoekmachine te verbeteren.

Boven uittreksel van Wired Magazine ( 16,07 ) voor bepaalde taken, de Cortex klopt nog de CPU van Clive Thompson

Geplaatst: 15 december de 2009
Categorieën: algemeen , nieuws , technologie
Tags: , , ,
Reacties: Geen Reacties .












Sjilpen Facebook MySpace Flickr YouTube RSS2