0% emise, 100% obnovitelné energie!

Digitalizace New York Times

CAPTCHA je zkratka pro plně automatizované veřejné Turingův test To Tell Počítače a lidi vedle a byl vytvořen v roce 2000 Luis von Ahn, Manuel Blum, Nicholas Hopper a John Langford z Carnegie Mellon University, která vyvinula program CAPTCHA. Chcete-li nám obyčejným smrtelníkům se často jeví jako hemetic Arabština písmo, tak silně narušena ani lidé nemohou číst. Nicméně oni si už o krok dál, a zatímco já může být pomalý nástup na to jsem si všiml, 'snadnější' KAPITÁN kód přečíst vypadá jako starý typ písma, a opravdu je!

CAPTCHA je vyvinut program, který může říci, zda jeho uživatel je člověk, nebo počítač. Captchas jsou využívána v mnoha internetových stránek, aby se zabránilo zneužívání z "botů", nebo automatické programy, obvykle napsané pro generování spamu. Žádný počítačový program může číst zkreslené text, stejně jako lidé mohou, takže roboti nemohou procházet weby chráněné captchas.

O 200 milionů captchas jsou řešeny lidé na celém světě každý den. V každém případě jsou zhruba deset sekund na lidský čas strávený. Individuálně, to není moc času, ale v úhrnu tyto malé puzzle spotřebují více než 150.000 pracovních hodin každý den. Co kdybychom mohli učinit pozitivní využití tohoto lidského úsilí? reCAPTCHA dělá přesně to, že výměnou úsilí vynaložené řešení captchas on-line na "čtení" knih.

Ve snaze archivu lidského poznání digitálně archivních materiálů, mnoho projektů, které v současné době digitalizace fyzického knih, které byly napsány před počítačem věku. Kniha stránky jsou testovány jako obraz, a poté byly převedeny do textu pomocí "Optické rozpoznávání znaků" (OCR). Zatímco obrazy jsou čitelné člověkem text není vyhledávat a nemůže být indexovány, také velikost souboru je ohrožena jako obrazy jsou mnohem větší a těžší skladovat.

reCAPTCHA zlepšuje proces digitalizace knih zasláním slova, která nelze číst pomocí počítačů na webu ve formě captchas pro člověka dešifrovat. Přesněji řečeno, je každé slovo, které nelze přečíst správně OCR uveden na obrázku a používá se jako CAPTCHA. To je možné proto, že většina OCR programů vás upozorní, když je slovo, nemůže být správně přečíst.

Byl jsem prodal podle tohoto bodu, a myslel, že to zcela nový a sentimentální, ale nemohl jsem si pomoct, ale divím, jak vědí, co jsme zadání je správné. Trik je jedním ze slov je řídicí slovo, které jsou již známé a záměrně nasazená zpět a obvykle ze stejného zdroje jako druhé slovo, projekt předpokládá, že jste zadali správně a šetří slovo po dost lidé vstoupili do stejné Slovo stejným způsobem a předpokládá se, že je správné s vyšší důvěrou.

Jediná nevýhoda tohoto projektu je, že v současné době jsou to digitalizace starých vydání deníku New York Times, který není o moc přínosem pro lidstvo jako celek IMHO, ale takový je život. Pokud jste opravdu nudit, můžete zde odpovědět na reCAPTCHA prostě přispět k projektu.

Více von Ahn

Matchin 'je skrytý experiment v oblasti umělé inteligence. Pokaždé, když se hráči dohodnou na obrázku, je to označené jako hezčí. Von Ahn, 28-rok-starý profesor počítačových věd na Carnegie Mellon, s jehož pomocí on-line hry letos v létě, a jako tisíce lidí hraje, bude jeho databázi 100.000 fotografií je prodchnuta něco ryze lidské: estetického cítění, kódovány jako žebříčku přitažlivosti.

Hra v podstatě triky lidi do výuky počítačů, co je krása. Je-li dost lidí hraje Matchin '- a von Ahn předchozích zápasů sbíral miliony play-hodin - to by nakonec sazba odvolání každého obrázku na internetu. Google by mohly obsahovat hodnocení do svého vyhledávače, takže si mohl hledat zvlášť pro "krásné" záběry domy, lidé, nebo krajiny.

"Lidé jsou dobře umíme, co je atraktivní, a počítače jsou dobré pro rychlé hledání a nalezení," říká von Ahn. "Ty dát dohromady, a prásk!"

To je "lidský výpočet," umění pomocí masivní skupin propojených lidské mysli na řešení problémů, které počítače nemohou. Zeptejte se stroj, aby ukazoval na obraz ptáka, nebo vybrat konkrétní hlas v davu, a obvykle se nezdaří. Ale i ty tlumené-nechápavý člověk může udělat snadno. Von Ahn uvědomil, že náš pohled na normální člověk-počítač vztah může být obráceně. Většina z nás převzít počítačů lidi chytřejší. Vidí lidi jako způsob, jak počítač chytřejší.

Kurzy jsou už jste těžily z práce von Ahn to. Stejně jako když zadáte do jedné z těchto protáhla, a narušeným slova předtím, než získají přístup k účtu, nebo e-mail Yahoo obchodu Ticketmaster. To je Captcha, který von Ahn vyvinut v roce 2000 s cílem neutralizovat spambotům. Nebo je tu von Ahn snímek-labeling hry, které lákal tisíce znuděných surfařů webu do tagování 300.000 fotky on-line - dělá to tak efektivně, že Google koupil jeho nápad v loňském roce s cílem zlepšit její image vyhledávače.

Nad výňatek z časopisu Wired (16.07) pro určité úkoly, Cortex bije procesor Clive Thompson

Zaslal: 15 prosinec 2009
Kategorií: obecné, novinky, technika
Tags:
Komentář: No Comments.