Digitalización del New York Times
CAPTCHA significa completamente automatizada Pública Test de Turing to Tell Computers and Humans Apart "y" fue acuñado en 2000 por Luis von Ahn, Manuel Blum, Nicholas Hopper y John Langford, de la Universidad Carnegie Mellon, que desarrolló el programa de CAPTCHA. Para nosotros, meros mortales que a menudo aparece como hemetic fuente del idioma árabe, tan fuertemente distorsionada, incluso los seres humanos no pueden leerlo. Sin embargo se han ido un paso más, y aunque me puede ser lento en recoger en este me di cuenta de la "más fácil" para leer el código CAPTCHA parece tipo de letra de edad, y claro está!
CAPTCHA es un programa desarrollado por el que se puede decir si su usuario es un humano o un ordenador. CAPTCHA son utilizados por muchos sitios web para prevenir el abuso de "bots" o programas automatizados generalmente escrito para generar spam. Ningún programa de ordenador puede leer el texto distorsionado, así como los seres humanos pueden, por lo que los robots no pueden navegar por los sitios protegidos por CAPTCHAs.
Unos 200 millones de CAPTCHA son resueltos por los seres humanos en todo el mundo cada día. En cada caso, aproximadamente de diez segundos de tiempo de los hombres se gastan. Individual, que no es mucho tiempo, pero en conjunto, estos pequeños puzzles consumen más de 150.000 horas de trabajo cada día. ¿Y si pudiéramos hacer un uso positivo de este esfuerzo humano? reCAPTCHA hace exactamente eso, canalizando el esfuerzo realizado en la solución de CAPTCHAs línea "leer" libros.
En un intento de archivar los conocimientos humanos archivar digitalmente los materiales, varios proyectos están la digitalización de libros físicos que fueron escritos antes de la era del ordenador. Las páginas del libro están siendo escaneados como imágenes, y luego se transforma en texto usando "Reconocimiento Óptico de Caracteres (OCR). Si bien las imágenes son legibles por los humanos, el texto no se puede buscar y no pueden ser indexados, también el tamaño del archivo se ve comprometida como las imágenes son mucho más grandes y más difíciles de almacenar.
reCAPTCHA mejora el proceso de digitalización de libros mediante el envío de palabras que no pueden ser leídos por computadoras en la Web en forma de letras cifradas para los seres humanos de descifrar. Más concretamente, cada palabra que no se puede leer correctamente por la OCR se coloca en una imagen y se utiliza como un CAPTCHA. Esto es posible porque la mayoría de los programas de OCR que le avise cuando una palabra no puede ser leído correctamente.
Me vendieron por este punto y pensó que era absolutamente novedoso y twee, pero no podía dejar de preguntarse cómo es que conocen lo que estamos entrando es la correcta. El truco es una de las palabras es una palabra de control, ya se conocen y deliberadamente la espalda y cabeza de serie por lo general de la misma fuente que la segunda palabra, el proyecto supone que se ha introducido correctamente y guarda la palabra después de bastantes personas han entrado en el mismo la palabra de la misma manera y asume que es correcto con mayor confianza.
La única desventaja de este proyecto es que en la actualidad son la digitalización de ediciones antiguas del New York Times, que no es de mucho beneficio para la humanidad como un todo en mi humilde opinión, pero así es la vida. Si usted es realmente aburrido, puedes hacer clic aquí para responder a reCAPTCHA sólo para contribuir al proyecto.
Más de von Ahn
Matchin 'es un experimento secreto de la inteligencia artificial. Cada vez los jugadores están de acuerdo en una imagen, es etiquetado como más bonita. Badal, de 28 años, profesor de ciencias de la computación en la Universidad Carnegie Mellon, pondrá el juego en línea de este verano, y como miles de personas juegan en ella, su base de datos de 100.000 fotografías será imbuido de algo esencialmente humano: una sensibilidad estética, codifica como un ranking de atractivo.
El juego básicamente trucos de los seres humanos en los ordenadores lo que constituye la enseñanza de belleza. Si suficiente gente jugar Matchin "- y los juegos anteriores de von Ahn han acumulado millones de horas de juego - que eventualmente podría calificar el recurso de casación de cada imagen en la Internet. Google podría incorporar las calificaciones en su motor de búsqueda, así que usted podría buscar específicamente "bello" fotos de casas, personas o paisajes.
"La gente es buena en averiguar lo que es atractivo, y los equipos son buenos en la rápida búsqueda y encuentro", dice von Ahn. "Se ponen a cocer juntos, y ¡bang!"
Esta es la "computación humana", el arte de la utilización de grupos masivos de la red la mente humana para resolver los problemas que las computadoras no pueden. Haga una máquina para que apunte a una imagen de un pájaro o elegir una voz particular en una multitud, y por lo general falla. Pero hasta los más lerdos humano puede hacer esto fácilmente. Von Ahn se ha dado cuenta que nuestra visión normal de la relación humano-computadora puede ser invertida. La mayoría de nosotros asumir las computadoras hacen que la gente más inteligente. Él ve la gente como una manera de hacer que las computadoras más inteligentes.
Lo más probable es que ya ha beneficiado de la obra de von Ahn. Al igual que cuando se escribe en una de esas palabras se estiró y sesgada antes de obtener acceso a una cuenta de correo electrónico de Yahoo o el almacén de Ticketmaster. Eso es un Captcha, que von Ahn desarrollado en 2000 para frustrar contra spam bots. O hay foto de von Ahn juegos de etiquetado, que han atraído a miles de usuarios de la Web en aburrido etiquetado 300.000 fotos en línea - haciendo con tanta eficacia que Google compró la idea el año pasado para mejorar su imagen de motores de búsqueda.
Por encima de extracto de la revista Wired (16,07) para ciertas tareas, la corteza Still Beats de la CPU por Clive Thompson,
Categorías: General,,, noticias de tecnología
Etiquetas: digitalización, noticias, fotografía, tecnología
Comentarios: Sin comentarios.


























