Digitising ניו יורק טיימס
CAPTCHA מייצג Completely Automated Public Turing Test To Tell Computers and Humans Apart ו הוטבע בשנת 2000 על ידי לואיס פון Ahn, מנואל בלום, ניקולס הופר וג 'ון לנגפורד של אוניברסיטת קרנגי מלון, שפיתחה את תוכנית CAPTCHA. לנו סתם בני תמותה זה לעתים קרובות מופיע הגופן hemetic השפה הערבית, כל כך הרבה בני אדם מעוותים אפילו לא יכול לקרוא אותו. אולם הם הלכו צעד אחד קדימה, ואת בעוד אני עשוי להיות איטי על להרים על זה אני שם לב 'קל' קוד CAPTCHA לקרוא נראה כמו סוג הגופן הישן, ואכן זה!
CAPTCHA היא תוכנית שפותחה על ידי כך ניתן לדעת אם המשתמש שלו הוא אדם או מחשב. CAPTCHAs נמצאים בשימוש על ידי אתרי אינטרנט רבים כדי למנוע ניצול לרעה מן "הרובוטים", או תוכנות אוטומטיות בדרך כלל בכתב כדי ליצור ספאם. תוכנית מחשב לא יכול לקרוא את הטקסט המעוות כמו גם בני האדם יכולים, כדי שהרובוטים לא יוכלו לנווט באתרים מוגנים על ידי CAPTCHAs.
על 200 מיליון CAPTCHAs נפתרות על ידי בני אדם ברחבי העולם מדי יום. בכל מקרה, בערך עשר שניות של זמן אדם מנוצלים. בנפרד, זה לא הרבה זמן, אבל במצטבר אלה חידות לצרוך מעט יותר מ -150,000 שעות עבודה בכל יום. מה אם יכולנו לעשות שימוש חיובי של מאמץ זה אנושי? reCAPTCHA עושה בדיוק את זה על ידי הפניית המאמץ בילתה לפתרון CAPTCHAs מקוון תוך קריאת "" ספרים.
בניסיון ארכיון הידע האנושי דיגיטלית חומרי ארכיון, פרויקטים מרובים כרגע digitizing ספרים פיזי נכתבו לפני עידן המחשב. דפי הספר הם נסרק כמו תמונות, ולאחר מכן הופך הטקסט באמצעות "זיהוי תווים אופטי (OCR). תמונות בעוד קריאים על ידי בני אדם את הטקסט אינו לחיפוש לא ניתן לרשום באינדקס, גם גודל הקובץ נפגעת כמו התמונות הן הרבה יותר גדול ויותר לחנות.
reCAPTCHA משפר את תהליך digitizing ספרים ידי שליחת מילים שלא ניתן לקרוא על ידי מחשבים באינטרנט בצורה של CAPTCHAs עבור בני האדם לפענח. ליתר דיוק, כל מילה שלא ניתן לקרוא כראוי על ידי OCR מושם על דימוי ו משמש CAPTCHA. זה אפשרי מכיוון שרוב התוכניות OCR לך התראה כאשר מילה לא שניתן יהיה לקרוא כראוי.
אני נמכרה בשלב הזה וחשבתי שזה בהחלט רומן twee, אבל לא יכולתי שלא לתהות איך הם יודעים מה אנחנו נכנסים נכונה. את הגימיק הוא, אחת המילים היא מילה שליטה, כבר ידוע במכוון seeded לאחור בדרך כלל מאותו מקור כמו המילה השנייה, את הפרויקט מבוסס על ההנחה שהזנת אותה כראוי ושומר את המילה אחרי מספיק אנשים נכנסו באותו המילה בצורה זהה ועל ההנחה היא נכונה עם ביטחון גבוה יותר.
החיסרון היחיד לפרויקט זה שכרגע הם digitizing מהדורות ישנות של ניו יורק טיימס ", אשר לא תועלת רבה לאנושות, כמו IMHO שלם, אבל עולם כמנהגו נוהג. אם אתה באמת משועמם, אתה יכול ללחוץ כאן כדי לענות reCAPTCHA רק לתרום לפרויקט.
נוסף על ידי פון Ahn
Matchin 'היא ניסוי חשאי בבינה מלאכותית. שחקנים כל הזמן מסכימים על תמונה, זה כמו tagged יפה. Von Ahn, בן 28 שנה של פרופסור זקן במדעי המחשב באוניברסיטת קרנגי מלון, ישימו את המשחק באינטרנט זה בקיץ, כמו אלפי אנשים לשחק בו, באתר שלו תמונות של 100,000 יהיה חדור משהו quintessentially האדם: רגישות אסתטית, בקידוד של הדירוג של אטרקטיביות.
המשחק טריקים בעצם בני אדם לתוך המחשבים ללמד מהי היופי. אם אנשים מספיק לשחק Matchin '- ו פון Ahn של משחקים קודמים זכו מיליוני לשחק שעות - זה היה שער בסופו של דבר את הערעור של כל תמונה באינטרנט. גוגל יכול לשלב את דירוגי לתוך מנוע החיפוש שלה, כך שאתה יכול לחפש במיוחד עבור "יפה" תמונות של בתים, אנשים, או נופים.
"אנשים טובים להבין מה מושך, ומחשבים טובים במהירות לחפש ולמצוא," פון Ahn אומר. "אתה שם אותם ביחד, ולדפוק!"
זהו "חישוב האדם," האמנות של שימוש מסיבי קבוצות של המוח האנושי לרשת כדי לפתור בעיות שמחשבים לא יכולים. תשאל מכונת כדי להצביע על תמונה של ציפור או לבחור קול מסוים בתוך קהל, וזה בדרך כלל נכשל. אבל אפילו הקלוש ביותר מוח האדם יכול לעשות את זה בקלות. Von Ahn הבין כי יש בתצוגה רגילה של מערכת היחסים שלנו, המחשב האנושי יכול להיות הפוך. רובנו מניחים המחשבים לגרום לאנשים חכמים. הוא רואה אנשים כדרך להפוך מחשבים חכם.
רוב הסיכויים הם כבר נהנו לעבוד פון Ahn's. כאשר אתה אוהב סוג אחד של המילים האלה התמתח סוטים לפני מקבל גישה לחשבון הדואר האלקטרוני יאהו או את החנות Ticketmaster. זה Captcha, אשר פיתח פון Ahn בשנת 2000 כדי לסכל spambots. או שם של תמונה של פון Ahn-משחקים התיוג, אשר משכו אלפי גולשים משועמם האינטרנט לתוך תיוג 300,000 תמונות באינטרנט - עושה את זה כל כך יעיל כי רכשה גוגל את הרעיון שלו בשנה שעברה לשפר את תדמיתה של מנועי חיפוש.
מעל קטע מתוך מגזין Wired (16.07) בוודאות משימות, קליפת עדיין פועם המעבד על ידי קלייב תומפסון
קטגוריות: כללי,, חדשות טכנולוגיה
תגיות: digitisation, חדשות, צילום, טכנולוגיה
תגובות: אין תגובות.


























