Ψηφιακοποίηση των New York Times
CAPTCHA σημαίνει Completely Automated Public Turing Test To Tell Computers and Humans Apart και επινοήθηκε το 2000 από τον Luis von Ahn, Manuel Blum, Nicholas Hopper και John Langford του Carnegie Mellon University, ο οποίος ανέπτυξε το πρόγραμμα καπετάνιος. Για να μας θνητοί εμφανίζεται συχνά ως hemetic αραβικό γραμματοσειρά γλώσσα, έτσι ώστε ακόμη και παραμόρφωσε σε μεγάλο βαθμό τους ανθρώπους δεν μπορεί να το διαβάσει. Ωστόσο, αυτά έχουμε προχωρήσει ένα βήμα παραπέρα, και ενώ μπορεί να είναι αργή σε μια παρατήρηση σε αυτό το παρατήρησα ευκολότερο «κωδικός του« καπετάνιος να διαβάσει μοιάζει με παλιά γραμματοσειρά, και βεβαιωθείτε ότι είναι αρκετά!
CAPTCHA είναι ένα πρόγραμμα που αναπτύχθηκε από ότι μπορεί να πει αν το χρήστη του είναι ένα ανθρώπινο ή έναν υπολογιστή. CAPTCHAs χρησιμοποιούνται από πολλούς δικτυακούς τόπους για να αποτραπεί η κατάχρηση από "bots," ή αυτοματοποιημένα προγράμματα συνήθως γραπτή να δημιουργήσει spam. Πρόγραμμα υπολογιστή δεν μπορεί να διαβάσει αλλοίωσε το κείμενο, καθώς και οι άνθρωποι μπορούν, έτσι ρομπότ δεν μπορεί να πλοηγηθεί τοποθεσίες που προστατεύονται από CAPTCHAs.
Περίπου 200 εκατομμύρια CAPTCHAs επιλυθούν από τους ανθρώπους σε όλο τον κόσμο κάθε μέρα. Σε κάθε περίπτωση, είναι δαπανώνται περίπου δέκα δευτερόλεπτα από τον χρόνο του ανθρώπου. Χωριστά, ότι δεν είναι πολύ χρόνο, αλλά συνολικά αυτές λίγο παζλ καταναλώνουν περισσότερα από 150.000 ώρες εργασίας κάθε ημέρα. Τι εάν θα μπορούσαμε να κάνουμε θετικές χρήση αυτής της ανθρώπινης προσπάθειας; reCAPTCHA κάνει ακριβώς αυτό αντλώντας από την προσπάθεια επίλυσης δαπανώνται CAPTCHAs σε απευθείας σύνδεση "ανάγνωση" βιβλία.
Σε μια προσπάθεια να αρχείο ανθρώπινη γνώση ψηφιακά αρχείο υλικά, πολλά έργα ψηφιοποίησης είναι σήμερα φυσική βιβλία που γράφτηκαν πριν από την ηλικία του υπολογιστή. Οι σελίδες Το βιβλίο σαρωμένη εικόνες, και στη συνέχεια μετατρέπονται σε κείμενο με "οπτική αναγνώριση χαρακτήρων (OCR). Αν και οι εικόνες είναι αναγνώσιμη από τον άνθρωπο, το κείμενο δεν είναι η αναζήτηση και δεν είναι δυνατόν να αναπροσαρμόζονται, επίσης, μέγεθος αρχείου είναι σε κίνδυνο, όπως οι εικόνες είναι πολύ μεγαλύτερες και πιο δύσκολο για την αποθήκευση.
reCAPTCHA βελτιώνει τη διαδικασία της ψηφιοποίησης βιβλίων από την αποστολή λέξεις που δεν μπορούν να διαβαστούν από τους υπολογιστές στο Web με τη μορφή CAPTCHAs για τους ανθρώπους να αποκρυπτογραφήσει. Πιο συγκεκριμένα, κάθε λέξη που δεν μπορεί να διαβάσει σωστά από OCR τοποθετείται σε μια εικόνα και χρησιμοποιείται ως καπετάνιος. Αυτό είναι δυνατό επειδή τα περισσότερα προγράμματα OCR σας ειδοποιεί όταν μια λέξη δεν μπορεί να διαβάσει σωστά.
Ήμουν που πωλήθηκαν από το σημείο αυτό και θεώρησε απολύτως μυθιστόρημα και twee, αλλά δεν θα μπορούσε να βοηθήσει, αλλά αναρωτιέμαι πώς ξέρουν τι είμαστε εισέρχονται είναι σωστή. Το τέχνασμα είναι, μία από τις λέξεις είναι μια λέξη ελέγχου, ήδη γνωστό και εκ προθέσεως seeded πίσω και συνήθως από την ίδια πηγή, όπως η δεύτερη λέξη, το πρόγραμμα υποθέτει ότι έχετε εισάγει σωστά και αποθηκεύει τη λέξη μετά από αρκετά άτομα εισήλθαν στην ίδια λέξη με τον ίδιο τρόπο και υποθέτει ότι είναι σωστό με μεγαλύτερη εμπιστοσύνη.
Το μόνο μειονέκτημα σε αυτό το έργο είναι ότι επί του παρόντος, από όπου και αν ψηφιοποίησης παλαιών εκδόσεις των New York Times, η οποία δεν είναι από πολύ επωφελής για την ανθρωπότητα στο σύνολό της IMHO, αλλά αυτή είναι η ζωή. Εάν είστε πραγματικά βαριεστημένοι, μπορείτε να κάνετε κλικ εδώ για να απαντήσει reCAPTCHA ακριβώς να συμβάλει στο έργο.
Περισσότερα από von Ahn
Matchin »είναι μια συγκαλυμμένη πείραμα στην τεχνητή νοημοσύνη. Κάθε φορά παίκτες συμφωνήσουν σε μια εικόνα, είναι ετικέτα prettier. Von Ahn, a 28-year-old καθηγητής της επιστήμης των υπολογιστών στο Carnegie Mellon, θα βάλει το παιχνίδι σε απευθείας σύνδεση αυτό το καλοκαίρι, όπως και χιλιάδες άνθρωποι που παίζουν, βάση δεδομένων του για 100.000 φωτογραφίες θα πρέπει να εμφορείται από κάτι πεμπτουσία του ανθρώπου: μια αισθητική ευαισθησία, κωδικοποιούνται ως κατάταξη της ελκυστικότητας.
Το παιχνίδι βασικά ανθρώπους κόλπα σε υπολογιστές διδασκαλία τι συνιστά ωραιότητα. Εάν αρκετοί άνθρωποι παίζουν Matchin »- και τα προηγούμενα παιχνίδια von Ahn που έχουν κερδίσει εκατομμύρια play-ώρες - θα μπορούσε ποσοστό τελικά την προσφυγή της κάθε εικόνας στο Διαδίκτυο. Το Google θα μπορούσε να ενσωματώσει τις ειδικότητες σε μηχανή αναζήτησης του, ώστε να μπορείτε να έρευνα ειδικά για "όμορφες" φωτογραφίες των σπιτιών, οι άνθρωποι, ή τοπία.
«Οι άνθρωποι είναι καλοί στο υπολογισμό τι είναι ελκυστική, καθώς και υπολογιστές είναι καλοί στο να γρήγορα την αναζήτηση και την εξεύρεση," λέει ο von Ahn. "Μπορείτε να τεθούν από κοινού, και bang!"
Αυτό είναι "ανθρώπινο υπολογισμού,« η τέχνη της χρήσης μαζικών ομάδες των δικτυωμένων ανθρώπινο μυαλό για την επίλυση προβλημάτων τα οποία οι υπολογιστές δεν μπορούν. Ζητήστε μια μηχανή για να δείχνουν μια εικόνα από ένα πουλί ή να ξεχωρίσω μια συγκεκριμένη φωνή σε ένα πλήθος, και συνήθως αποτυγχάνει. Αλλά ακόμη και το πιο αμυδρό-έχων πνεύμα του ανθρώπου μπορεί να κάνει αυτό εύκολα. Von Ahn έχει συνειδητοποιήσει ότι η κανονική εικόνα που έχουμε για τη σχέση ανθρώπου-υπολογιστή μπορεί να αναστραφεί. Οι περισσότεροι από εμάς να αναλάβει υπολογιστές κάνει τους ανθρώπους πιο έξυπνοι. Βλέπει ανθρώπους ως ένας τρόπος για να κάνει τους υπολογιστές πιο έξυπνοι.
Οι πιθανότητες που έχετε ήδη επωφεληθεί από την εργασία von Ahn του. Όπως όταν πληκτρολογείτε σε μια από αυτές τεντωμένο και λοξή λόγια, πριν πάρει την πρόσβαση σε ένα λογαριασμό email Yahoo ή το κατάστημα Ticketmaster. Αυτός είναι ένας καπετάνιος, που von Ahn αναπτύχθηκε το 2000 για να ματαιώσει κακόβουλη χρήση. Ή υπάρχει εικόνα von Ahn-επισήμανση για τα παιχνίδια, τα οποία παρασύρονται χιλιάδες βαριεστημένοι surfers Ιστού σε ετικέτες 300.000 φωτογραφίες απευθείας σύνδεση - το κάνουμε τόσο αποτελεσματικά ότι η Google αγόρασε την ιδέα του περασμένου έτους για τη βελτίωση της εικόνας της μηχανής αναζήτησης.
Παραπάνω απόσπασμα από το περιοδικό Wired (16,07) Για ορισμένα καθήκοντα, το Cortex Beats Ακόμα η CPU του Clive Thompson
Κατηγορίες: γενικά, ειδήσεις, τεχνολογία
Ετικέτες: ψηφιοποίηση, ειδήσεις, φωτογραφία, τεχνολογία
Σχόλια: Δεν Σχόλια.


























