Nytt forslag vil stoppe nettsidespam

Såkalt CAPTCHA-teknologi har du garantert vært borti, dersom du har registrert deg på ulike nettsider. CAPTCHA står for "Completely Automated Public Turing test to tell Computers and Humans Apart," og viser frem et bilde med tekst på.

Bildet er noe forvrengt, slik at det skal være vanskelig for datamaskiner å lese, men likevel er lett leselig for et menneske. Bare ved å skrive inn rett ord fra dette bildet, vil nettsiden tro på at du er et menneske.

reCAPTCHA vil ta ord fra sidene i en bok som skal digitaliseres, og bruke det du skriver til å senere digitalisere ordet. Grunnen er at dagens OCR-teknologi fremdeles er mye dårligere enn et menneske på å tolke bokstaver i et bilde.

Nærmere bestemt presenterer reCAPTCHA to ord i bildet; hvorav et av ordene er kjent for systemet, og det andre ordet ikke har vært tolket før. Om du skriver det kjente ordet rett, antar systemet at du er et menneske, mens det andre ordet markeres med din tolkning.

Når flere personer har tolket det samme ordet på samme måte, kan ordet brukes i en ny reCAPTCHA, og legges inn i digitaliseringsprosjektet.

reCAPTCHA bruker innskanninger fra Internet Archive, og håper å gjøre et solid bidrag til digitaliseringsprosjektet. Ifølge forfatterenes beregninger løses rundt 60 millioner CAPTCHA-bilder hver dag, eller tilsammen 150 000 timeverk (tilsvarende 19 årsverk).

Du kan prøve en fungerende versjon på reCAPTCHA.net. Det er allerede mulig for utviklere å integrere prosjektet med egenutviklede sider, og kodeeksempler finnes for Mediawiki, WordPress og phpBB.

Norges beste mobilabonnement

Mai 2017

Kåret av Tek-redaksjonen

Jeg bruker lite data:

Ice Mobil 1 GB


Jeg bruker middels mye data:

Chili Medium 5 GB


Jeg bruker mye data:

Chili Large 10 GB


Jeg er superbruker:

Chili X-Large 30 GB


Finn billigste abonnement i vår mobilkalkulator

Forsiden akkurat nå

Til toppen