Internet

‘Captcha’, makinak eta erabiltzaileak bereizteko

ordenagailuetan erabiltzen den galdera-erantzun sistema bat da captcha, erantzulea pertsona bat dela ziurtatzeko. Prozesuan, ordenagailu batek eta erabiltzaile batek hartzen dute parte. Ordenagailuak galdera botatzen dio erabiltzaileari; printzipioz, makina batek ondo erantzun ezingo duen galdera. Erabiltzaileak galdera ondo erantzuten badu, pertsona dela ondorioztatuko du. Captcha sistema erabilienean, ordenagailuak modu desitxuratuan erakusten dizkion hizki batzuk asmatu behar ditu erabiltzaileak.
Captcha irudi bat
2000. urtean eman zuen ezagutzera captcha akronimoa Luis Von Ahn guatemalarrak Carnegie Mellon unibertsitate estatubatuarrean.

Sistema horren helburuak bi dira: bata, pertsonentzat erantzuten errazak diren galderak sortzea, eta bestea, software batek datu orriak automatikoki betetzea eragoztea.

Erabilerak

Captcha-k software aplikazio batek automatikoki datu orriak betetzea saihesteko erabiltzen dira. Adibidez, webgune batek inkesta bat plazaratzen badu eta ez bada inongo eragozpenik jartzen, aplikazio informatiko batek automatikoki inkesta bete eta bere erantzunak bidal ditzake, inkestaren emaitza aldatze aldera. Sarreren salmenta sistema batean ere, norbaitek sortutako aplikazio batek hainbat sarrera erosteari ekin diezaioke, edo enkante batean aplikazio batek saltzailearen alde egin dezake, automatikoki azken eskaintza gaindituko duen eskaintza berri bat sortuz. Ohikoak izaten dira ere blog eta foroetan mezu komertzialak publikatzeko egiten diren saioak. Spam gisa ezagutzen diren mezu horiek software automatiko batek sortzen ditu, eta, bere ekinean, ahal den blog edo foro gehienetan bere mezuak txertatzen saiatzen da aplikazio informatiko hori.

Adibide horiek guztiek webgune batek eskaintzen duen datu orriak beteko dituen software baten esku sartzea eskatzen dute. Datu orri horiek captcha sistemarekin babestuko balira, software automatiko horiek ez lirateke gauza izango datu orriak bere osotasunean ondo betetzeko, eta euren ahalegina alferrikakoa izango litzateke.

Recaptcha

Recaptcha enpresa ere Carnegie Mellon unibertsitatean sortu zen, eta ondoren, 2009. urtean, Google enpresa ezagunak erosi zuen. Recaptcha sistemak, captcha sistemak bezala, datu orriak automatikoki beteko dituen makina zokoratzea du helburu, eta, horretarako, testu bat erakusten duten irudi digital parea eskaintzen du datu orrietan. Sistemak erakusten dituen testu digitalizatu horiek, ordea, ez dira ausaz sortzen, artxibo jakin batzuetatik hartzen dira. The New York Times eta Google Books-en digitalizatutako artxiboak dira sistema horren iturri. Sistema hori erabiltzen den webguneetan, irudi bihurtutako (digitalizatutako) bi testu eskaintzen zaizkio erabiltzaileari. Testuetako bat zein den argi du ere captcha sistemak, baina bigarrenarekin zalantzak ditu: digitalizatzeko erabili den OCR sistemak ez baitu konfiantza handiko emaitzarik lortu. Testu idatziak digitalizatzean askotan ez dira hitz guztiak ondo igartzen, tinta galdua dutelako, edo tolesdurak hitzak desitxuratzen dituelako. Erabiltzaileak datu orria betetzean, recaptcha sistemak ezagutzen duen hitzerako erantzun ona ematen badu, sistemak pentsatzen du bigarren hitz horrentzat eman den erantzuna ere ona dela. Hainbat erabiltzailek erantzuten duten captcha-tan, bigarren hitz horrentzat erantzun berbera ematen badute, sistemak ziurtzat ematen du irudia besterik ez den testu horri dagokion hitza.

Horrela, erabiltzaileak, makinak bete ezin duen lan bat betetzen du, testu baten eskaneatze eta antzematea, hau da, OCR lana. Sistema hori kudeatzen duen enpresak dioenez, 200 milioi captcha betetzen dira egunero, eta hainbat lekutan erabiltzen da: Ticketmaster, Facebook, Twitter eta beste 350 mila sistematan.