Internet

‘Captcha’, makinak eta erabiltzaileak bereizteko

ordenagailuetan erabiltzen den galdera-erantzun sistema bat da captcha, erantzulea pertsona bat dela ziurtatzeko. Prozesuan, ordenagailu batek eta erabiltzaile batek hartzen dute parte. Ordenagailuak galdera botatzen dio erabiltzaileari; printzipioz, makina batek ondo erantzun ezingo duen galdera. Erabiltzaileak galdera ondo erantzuten badu, pertsona dela ondorioztatuko du. Captcha sistema erabilienean, ordenagailuak modu desitxuratuan erakusten dizkion hizki batzuk asmatu behar ditu erabiltzaileak.
Captcha irudi bat
2000. urtean eman zuen ezagutzera captcha akronimoa Luis Von Ahn guatemalarrak Carnegie Mellon unibertsitate estatubatuarrean.

Sistema horren helburuak bi dira: bata, pertsonentzat erantzuten errazak diren galderak sortzea, eta bestea, software batek datu orriak automatikoki betetzea eragoztea.

Erabilerak

Captcha-k software aplikazio batek automatikoki datu orriak betetzea saihesteko erabiltzen dira. Adibidez, webgune batek inkesta bat plazaratzen badu eta ez bada inongo eragozpenik jartzen, aplikazio informatiko batek automatikoki inkesta bete eta bere erantzunak bidal ditzake, inkestaren emaitza aldatze aldera. Sarreren salmenta sistema batean ere, norbaitek sortutako aplikazio batek hainbat sarrera erosteari ekin diezaioke, edo enkante batean aplikazio batek saltzailearen alde egin dezake, automatikoki azken eskaintza gaindituko duen eskaintza berri bat sortuz. Ohikoak izaten dira ere blog eta foroetan mezu komertzialak publikatzeko egiten diren saioak. Spam gisa ezagutzen diren mezu horiek software automatiko batek sortzen ditu, eta, bere ekinean, ahal den blog edo foro gehienetan bere mezuak txertatzen saiatzen da aplikazio informatiko hori.

Adibide horiek guztiek webgune batek eskaintzen duen datu orriak beteko dituen software baten esku sartzea eskatzen dute. Datu orri horiek captcha sistemarekin babestuko balira, software automatiko horiek ez lirateke gauza izango datu orriak bere osotasunean ondo betetzeko, eta euren ahalegina alferrikakoa izango litzateke.

Recaptcha

Recaptcha enpresa ere Carnegie Mellon unibertsitatean sortu zen, eta ondoren, 2009. urtean, Google enpresa ezagunak erosi zuen. Recaptcha sistemak, captcha sistemak bezala, datu orriak automatikoki beteko dituen makina zokoratzea du helburu, eta, horretarako, testu bat erakusten duten irudi digital parea eskaintzen du datu orrietan. Sistemak erakusten dituen testu digitalizatu horiek, ordea, ez dira ausaz sortzen, artxibo jakin batzuetatik hartzen dira. The New York Times eta Google Books-en digitalizatutako artxiboak dira sistema horren iturri. Sistema hori erabiltzen den webguneetan, irudi bihurtutako (digitalizatutako) bi testu eskaintzen zaizkio erabiltzaileari. Testuetako bat zein den argi du ere captcha sistemak, baina bigarrenarekin zalantzak ditu: digitalizatzeko erabili den OCR sistemak ez baitu konfiantza handiko emaitzarik lortu. Testu idatziak digitalizatzean askotan ez dira hitz guztiak ondo igartzen, tinta galdua dutelako, edo tolesdurak hitzak desitxuratzen dituelako. Erabiltzaileak datu orria betetzean, recaptcha sistemak ezagutzen duen hitzerako erantzun ona ematen badu, sistemak pentsatzen du bigarren hitz horrentzat eman den erantzuna ere ona dela. Hainbat erabiltzailek erantzuten duten captcha-tan, bigarren hitz horrentzat erantzun berbera ematen badute, sistemak ziurtzat ematen du irudia besterik ez den testu horri dagokion hitza.

Horrela, erabiltzaileak, makinak bete ezin duen lan bat betetzen du, testu baten eskaneatze eta antzematea, hau da, OCR lana. Sistema hori kudeatzen duen enpresak dioenez, 200 milioi captcha betetzen dira egunero, eta hainbat lekutan erabiltzen da: Ticketmaster, Facebook, Twitter eta beste 350 mila sistematan.

Amazon, Apple, Bilatzaileak, ebook, Google, Internet, Microsoft, Nabigatzaileak, Sare sozialak eta Microblogging, Sareak, Software Librea

Tableta, 2011. urteko izar

Tableten urtea izan da, ezbairik gabe, 2011. urtea. Applek sortutako iPad izan zen produktu horren aitzindaria, eta, Appleren atzetik, hainbat enpresak merkatu eskaintza zabala osatu dute horrelako gailuekin. Appleren iPadarekin batera, Android sistema eragilea da tableten munduko bigarren jokalari garrantzitsuena; 2011. urtearen amaieran, Ice Cream Sandwich izenarekin bataiatu duten azken bertsioa plazaratu zen, oraindik oso gailu gutxitan aurki zitekeena. 2011. urteak iPadaren bigarren bertsioa ekarri du; aurrekoa baino meheagoa, azkarragoa eta arinagoa da, eta, salmenta aldetik, senide zaharrenak ezagutu zuen arrakasta izan du. Android sistema eragilea darabilten tabletei dagokienez, iaz, izugarrizko eskaintza zabala merkaturatu zuten enpresa teknologikoek, eta, eskaintza zabal horretan, kostu baxuko gailuak agertu dira indar handiz, 100 euroren bueltan dauden tabletak. Kostu baxuko aukeran, kasu berezia da Amazon etxeak iPadari aurre egiteko merkaturatu duen Kindle Fire delakoa; arazo tekniko batzuk dituen arren, salgai daramatzan bi hilabetetan, hainbat ale saldu ditu Amazonek.

Apple etxeak, esan bezala, arrakasta latza lortu du iPad 2arekin, baina ez da izan produktu arrakastatsu bakarra; iPhone 4S telefonoa eta MacBook Air ordenagailu eramangarriak ere erruz saldu dira.

Nabigatzaileen inguruan, Googleren Chrome hazi da gehien 2011. urtean. Azken urte hauetan Mozillaren Firefox nabigatzailea Microsoften Internet Explorerri erabiltzaileak kentzen joan bada ere, 2011. urtean, Chrome izan da Explorer eta Firefox nabigatzaileen lepo hazi dena. Nabigatzaile erabilien kuotak horrela gelditu dira, StatCounterren aburuz: %40 Internet Explorer, %27 Chrome eta 25% Firefox.

2011. urtean ere, teknologiaren munduan hainbat agurtu ditugu. Batzuk ezagunak oso, Appleren CEO izandako Steve Jobs kasu, eta beste batzuk, jendartean ezagunak izan ez arren, teknologia munduan oso garrantzitsuak izan direnak. Horietako bat da Dennis Ritchie; 1941. urtean jaio zen, eta, 70eko hamarkadan, UNIX eta C programazio lengoaiaren garapenean parte hartu zuen. 2011. urtean zendutako beste bat Betty Jean Jennings Bartik izan da, ENIAC izena zuen lehen ordenagailuaren sortzaileetako bat.

Porrotak

Teknologia enpresa ezagunenek, HTC, Samsung, LG, Sony eta abarrek, euren tabletak merkaturatu dituzte. Samsung etxeak arrakasta handia lortu du Galaxy izeneko tabletarekin, baina beste ekoizle batzuek porrot handiak jasan dituzte, HP eta RIM etxeek kasu. HP etxeak WebOS sistema eragilean oinarritutako Touchpad izeneko tableta plazaratu zuen; produktu ona, etxe ospetsua, baina salmentarik ez. Ipadaren prezio antzerakoa zuen, eta erabiltzaileek nahiago izan zuten Appleren tableta. Ondorioz, HP etxeak prezioa asko jaitsi behar izan zuen bere produktu berria saldu ahal izateko, eta, azkenean, tableten negoziotik alde egitea erabaki zuen.

BlackBerry ekoizten duen RIM etxeak ere BlackBerry PlayBook delakoa merkaturatu zuen, baina ez zuen arrakastarik izan; badirudi sistemaren eguneraketa urria eta aplikazio erakargarrien eskasia izan zela arrakasta eskasaren arrazoia.

Tableten mundutik at, teknologiaren beste alor batzuetan ere, izan dira uste baino emaitza kaskarragoak izan dituzten produktu eta zerbitzuak. Google+ da horietako bat. Kontaktuak zirkulutan biltzeko aukera ematen du sare sozial horrek ez du publiko zabalaren onarpenik izan. Googlek berean jarraitzen du, funtzionaltasun gehiago eskaintzen, jada erregistratuak dituen 50 milioi erabiltzaile horien kopurua handitu nahian.

Sarean edo hodeian eskaintzen diren zerbitzuen etenak ere kalte handiak eragin dizkiete RIM eta Sony etxeei. RIMen BlackBerry telefonoak mezularitza zerbitzuak porrot egin eta gero posta gabe izan ziren urrian. Sony etxearen PlayStation plataformak sarean jolasteko zerbitzua eten izan behar zuen bere sistemek jasan zuten eraso baten ondorioz. Agerian gelditu zen Sonyren sistemen ahulezia eta erabiltzaileek sarean gordetzen dituzten datu pribatuak egoki babestearen beharra.

Kontsolen alorrean, Nintendo etxeak betaurreko berezien beharrik gabe 3D efektua eskaintzen zuen 3DS plazaratu zuen. Plataforma horrentzat joko gutxi garatu direlako eta hainbat erabiltzailek zorabioak jasan dituztela zabaldu delako, produktu horrek arrakasta gutxi izan du.

Eta 2012rako zer?

Badirudi hasi berria den urte honek ere gailu eta zerbitzu mordoa eskainiko dituela. Gailuen munduan, bolo-bolo dabilen iPad 3 delakoaren aurkezpena espero da, eta badira Applek bere tabletaren tamaina txikitu eta 7 hazbeteko bertsio bat plazaratuko duela esaten dutenak ere. Apple etxeak ere iPhone telefono adimendunaren bosgarren bertsioa merkaturatuko du, eta, Appleren produktuen inguruan gertatu ohi denez, horrekin ere dena da filtrazio eta txutxu-mutxua.

Microsoft etxeak Windows 8 aurkezteko asmoa du 2012an, eta ezagutzera eman diren ezaugarrien artean, USB 3.0 euskarria, Ribbon interfazea eta aplikazioen denda izango duela jakin da.

Kontsolen munduan, bi dira espero diren aurkezpen ezagunenak: Nintendo etxearen Wii U eta eta Sonyren Vita.

Amaitzeko, Amazon etxea lanean da bere Fire tabletak dituen akatsak konpontzeko, eta gainontzeko tablet ekoizleek bezala, badirudi bere produktuaren bertsio berriren bat kaleratuko duela.

Internet, kontzeptuak, web semantikoa

Web Semantikoa

Gaur egun ezagutzen dugun Internet 1990. urte inguruan jaio zen Suitzan dagoen CERN laborategian. Sir Tim Bernes-Lee ikertzaileak eta haren lantaldeak web orriak sortzeko erabiltzen den HTML etiketa lengoaia asmatu zuten, baita gure nabigatzaileek zerbitzariei eskakizunak eta erantzunak bidaltzeko erabiltzen duten protokoloa ere, HTTP protokoloa, hain zuzen.

HTML etiketa erabiltzen da hizkuntza testu baten estruktura, bertan dauden elementuen itxura eta beste testu batzuekin duen harremana (loturak) adierazteko. Etiketak aplikatzeko modua sinplea da: itxuratu nahi den testu zatia inguratuz, hasiera (<etiketa>) eta amaiera (</etiketa>) markak erabiliz. Testu baten atal bat letra etzanean edo letra lodian erakutsi nahi badugu, horretarako propio sortutako etiketak erabili beharko ditugu, esaterako, <em> eta <strong>. Adibiderako balio dezakeen testu bat horrela geratuko litzateke: <em>etzanean</em> eta <strong>lodian</strong> erakutsiko da.

HTML lengoaiak proposatzen dituen etiketa gehienek, ordea, ezer gutxi adierazten dute testuaren edukiari buruz. Gure nabigatzaileek web orriak itxura egokian erakusteko pentsatutako etiketa multzoa da HTML hizkuntza, eta ez edukien esanahia deskribatzeko hizkuntza bat. Etiketa horiek ez dute balio, esaterako, web orri batek gertakizun, batzar edo auto baten berri ematen duen adierazteko.

Hori horrela bada, nola lortzen dute google, yahoo, bing, elebila eta horrelako web orri bilatzaileek gure galderei erantzutea? Bilatzaile horiek guztiak, web orriak arakatzen eta irakurtzen dituzten robotak erabiltzen dituzte, eta bot deritze — Googleren arakatzaile edo bot-a googlebot da, eta Microsoftena, berriz, msnbot —. Arakatzaile horiek web orri batean dauden hitz guztiak banan-banan irakurri eta indexatzen dituzte, eta, horrela, gure bilatzaileari bizikleta eskatzen badiogu, arakatzaileak hitz horrentzat bere indizeetan dituen web orriak eskainiko dizkigu. Dokumentu edo orri batean bizikleta hitza maiztasun handiarekin agertzen bada, eta beste orri askotatik bertara joateko loturak badaude, orri hori, bilatzaileak eskaintzen duen emaitza zerrendan, goialdean agertuko da. Lehen postuan agertzeko lehia bizia egoten da, eta hainbat enpresak eskaintzen dute SEO (Search Engine Optimization) zerbitzua, hau da, webgune bat arakatzaileentzat gustagarriago egiten eta ondorioz bilaketetan postu onetan agertzea eskaintzen duen zerbitzua.

Web arakatzaile eta bilatzaileek nola lan egiten duten jakinda, erraz uler daiteke zergatik bilatzaileek batzuetan ez duten ondo ulertzen guk galdetutakoa. Eibar bizikleta testua bilatzen badugu, Eibarren antolatutako bizikleta lasterketa baten berri edo Eibarren salgai dagoen bizikleta bat erakutsiko dit bilatzaileak. Eta horren guztiaren arrazoia, lehen aipatu bezala, bilatzaileek ezin dutela web orrien semantika arakatu.

HTML hizkuntzak dituen muga horiek gainditu eta bot horiei lanak errazteko, Internet gidatzen duen W3C kontsortzioan web semantikoaren alorrean lanean dabil Tim Bernes-Lee bera. Hasierako akatsak zuzentze aldera, web orri baten edukia zein den azaltzeko balioko duen teknologia eta etiketa multzoa garatzen ari dira. Etiketa berri batzuen bidez, posible izango da rock talde baten berri ematen den orri batean, talde horren fitxa moduko bat txertatzea. Fitxa horretan, taldearen izena, sortze data, jotzen duen musika estiloa, jatorria edo musikariak nortzuk diren zehaztu ahal izango da. Arakatzaileak horrelako informazioa irakurtzeko gai direnean, posible izango da horrelako zerbait galdetzea: esan iezadazu zein musika talde sortu den Altsasun 2000. eta 2005. urteen artean. Bizikleta bat erosi nahi badugu, web bilaketa bat eginda, hainbat dendatan eskaintzen den prezioaren berri izatea ere errazago izanen da, eta salneurri edo dendarekiko hurbiltasunaren arabera ordenatu ahal izango dira emaitzak.

Oraingoz, Web 3.0 izena ere baduen horretaz gozatzeko apur bat itxoin beharko dugu, baina badirudi etorkizuna web semantikora begira dagoela.