Gaur egun ezagutzen dugun Internet 1990. urte inguruan jaio zen Suitzan dagoen CERN laborategian. Sir Tim Bernes-Lee ikertzaileak eta haren lantaldeak web orriak sortzeko erabiltzen den HTML etiketa lengoaia asmatu zuten, baita gure nabigatzaileek zerbitzariei eskakizunak eta erantzunak bidaltzeko erabiltzen duten protokoloa ere, HTTP protokoloa, hain zuzen.
HTML etiketa erabiltzen da hizkuntza testu baten estruktura, bertan dauden elementuen itxura eta beste testu batzuekin duen harremana (loturak) adierazteko. Etiketak aplikatzeko modua sinplea da: itxuratu nahi den testu zatia inguratuz, hasiera (<etiketa>) eta amaiera (</etiketa>) markak erabiliz. Testu baten atal bat letra etzanean edo letra lodian erakutsi nahi badugu, horretarako propio sortutako etiketak erabili beharko ditugu, esaterako, <em> eta <strong>. Adibiderako balio dezakeen testu bat horrela geratuko litzateke: <em>etzanean</em> eta <strong>lodian</strong> erakutsiko da.
HTML lengoaiak proposatzen dituen etiketa gehienek, ordea, ezer gutxi adierazten dute testuaren edukiari buruz. Gure nabigatzaileek web orriak itxura egokian erakusteko pentsatutako etiketa multzoa da HTML hizkuntza, eta ez edukien esanahia deskribatzeko hizkuntza bat. Etiketa horiek ez dute balio, esaterako, web orri batek gertakizun, batzar edo auto baten berri ematen duen adierazteko.
Hori horrela bada, nola lortzen dute google, yahoo, bing, elebila eta horrelako web orri bilatzaileek gure galderei erantzutea? Bilatzaile horiek guztiak, web orriak arakatzen eta irakurtzen dituzten robotak erabiltzen dituzte, eta bot deritze — Googleren arakatzaile edo bot-a googlebot da, eta Microsoftena, berriz, msnbot —. Arakatzaile horiek web orri batean dauden hitz guztiak banan-banan irakurri eta indexatzen dituzte, eta, horrela, gure bilatzaileari bizikleta eskatzen badiogu, arakatzaileak hitz horrentzat bere indizeetan dituen web orriak eskainiko dizkigu. Dokumentu edo orri batean bizikleta hitza maiztasun handiarekin agertzen bada, eta beste orri askotatik bertara joateko loturak badaude, orri hori, bilatzaileak eskaintzen duen emaitza zerrendan, goialdean agertuko da. Lehen postuan agertzeko lehia bizia egoten da, eta hainbat enpresak eskaintzen dute SEO (Search Engine Optimization) zerbitzua, hau da, webgune bat arakatzaileentzat gustagarriago egiten eta ondorioz bilaketetan postu onetan agertzea eskaintzen duen zerbitzua.
Web arakatzaile eta bilatzaileek nola lan egiten duten jakinda, erraz uler daiteke zergatik bilatzaileek batzuetan ez duten ondo ulertzen guk galdetutakoa. Eibar bizikleta testua bilatzen badugu, Eibarren antolatutako bizikleta lasterketa baten berri edo Eibarren salgai dagoen bizikleta bat erakutsiko dit bilatzaileak. Eta horren guztiaren arrazoia, lehen aipatu bezala, bilatzaileek ezin dutela web orrien semantika arakatu.
HTML hizkuntzak dituen muga horiek gainditu eta bot horiei lanak errazteko, Internet gidatzen duen W3C kontsortzioan web semantikoaren alorrean lanean dabil Tim Bernes-Lee bera. Hasierako akatsak zuzentze aldera, web orri baten edukia zein den azaltzeko balioko duen teknologia eta etiketa multzoa garatzen ari dira. Etiketa berri batzuen bidez, posible izango da rock talde baten berri ematen den orri batean, talde horren fitxa moduko bat txertatzea. Fitxa horretan, taldearen izena, sortze data, jotzen duen musika estiloa, jatorria edo musikariak nortzuk diren zehaztu ahal izango da. Arakatzaileak horrelako informazioa irakurtzeko gai direnean, posible izango da horrelako zerbait galdetzea: esan iezadazu zein musika talde sortu den Altsasun 2000. eta 2005. urteen artean. Bizikleta bat erosi nahi badugu, web bilaketa bat eginda, hainbat dendatan eskaintzen den prezioaren berri izatea ere errazago izanen da, eta salneurri edo dendarekiko hurbiltasunaren arabera ordenatu ahal izango dira emaitzak.
Oraingoz, Web 3.0 izena ere baduen horretaz gozatzeko apur bat itxoin beharko dugu, baina badirudi etorkizuna web semantikora begira dagoela.