OCR

OCR, testuak editatzeko sistema

OCR Optical Character Recognition edo Karaktereen Ezagutza Optikoa formatu digitala —dokumentu eskaneatu edo argazkiak— eskuz edo makinaz idatzia dagoen testuen ezagutzarako teknika multzo bat da. OCR erabiliz gero, irudi soila dena ordenagailuak uler dezakeen testuan bilakatzen da gero editatu ahal izateko.

Teknika hori irudietan dauden karaktereak banan-banan antzematean datza: isolatutako karaktere bakoitzaren forma, lerro eta kurben arabera zein karaktere izan daitekeen igartzen saiatzen da OCR sistema. Hitz bat irakurtzen denean, hiztegiak ere kontsulta daitezke, irakurritako hitza existitzen den baieztatzeko eta, horrelakorik ez badago, antzekoa izan daitekeen bat proposatzeko.

Sistema horiek izan dezaketen arrakasta, neurri handi batean, jatorrizko irudiaren ezaugarrietan dago: irudiaren bereizmena, alfabeto mota (latinoak, kanji, zirilikoak) eta, gehienbat, eskuizkribu edo makinaz idatzitako testua.

Alfabeto latinoz mekanografiatutako testu baten irudiaren igarpenean doitasun handia lortzen da; eskuizkribuetan, berriz, oso bestelakoak dira lortutakoaren kalitate mailak. Pertsona bakoitzak eskuz ezberdin idazten dugunez, OCR aplikazioek gure idazkera ikasteko ahalegina egiten dute, eta, horretarako, sare neuronalak esaten zaien modelo konputazionalak erabiltzen dira.

Eskuizkribua ‘on line’ igartzen

Orain arte, jada idatzitako dokumentuetatik testua xurgatzeko teknikak izan ditugu hizpide, off line modua hain zuzen, baina bada eskuizkribua atzemateko on line modua ere. Gailu bat erabilita, idaztean egindako mugimenduak gordetzen dira, eta mugimendu horiek aztertuz, idatzitako karaktereak igartzen saiatzen dira OCR sistemak. Horrelako sistemetan, hiru osagai aurki ditzakegu: erabiltzaileak idazteko erabiltzen duen arkatz moduko gailua, arkatzaren posizioa irakurtzen duen gailua —arkatzean bertan egon daiteke, arkatzetik gertu, edo tableta modukoa ere izan daiteke— eta sistemaren hirugarren pieza software aplikazio bat litzateke. Software aplikazioak arkatzak egindako mugimenduak aztertzen ditu, eta emaitza testu digital bat izaten da.

OCR softwarea

Software komertzial ugari dago merkatuan, eta, gehienetan, nahiko software garestiak dira. Macintoshen sistema eragileetan, arkatz digitalarekin batera, Inkwell erabiltzen da. Linux motako sistemetan, CellWriter erabil daiteke.

CellWriter

Ubuntu sistema eragileak bere pakete biltegietan eskaintzen du aplikazio hau, beraz, erraz instalatu daiteke: Synaptic pakete kudeatzailerekin edo kontsola bidez, apt-get komandoarekin. Aplikazioa lehen aldiz abiarazten dugunean, entrenamendu leihoa eskainiko digu aplikazioak. Bertan, hizki ezberdinak idatzi beharko ditugu, sistemak guk nola idazten dugun ikas dezan. Sistemaren entrenamendu hori funtsezkoa da gero iragarpen zuzenak egin ahal izateko.

Entrenamendua amaituta, aplikazioak sareta bat eskaintzen du. Saretaren gelaxka bakoitzean hizki bat idatzi beharko dugu, eta lerro bakoitza amaituta, CellWriter aplikazioak, guk idatzitakoa igarri eta CellWriter leihoaren azpian dagoen aplikazioari bidaliko dio testua —testu prozesagailu edo beste motako aplikazio bat—. Erabiltzaileak idatzitakoak gaizki ulertzen direnean, sistemak zuzenketak egiteko aukera eskaintzen du, eta, horrela, gehiago erabili ahala, emaitza hobeak lortzen dira. Esaterik ez dago, erabiltzaile batek entrenatutako sistemak ez duela beste erabiltzaile batentzat balio.

OCR softwarea, ‘on line’

On line moduan, mahai gaineko softwarearekin gertatzen den bezala, hainbat software komertzial dago. Guk makinaz idatzitako testuak irakurtzeko doako web aplikazio bat aipatuko dugu hemen: Google Docs (https://docs.google.com). Zerbitzu horretan dokumentuak jartzean, OCR sistema aktiba daiteke. PNG, GIF, JPG edo PDF moduko fitxategietan, Google Docsek testu-araketa burutzen du, eta jarritako fitxategiak gutxieneko bereizmena izanez gero, nahiko emaitza onak lortzen dira; hori bai, betiere makinaz idatzitako testuetan.

OCR hardwarea

Arkatz digitalek eskuz idatzitakoa ordenagailura pasatzeko modu erakargarria eskaintzen dute. Gehienetan, arkatz moduko gailuarekin batera, orriaren bazterrean jar daitekeen irakurle txiki baten beharra dago. Irakurle horrek arkatzaren mugimenduak gordetzen ditu. Irakurletik jasotako datuak baliatzen ditu software batek guk idatzitakoa testu bilakatzeko. Ordenagailura ere konektatu daiteke arkatza, idatzi ahala emaitza pantailan ikus ahal izateko. Gailu horiek nola funtzionatzen duten ikusteko, adibide gisa, Staedtler etxearen Digital Pen produktuaren orrian sartu eta bertako bideoa ikus daiteke.