E-Learning

Babelium proiektua, SLUN’11 konferentzian

Berriki SLUN’11 konferentzia egin dute Donostian. Unibertsitate arloan Software Librea erabiltzen dutenak bildu dira, hainbat hitzaldi entzun eta informazioa partekatzeko. Babelium proiektua da aurten present egon den proiektuetako bat.

Euskal Herriko Unibertsitatean garatutako web aplikazio bat da, eta ahozkotasuna landu eta praktikatzea du xede. Aplikazioaren erabilpena doakoa da, eta Software Librean oinarritutako lizentziapean eskaintzen da.

Gure ordenagailuen webcam eta mikrofonoa baliatuz, hainbat ariketa presta daitezke, betiere hizkuntzak ikasteko tenorean. Ahozkotasuna lantzea du helburu.

Irakasleak galdera-erantzun moduko ariketak presta ditzake bideo batean, eta ikasleak, bideoa ikusten ari den bitartean, erantzunak emango ditu.

Erantzun horiek bideoan eta mikrofonoz graba daitezke, gero irakasleak bakarrik zuzendu ditzan. Edo, nahi izanez gero, zuzenketak beste ikasleekin elkarlanean ere egin daitezke.

OCR

OCR, testuak editatzeko sistema

OCR Optical Character Recognition edo Karaktereen Ezagutza Optikoa formatu digitala —dokumentu eskaneatu edo argazkiak— eskuz edo makinaz idatzia dagoen testuen ezagutzarako teknika multzo bat da. OCR erabiliz gero, irudi soila dena ordenagailuak uler dezakeen testuan bilakatzen da gero editatu ahal izateko.

Teknika hori irudietan dauden karaktereak banan-banan antzematean datza: isolatutako karaktere bakoitzaren forma, lerro eta kurben arabera zein karaktere izan daitekeen igartzen saiatzen da OCR sistema. Hitz bat irakurtzen denean, hiztegiak ere kontsulta daitezke, irakurritako hitza existitzen den baieztatzeko eta, horrelakorik ez badago, antzekoa izan daitekeen bat proposatzeko.

Sistema horiek izan dezaketen arrakasta, neurri handi batean, jatorrizko irudiaren ezaugarrietan dago: irudiaren bereizmena, alfabeto mota (latinoak, kanji, zirilikoak) eta, gehienbat, eskuizkribu edo makinaz idatzitako testua.

Alfabeto latinoz mekanografiatutako testu baten irudiaren igarpenean doitasun handia lortzen da; eskuizkribuetan, berriz, oso bestelakoak dira lortutakoaren kalitate mailak. Pertsona bakoitzak eskuz ezberdin idazten dugunez, OCR aplikazioek gure idazkera ikasteko ahalegina egiten dute, eta, horretarako, sare neuronalak esaten zaien modelo konputazionalak erabiltzen dira.

Eskuizkribua ‘on line’ igartzen

Orain arte, jada idatzitako dokumentuetatik testua xurgatzeko teknikak izan ditugu hizpide, off line modua hain zuzen, baina bada eskuizkribua atzemateko on line modua ere. Gailu bat erabilita, idaztean egindako mugimenduak gordetzen dira, eta mugimendu horiek aztertuz, idatzitako karaktereak igartzen saiatzen dira OCR sistemak. Horrelako sistemetan, hiru osagai aurki ditzakegu: erabiltzaileak idazteko erabiltzen duen arkatz moduko gailua, arkatzaren posizioa irakurtzen duen gailua —arkatzean bertan egon daiteke, arkatzetik gertu, edo tableta modukoa ere izan daiteke— eta sistemaren hirugarren pieza software aplikazio bat litzateke. Software aplikazioak arkatzak egindako mugimenduak aztertzen ditu, eta emaitza testu digital bat izaten da.

OCR softwarea

Software komertzial ugari dago merkatuan, eta, gehienetan, nahiko software garestiak dira. Macintoshen sistema eragileetan, arkatz digitalarekin batera, Inkwell erabiltzen da. Linux motako sistemetan, CellWriter erabil daiteke.

CellWriter

Ubuntu sistema eragileak bere pakete biltegietan eskaintzen du aplikazio hau, beraz, erraz instalatu daiteke: Synaptic pakete kudeatzailerekin edo kontsola bidez, apt-get komandoarekin. Aplikazioa lehen aldiz abiarazten dugunean, entrenamendu leihoa eskainiko digu aplikazioak. Bertan, hizki ezberdinak idatzi beharko ditugu, sistemak guk nola idazten dugun ikas dezan. Sistemaren entrenamendu hori funtsezkoa da gero iragarpen zuzenak egin ahal izateko.

Entrenamendua amaituta, aplikazioak sareta bat eskaintzen du. Saretaren gelaxka bakoitzean hizki bat idatzi beharko dugu, eta lerro bakoitza amaituta, CellWriter aplikazioak, guk idatzitakoa igarri eta CellWriter leihoaren azpian dagoen aplikazioari bidaliko dio testua —testu prozesagailu edo beste motako aplikazio bat—. Erabiltzaileak idatzitakoak gaizki ulertzen direnean, sistemak zuzenketak egiteko aukera eskaintzen du, eta, horrela, gehiago erabili ahala, emaitza hobeak lortzen dira. Esaterik ez dago, erabiltzaile batek entrenatutako sistemak ez duela beste erabiltzaile batentzat balio.

OCR softwarea, ‘on line’

On line moduan, mahai gaineko softwarearekin gertatzen den bezala, hainbat software komertzial dago. Guk makinaz idatzitako testuak irakurtzeko doako web aplikazio bat aipatuko dugu hemen: Google Docs (https://docs.google.com). Zerbitzu horretan dokumentuak jartzean, OCR sistema aktiba daiteke. PNG, GIF, JPG edo PDF moduko fitxategietan, Google Docsek testu-araketa burutzen du, eta jarritako fitxategiak gutxieneko bereizmena izanez gero, nahiko emaitza onak lortzen dira; hori bai, betiere makinaz idatzitako testuetan.

OCR hardwarea

Arkatz digitalek eskuz idatzitakoa ordenagailura pasatzeko modu erakargarria eskaintzen dute. Gehienetan, arkatz moduko gailuarekin batera, orriaren bazterrean jar daitekeen irakurle txiki baten beharra dago. Irakurle horrek arkatzaren mugimenduak gordetzen ditu. Irakurletik jasotako datuak baliatzen ditu software batek guk idatzitakoa testu bilakatzeko. Ordenagailura ere konektatu daiteke arkatza, idatzi ahala emaitza pantailan ikus ahal izateko. Gailu horiek nola funtzionatzen duten ikusteko, adibide gisa, Staedtler etxearen Digital Pen produktuaren orrian sartu eta bertako bideoa ikus daiteke.

Aplikazioak, Software Librea

MyPaint 1.0.0 kalean dago

mypaintMyPaint taula grafikoarekin marrazteko aplikazio bat da. Software librea eta doakoa da, gainera Mac Os X, MS Windows zein GNU/Linux plataformetarako eskaintzen da. Nahiz eta bertsio berria oraindik MS Windows sistemetarako baino ez dagoen. Proiektu hau 2005. urtean abiatu zen eta bere xedea taula grafikoarekin marraztu ahal izateko aplikazio libre bat eskaintzea zen, diseinu minimalista batekin eta arkatzaren presioa antzemateko modukoa.

Erabilerraztasunari begira, funtzionalitate bakoitza laster-tekla batekin lotuta dago eta edozein unetan alde baliabide barrak ezkutatzeko aukera dago.

MyPaint-ek Open Raster formatuan gordetzen ditu egindako lanak. Formatu hau irekia da eta Open Document formatuan oinarrituta dago. Gainera, lanak PNG eta JPG formatuetara esportatu daitezke.

Bertsio berriak baliabide barra desplegagarri berri bat ekartzen du, baliabide barra hau pertsonalizatu daiteke widgetsen bitartez. Honez gain, ohar blokaren antzeko baliabide bat ekartzen du, non testuaz gain, kolore probak, pintzelkadak edo miniaturak gorde daitezkeen.

Deskargatzeko edo aplikazioari buruzko informazio gehiago begiratzeko, proiektuaren webgunera jo daiteke: http://mypaint.intilinux.com/