Gudresnis tinklas
Tinklas yra milžiniškas, tačiau nelabai gudrus. Kompiuterininkai pradėjo kurti „Semantinį tinklą”, kuris supras informacijos raizginiuose slypinčią prasmę. Timas Berners-Lee, ko gero, jaučiasi lyg patekęs į laiko sūkurį. Dešimtojo dešimtmečio pradžioje jis ištisus metus bandė įtikinti žmones pajusti jo sugalvotos schemos, internetinių hipertekstų sistemos, kurią jis pavadino kerinčiu Pasaulinio raizginio – World Wide Web – vardu, galią ir žavesį. Kadangi tuomet Tinklo dar nebuvo, daugelis žmonių negalėjo įsivaizduoti apie ką jis šneka. Berners-Lee atkakliai siekė savo tikslo padedamas kelių jo vizijos patrauktų žmonių, todėl jo išradimas pasidarė greičiausiai žmonijos istorijoje besiplečiančia informacijos pateikimo terpe.
Po dešimties metų Berners-Lee kovojo su tokia pačia problema – tik šįkart jis bandė išaiškinti savo svajonę apie semantinį tinklą, jungiantį ne tik vieną su kitu dokumentus, bet ir atpažįstantį tuose dokumentuose saugomos informacijos prasmę – žmonėms paprastai visa tai sekasi gana neblogai, bet kompiuteriams tokia užduotis būna labai sunki.
Šiandieninis Internetas iš esmės tėra leidybinė terpė – vieta, kurioje galima patalpinti ir saugoti vaizdus ir tekstus. Jeigu jis būtų papildytas semantiškai, radikaliai pakistų ir jo prigimtis – iš vietos, kur informacija yra tik rodoma, jis taptų informacijos interpretavimo, apsikeitimo ir apdorojimo terpe. Semantiniai paieškos agentai sugebėtų iš įvairių šaltinių surinkti duomenis, juos apdoroti ir numanyti naujus faktus. Programoms, kurios anksčiau viena su kita buvo nesuderinamos, tarpusavyje galėtų dalintis duomenimis. Kitaip tariant, galutinis semantinio tinklo tikslas – leisti vartotojui naudotis beveik visais begaliniais Interneto resursais ir iš milijonų dabar esančių duomenų bazių salelių sukurti vieną milžinišką duomenų bazę.
Lygindamas semantinį tinklą su šiandieniniu Internetu, Berners-Lee siūlo tokį scenarijų:
Įsivaizduokime, kad registruojamės dalyvauti internetinėje konferencijoje. Konferencijos tinklapyje nurodytas renginio laikas, vieta, informacija apie artimiausią oro uostą ir viešbutį, kur taikomos nuolaidos konferencijos dalyviams. Iš pradžių atsiversime šiandieninio tinklo kalendorių ir pasitikrinsime, ar tuo metu neturime kitų įsipareigojimų, o vėliau užsisakysime lėktuvo bilietus ir viešbutį, skambindami telefonu arba aplankydami atitinkamus tinklapius.
„Neįmanoma tiesiog pasakyti: „Aš noriu ten nuvykti”, – aiškina Berners-Lee, nes semantinė bito, reiškiančio renginio datą, ir bito, reiškiančio jo laiką, prasmė jau pamesta.” Tačiau semantiniame tinkle visi tie bitai bus sužymėti; jūsų kompiuterio programa atpažins tas žymes ir automatiškai užsakys jums lėktuvo bilietą ir rezervuos vietą viešbutyje.
Semantinis tinklas taip pat bus turtingesnis ir lengviau pritaikomas atskiriems vartotojų poreikiams. Įsivaizduokime, jog mes vedame kursorių per viešbučio pavadinimą. Kompiuteris mus informuoja, kad 15 proc. apklaustų svečių įvertino paslaugų kokybę puikiai. Jei mes atsitiktinai sužinojome, jog tas viešbutis yra tikriausia skylė, galime liepti savo naršyklei pažymėti tuos žmones kaip visiškai nepatikimus. (Informacija apie apklausą bus saugoma trečiajame serveryje, su kuriuo mūsiškė naršyklė jungsis automatiškai.) Kai mes dažniau pasitikėsime žmonėmis, kurių skonis panašus į mūsiškį, ir atfiltruosite tuos, kurių skonis skiriasi, tinklas pradės virsti mūsų tinklu.
Tai labai didelio masto projektas. Pirmiausia reikia paruošti standartą, kuriuo remdamasis vartotojas prie tinklo turinio gali prijungti aprašančiąsias žymes, arba metaduomenis, kuriais tiksliau nurodoma konkrečiai ieškoma informacija. Po to teks sukurti būdus skirtingoms programoms dalintis skirtingų tinklapių metaduomenimis. Vėliau žmonės jau galės pradėti kurti programas, ieškančias tarp pateiktųjų duomenų papildomų duomenų ir juos apibendrinančių faktų. Paieška pasidarys tikslesnė ir išsamesnė, duomenų srautai bus tvarkingesni ir patikimesni, o informaciją bus lengviau patikrinti. Bent jau to yra siekiama.
Daugelis jaučia, kad to padaryti neįmanoma. Nors mokslinėse laboratorijose matoma tam tikra pažanga, Berners-Lee įsivaizduojamas semantinis tinklas susidurs su daugeliu, kai kurių kritikų manymu, neišsprendžiamų socialinių bei techninių problemų. Tai nesustabdys WWW konsorciumo ir kitų organizacijų pastangų. JAV agentūra DARPA ir tokios komercinės įmonės kaip Network Interference (Anglija) jau kuria Semantinio tinklo infrastruktūros kūrimui reikalingus įrankius ir jiems skirtas kompiuterių programas.
Semantinio tinklo išpainiojimas
Ericas Milleris, sėdintis ankštame kabinete, esančiame MIT Kompiuterių mokslo laboratorijos pastato trečiajame aukšte, neatrodo per daug trukdomas iš gretimo kambario sklindančio triukšmo, kuriame montuojama nauja sunki įranga. Milleris vadovauja semantinio tinklo projektui ir yra pernelyg įsitraukęs į darbą, kad ką nors, išskyrus darbą, pastebėtų. „Aš esu laimingiausias iš visų gyvųjų, – sako jis. – Man moka už tai, ką aš daryčiau ir nemokamai.”
Berners-Lee paskyrė Millerį kuriančio semantinį tinklą konsorciumo vadovu, kadangi jis dar anksčiau buvo dalyvavęs keliuose internetiniuose informacijos valdymo projektuose ir yra aktyvus semantinio tinklo idėjos šalininkas. Milleris aiškina, kaip semantinis tinklas gali žmonėms padėti lengviau susidoroti su į tinklą plūstančia informacija.
Šiandien dažniausiai internetinio turinio formatas yra toks, kokiu žmonėms lengviausia naudotis. Internete skaitant laikraščio straipsnį, nesunku pasirinkti antraštę, paantraštes, datą, fotografijas ir visa kita. Bet jei visi šie dalykai yra be specialios žymos, kompiuteris nesupranta kas jie yra. Jis visa tai mato kaip vieną didelę tekstų sankaupą. Semantinio tinklo straipsnyje kiekviena dalis bus pažymėta specialia žyma, nurodančia svarbiausias tos dalies charakteristikas ir palengvinančias naršyklei rasti, pavyzdžiui, Jimo Carterio parašytus straipsnius, o ne visus straipsnius apie jį.
Šiandien globaliu mastu tai yra neįmanoma. Tinklapiuose naudojamos formato žymės yra HTML kalbos dalis ir aprašo tiktai tai, kaip atrodo tinklapio informacija (šrifto tipas, pabraukta ar ne, šrifto spalva ir t.t.). Semantiniame tinkle nebus tuo apsiribojama; jame taip pat bus įtraukiama tokia informacija, kaip, pavyzdžiui, tema, autorius, jo adresas. Visos šios aprašomosios žymės vadinamos metaduomenimis – duomenų duomenimis. Tai nėra nauja koncepcija ir jos pritaikymas nesibaigia Internetu. Bibliotekos katalogas, kuriame nurodyti knygų pavadinimai, autorius, tema, išleidimo metai ir vieta lentynose, tai irgi yra metaduomenys.
Internetu buvo keičiamasi dokumentais naudojant anksčiau tarpusavyje nesuderintus kompiuterius (šiandien nedaug kas beatsimena, kiek bėdos buvo devintajame dešimtmetyje, kada skirtingų gamintojų kompiuteriai buvo tikros elektroninės salos). Semantinis tinklas leis žengti į priekį – kompiuteriai galės tarpusavyje apsikeitinėti atskira juose saugomuose dokumentuose esančia informacija.
Kas toliau?
Be metaduomenų semantinio tinklo nebus, bet jų vienų irgi nepakanka. Tinklapių metaduomenis reikia sujungti su specialiais juos suprantančiais dokumentais, vadinamais „ontologijomis”. Ontologijose būna apibrėžti sąryšiai tarp skirtingų terminų, todėl jos naudojamos naujų faktų nustatymui.
Kadangi ontologijos sudarymas yra didžiulis darbas, tai labiausiai tikėtina, kad internetinių svetainių kūrėjai prijungs jas prie kitų sukurtų ontologijų. Kai kuriomis jų bus galima naudotis nemokamai, o kitos bus mokamos ar licencijuotos. Čia teks susidurti su panašia problema, kokia būna sudarant žodynus bei enciklopedijas – ontologijoms darys įtakos politinės ir kultūrinės tradicijos. Pavyzdžiui, Kinijos vyriausybės pateiktoje geografinėje ontologijoje prie žodžio „Taivanis” jūs vargiai ar rasite žodį „šalis”.
Bet visa tai vizijos plėtojimo nesustabdys. WWW konsorciumui tęsiant semantinio tinklo standartų ir technologijų kūrimą, šimtai organizacijų, kompanijų ir asmenų prisideda tobulindami įrankius, programavimo kalbas ir ontologijas. Viena svarbiausių organizacijų, daug prisidėjusi prie paties Interneto atsiradimo, yra agentūra DARPA. ?iuo metu DARPA paskyrė semantinio tinklo projektui dešimtis milijonų dolerių. JAV gynybos ministerijai ji sukūrė semantinę kalbą „DARPA Agent Markup Language”, kuria vartotojai papildo internetinius dokumentus metaduomenimis ir susieja juos su atitinkamomis ontologijomis. Europoje yra sukurta panaši kalba, kuri vadinama OIL (Ontology Interchange Language – apsikeitimo ontologijomis kalba). Prie semantinio tinklo kūrimo prisideda dešimtys įvairių kompanijų – nuo Hewlett-Packard iki Nokia.
Per daug ir per vėlai
Milleris mano, kad tokie integruoti informacijos srautai suartins žmones, padės jiems išspręsti įvairias problemas ir leis atsirasti visai naujoms idėjoms. Bet kiti į semantinį tinklą žiūri ne taip optimistiškai. R. V. Guha, praeito dešimtmečio pabaigoje vadovavęs Interneto konsorciumo Resursų apibūdinimo tinklui, sako: „Tai yra ambicingas tinklas, bet egzistuoja keletas tikrai sudėtingų mokslinių problemų, kurias reikia išspręsti pirmiausia.”
Viena iš tokių problemų yra padaryti išvadas. Kai sistema papildoma naujomis taisyklėmis, laikas, per kurį kompiuteris, remdamasis duomenimis, metaduomenimis ir ontologijomis, padarys naujas išvadas, labai pailgės. Tai panašu į garsųjį „keliaujančio prekijo”, ieškančio trumpiausio kelio, vedančio per tam tikrą miestų skaičių, uždavinį. Geriausią maršrutą surasti yra nesunku, kai reikia aplankyti vos keletą vietų. Tačiau jei reikės aplankyti 15 miestų, galimų maršrutų skaičius išaugs iki 43 milijardų. Panašiai atsitiks ir su daromomis išvadomis tinkle, nes šiuo atveju tiesioginės paieškos gali sukelti daug laiko pareikalausiančių paradoksų arba prieštarų.
Netgi jei Berners-Lee ir jo žmonės susidoros su techninėmis problemomis, to bus maža, kad būtų sukurtas semantinis tinklas. Dar neaišku, ar žmonės sutiks su šio tinklo privalumais, susijusiais su papildomų metaduomenų įvedimu į internetinį tinklą. Internetas tapo toks populiarus pirmiausia dėl to, kad jo turinį sukurti yra labai paprasta.
Aišku, tokius pesimistus galima apkaltinti vien dėl to, kad jie nežino Interneto istorijos. Ne taip seniai mažai kas tikėjo, kad milijonus žmonių pavyks išmokyti rašyti HTML programas, – tačiau tai įvyko. Bet semantinio tinklo turinio kūrėjų laukia dar didesnės kliūtys. Tereiks tinklapyje tik supainioti ženklus, ir jo metaduomenys taps beverčiai. Semantiniam tinklui prigyti bus sunku ir dėl to, kad metaduomenys nebuvo naudojami nuo pačios Interneto pradžios. Peteris Merholzas, kompanijos Adaptive Path įkūrėjas ir vienas kiečiausių semantinio tinklo kritikų, sako: „Semantinis tinklas yra įdomi akademinė idėja, duosianti mažai praktinės naudos. Apie jį tiek daug kalbama vien dėl to, kad Timas Berners-Lee – Interneto išradėjas – juo labai domisi. Jeigu vietoj jo būtų koks nors akiniuotis iš kokio nors Indianos universiteto, niekas nekreiptų nė mažiausio dėmesio”.
Pirmosios gijos
Net ir Berners-Lee pripažįsta, kad semantinio tinklo kelias gali būti ilgesnis negu WWW tinklo. Reikia sukurti kuo paprastesnę teoriją, o visi kiti žmonės visas idėjas turi patikrinti praktiškai. Semantinis tinklas kol kas daugiausia egzistuoja to tinklo konstruktorių brėžiniuose, bet kai kuriuos jo būsimos galios ženklus galima aptikti ir dabartiniuose tinklapiuose. Firma Moreover Technologies sukūrė naršyklę, galinčią kasdien peržvelgti svetainėse tūkstančius naujienų. Moreover programiniai agentai yra suprogramuoti tikrinti tinklapių priekinėms žymoms (front tags), HTML etiketėms, kuriose nurodoma, kaip tinklapio tekstas turi atrodyti ekrane, ir pagal jas sprendžiama, ar tinklapis skirtas naujienoms, ar ne. Jeigu agentas tinklapio viršuje aptinka nuo 6 iki 18 didelėmis raidėmis parašytų žodžių, jis nutaria aptikęs antraštę ir įdeda ją į savo duomenų bazę. Aišku, agentas tik spėlioja, todėl dažnai parenka tinklapį, kuriame naujienų nebūna. Todėl Moreover papildė programą papildomais filtrais, kuriais atsijojami be straipsnių tinklapiai.
Visa tai dar labai toli nuo galutinio tikslo, bet pradžia – nebloga. Net patys semantinio tinklo žinovai nežino, kur nuves panašūs žingsniai. Ir kas gi tuomet, kai 1990 m. gruodžio mėnesį Berners-Lee įjungė pirmąjį Tinklo serverį, galėjo išpranašauti Amazon.com ar eBay atsiradimą?