Daugialypė paieška
Neretai virtualią kelionę pradedame nuo paieškos sistemų ar interneto adresų katalogų svetainių. Tad norėčiau panagrinėti vieną iš paieškos įrankių grupių – daugialypės paieškos sistemas (metasearch engines). Daugialypės paieškos sistema – tai paieškos įrankis, kuris pateiktą klausimą siunčia iš karto kelioms paieškos sistemoms ar adresų katalogams, o ten rastus rezultatus sugrupuoja pagal naudotą paieškos sistemą. Kartais rezultatai pateikiami pagal jų svarbą, o atitinkama paieškos sistema nurodoma rastų dokumentų referate.
Daugialypės paieškos įrankiai vertinami pagal tai, kokį skaičių paieškos įrankių apklausia, kokias interneto sritis “apžiūri”, kaip pateikiami rasti rezultatai ir kaip jie rūšiuojami. Svarbu, ar paieškos sistema, pateikdama atsakymus, atmeta pasikartojančius rezultatus ir neveikiančias nuorodas, ar užklausai formuluoti galima naudoti loginius operatorius bei frazes, kiek ilgai trunka paieška. Tokios paieškos sistemos turi dirbti labai greitai, joms keliami net dizaino reikalavimai, kad rasta informacija būtų gerai matoma ir jos neužgožtų, pavyzdžiui, įvairūs mirgantys paveikslėliai.
Daugialypės paieškos sistemų privalumas tas, kad iš karto galime apžiūrėti daugiau interneto dokumentų ieškoma tema, atsakymai pateikiami nedidelėmis grupėmis, todėl jas galime nagrinėti efektyviau, be to, į jas patenka geriausiai užklausą atitinkantys dokumentai iš atskirų paieškos sistemų. Atlikus paiešką daugialypėje paieškos sistemoje aiškiai matyti, kurioje paieškos sistemoje yra geriausi atsakymai ieškoma tema, galima juos palyginti ir keliauti į tą sistemą tęsti paieškos.
Tačiau naudojant daugialypės paieškos sistemas neįmanoma visapusiškai išnaudoti atskirų paieškos įrankių privalumų, pvz., paprastųjų paieškos sistemų pažangiosios paieškos galimybių. Nors daugialypės paieškos sistemos veikia gana sparčiai, tačiau dar vienas jų trūkumas yra tas, kad jos neturi centralizuotos paieškos strategijos, kurią suprastų visi paieškos įrankiai. Vadinasi, jei daugialypės paieškos sistemoje naudosime daug loginių operatorių, frazių, kurių kai kurios paieškos sistemos nesupranta, jie bus ignoruojami. Nemažai daugialypės paieškos sistemų, pateikdamos rezultatus, užrašo, kaip suprato mūsų formuluotą klausimą kiekviena iš panaudotų. Tai reikėtų įvertinti analizuojant atsakymus.
Daugialypės paieškos sistemos padeda rasti ne tik įprastą Voratinklio turinį, bet ir jus dominančią vaizdo, garso informaciją, naujienų grupes, MP3 archyvus ir t.t., ne vienoje iš jų galime klausti lietuviškai. Atsižvelgdama į atsiliepimus spaudoje bei specialistų vertinimus, jūsų dėmesiui siūlau keletą populiarių ir nemažą darbo patirtį turinčių bei vieną dar visai naują daugialypį paieškos įrankį.
Tai viena didžiausių daugialypės paieškos sistemų, galinti ieškoti net 200 įvairiose svetainėse: paieškos įrankiuose, kataloguose, aukcionuose, naujienų archyvuose ir kt. (nerekomenduoju pasirinkti visų iš karto!). Šią kolekciją galima suskirstyti į tris grupes: bendrųjų interneto paieškos įrankių grupę (pvz., naujienų grupės, paieškos sistemos, adresų katalogai); specialiųjų interneto paieškos įrankių grupę (pvz., specialiosios paieškos sistemos, enciklopedijos); interneto parduotuvių grupę. Pastaroji pravers tiems, kurie jau perka internete, nes kiekviena parduotuvių kolekcija siunčia klausimą virtualiems prekiautojams pagal produktų kategoriją ir pateikia sąrašą prekeivių su tų produktų kainomis, tad galima pasirinkti ne tik geriausią, bet ir pigiausią prekę.
Atsitiktiniai svetainės lankytojai gali rasti informacijos vadovaudamiesi bendrais paieškos internete principais. Tačiau jei žadate šiuo įrankiu naudotis dažniau, pravartu susipažinti su paieškos ypatumais. Klausimui formuluoti galima naudoti frazes tiek pažymint tam skirtoje srityje, tiek užrašant frazę kabutėse, loginius operatorius and, or, not ( atitinkamai +, |, -), įterptinį grupavimą (užrašius žodžius paprastuose skliaustuose). Pastaroji galimybė klausimą padaro tikslesnį, bet ne visos paieškos sistemos tai supranta.
Užrašę klausimą dar turime nuspręsti, kurioje paieškos įrankių kolekcijoje ieškosime informacijos. Jei to nepadarysime, atsakymo bus ieškoma paieškos įrankių grupėje, kurioje yra daugiausiai bendrojo pobūdžio informacija. Jei atsakymai netenkins, galima paiešką kartoti kituose paieškos įrankiuose.
Rasti atsakymai pateikiami įprastais referatais, tačiau juose, be pačios informacijos, dar yra nurodytos visos paieškos sistemos, kuriose yra ši informacija. Paiešką galime išsaugoti pasirinkę nuorodą Save this search. Išsaugotų paieškų sąrašas labai praverčia nusprendus grįžti prie jau vykdytų užklausų.
“SavvySearch”, įkurta 1995 m., šiandien savo paslaugas siūlo net 23 kalbomis – deja, lietuvių tarp jų nėra. Jei atsirastų savanorių, kurie galėtų išversti svetainės turinį į lietuvių kalbą, o po to šią svetainę prižiūrėti, jie gali kreiptis į šeimininkus.
“Mamma“
Tituliniame tinklapyje pasiskelbusi visų paieškos įrankių motina (įkurta 1996-aisiais), šiandien ši paieškos svetainė yra viena iš didžiausių, per mėnesį atsakanti maždaug į 4,2 mln. užklausų. Atsakymų į jas ieško Voratinklyje, naujienų grupėse, vaizdų ir MP3 archyvuose, virtualiose parduotuvėse. Vartotoją turėtų vilioti aiški, patogi navigacija, galimybė rinktis, kuriose informacijos grupėse ieškosime.
Klausimui formuluoti patariama naudoti įprastus “+” ir “-” ženklus, paieškos mechanizmas skiria mažąsias ir didžiąsias raides, frazes, galima ieškoti informacijos tik dokumentų pavadinimuose. “Mamma” turi 2 paieškos langus, tad norint patikslinti klausimą, pasirinkti paieškos įrankius, pakeisti rezultatų skaičių puslapyje bei nurodyti paieškos trukmę, galima rinktis patobulintos paieškos “Power Search” tinklapį klausimui formuluoti.
Atsakymai pateikiami po 10 viename tinklapyje, referatuose nurodoma, koks paprastosios paieškos įrankis buvo naudotas. Rastus rezultatus galima persiųsti kitam elektroniniu paštu.
Ieškant vaizdų atsakymai pateikiami ne mažo formato paveikslėliais, kaip įprasta vaizdų paieškoje, bet referatais, todėl kartais sunku pasirinkti reikiamą, vaizdai gali būti ne itin vertingi. Tačiau čia galima rasti tikrai įdomių žemėlapių, aktorių nuotraukų ir kt.
“MetaCrawler” įkurta 1995 m. Mičigano universitete. Šiandien ši svetainė ne tik viena populiariausių daugalypės paieškos įrankių, bet ir interneto vartai, teikiantys pašto paslaugas, kviečiantys į elektroninės prekybos centrą ir kt. Todėl svetainė negaili pagyrų sau ir prisistato kaip daugialypės paieškos įrankis Nr. 1. Be to, “MetaCrawler” deramai įvertinta daugelio specializuotų leidinių, o “PC Magazine” 1997 ir 1998 m. ją buvo pripažinęs geriausiu paieškos įrankiu.
Išsamūs svetainės aprašymai nuo istorijos iki teikiamų paslaugų bei rastų rezultatų pristatymas padeda atskleisti paieškos įrankio galimybes, nes atsakymai į klausimus renkami tik geriausiose paieškos sistemose ir kataloguose, išmetami pasikartojantys dokumentai.
Šiuo paieškos įrankiu naudotis labai paprasta. Paieškos sintaksė nuosekli, todėl nereikia mokytis, kaip formuluoti klausimą – kad paieškos sistema suprastų jūsų norus, užtenka pasirinkti any words, all words arba as a phrase. Galima rinktis patobulintos paieškos langą, ieškoti informacijos nurodant šalis ar suformuoti paieškos langą pagal savo poreikius bei jį išsaugoti.
Rasti rezultatai įvertinami ir rūšiuojami pagal svarbą, tai žymima prie pateikiamų dokumentų. Jei rezultatų rodymas jums netinka, juos galima rūšiuoti pagal šaltinio vietą (pvz., U.S Commercial Sites, U.S. Educational Sites, European Sites, Australian Sites, Other Sites) ar naudotą paieškos įrankį (pvz., Source Index: Exite (10) Infoseek (10) LookSmart (6) ir t.t.). Rastus rezultatus galima nusiųsti draugui elektroniniu paštu. Jei atsakymas į klausimą grįžta be rezultatų, “MetaCrawler” siūlo aplankyti “Electric Library”. Smalsuoliai gali apžiūrėti virtualaus šnipo (MetaSpy) surinktą informaciją, ko daugiausiai ieško internautai. Ši informacija automatiškai atnaujinama kas 15 sekundžių.
“ProFusion” komanda didžiuojasi 1996-1998 m. gautais internetiniais apdovanojimais. Iš čia minimų daugialypės paieškos priemonių ji ir “Dogpile” man pasirodė geriausios.
Įrašius užklausą, turime tiksliai ją apibūdinti, tad nepatingėkime keletą kartų spragtelėti pelyte ir pasakykime paieškos sistemai, kaip jungti reikšminius žodžius (pvz., jei pasirinksime All, vadinasi, reikšminiai žodžiai bus jungiami loginiu operatoriumi AND; Any atitinka OR), kiek rastų dokumentų pateikti viename puslapyje ir ar reikia jų santraukų. Rinktis padeda ir pati sistema: galime leisti jai pasirinkti 3 geriausius ir 3 greičiausius paieškos įrankius, o pasirinkę visus, labai padidinsime rastų atsakymų skaičių. Yra patobulintos paieškos langas, kuriame klausimui formuluoti galime naudoti Bulio loginius operatorius, frazes ir įterptinį grupavimą. “ProFusion” skiria mažąsias ir didžiąsias raides.
Gavusi užklausą “ProFusion” jį išanalizuoja ir parenka geriausius šaltinius paieškai. Atsakymai grupuojami pagal jų atitikimą užklausai, išmetami pasikartojantys dokumentai.
Sistema analizuoja ir rastus atsakymus, po to automatiškai nustato, kuriame iš paieškos įrankių buvo rasti geriausi atsakymai ieškomu klausimu. Rasti dokumentai grupuojami pagal paieškos įrankį, juos galima peržiūrėti naujame naršyklės lange. “ProFusion” nuolat tobulina “geriausio paieškos įrankio” nustatymo mechanizmą, stengiasi trumpinti paieškos laiką, lygina savo užklausos sintaksę su naudojamų paieškos įrankių sintakse, nesikreipia į lėtus ir “ilgai galvojančius” paieškos įrankius. Yra žinių bazė, su kuria lyginami užrašytieji reikšminiai žodžiai.
Vartotojams paslaugos siūlomos anglų, vokiečių ir prancūzų kalba. Prieš pradėdami paiešką galime pasirinkti, kiek sekundžių ji turėtų užtrukti.
“Inference Find” paieškai naudoja 6 savo nuožiūra parinktus geriausius paieškos įrankius (“WebCrawler”, “Yahoo”, “Lycos”, “Alta Vista”, “InfoSeek” ir “Excite”), bet reikalui esant galime pasirinkti reikiamą. Sistema pašalina informacijos perteklių, atsirenka geriausius dokumentus ir grupuoja rezultatus pagal jų panašumą.
Į klausimą, ar galima naudoti loginius operatorius, “Inference Find” atsako ir “taip”, ir “ne”. Tai reiškia – turime nepamiršti, jog ne visos paieškos sistemos juos supranta.
“Dogpile“
Tai vienas didžiausių, gerai žinomas ir populiarus “Go2Net” priklausantis paieškos įrankis, savo vartotojams teikiantis įvairialypes paslaugas. Užklausos langas paprastas ir aiškus, galima naudotis katalogu. Atsakymai pateikiami grupuojant juos pagal naudotą paieškos įrankį. “Dogpile” bando atspėti, ko ieškote, todėl klausia “are you looking for:” ir sūlo savo variantus, tačiau neišmeta pasikartojančių atsakymų.
Pasirinkę geografinę paiešką ir užrašę kurį nors JAV miestą, galėsite ieškoti to regiono interneto svetainėse: sužinosime, koks ten oras, pavartysime geltonuosius ir baltuosius puslapius, žemėlapius.
Viena naujausių daugialypės paieškos svetainių paiešką atlieka 10 paprastųjų paieškos įrankių, iš kurių galime pasirinkti reikiamus. Kiek vaikiškai atrodantis pirmasis paieškos langas gali sudaryti klaidingą įspūdį: sistema sugeba atsakyti ir į sudėtingus klausimus, ieško verslo informacijos, “varto” baltuosius bei geltonuosius puslapius.
Pateikiami tik geriausiai klausimą atitinkantys atsakymai ir sugrupuojami pagal panaudotą paieškos įrankį, skaitytojai informuojami apie rastas pasikartojančias nuorodas. Paspaudę šalia naudoto paieškos įrankio pavadinimo esančią nuorodą Query, pateksime į minėto paieškos įrankio svetainę. “SearchWiz” analizuoja dažniausiai užduodamus klausimus, todėl prie rastų rezultatų atsiranda keletas reikšminių žodžių, labiausiai atitinkančių klausimą – juos pasirinkus automatiškai atliekama nauja paieška.
Kas taikliau?
Norėdami patikrinti daugialypės paieškos sistemų “taiklumą”, pabandėme kelioms iš jų pateikti vienodus klausimus.
Pirmasis – apie politinius skandalus Lietuvoje (+political +scandals +Lithuania). “SavvySearch” atsiuntė 35 atsakymus, iš kurių nebuvo galima susidaryti bent kiek aiškesnio vaizdo apie Lietuvos politinius nesutarimus. “Mamma” pasiūlė 43, pirmasis – iš svetainės http://politicalinsider.com/, kurioje lietuviškų paskalų reikėtų ieškoti papildomai. Iš kitų referatų sunkoka išsirinkti reikiamą, tad klausimą tikslinau įvesdama papildomų reikšminių žodžių. Užrašius dar ir Seimo pirmininko pavardę, rasti 24 atsakymai, kurie geriau atitiko užklausą. Pavyzdžiui, atsakyme Nr. 3 – ELTA naujienos anglų kalba, kuriose minima ir pagarsėjusi V. Landsbergio sklypo Žvėryne istorija. “MetaCrawler” jungiant klausimo žodžius loginiu operatoriumi IR rasta 12 atsakymų, tarp kurių yra visko: nuo informacijos apie Lietuvos vystymąsi po nepriklausomybės iki bendrųjų rinkimų bei politikos mokslų šaltinių. “ProFusion” pasiūlė net 107 atsakymus, kurie neblogai atitiko norimą rasti informaciją. “Inference Find” atsakymai, sugrupuoti į 12 temų, užklausą tenkino prastai. “Dogpile” pasiūlė daug atsakymų – geriausi iš “GoTO.com”, kuriuose atsispindi V. Adamkaus pergalė prezidento rinkimuose, Seimo nesutarimai bei santykiai su kaimyninėmis šalimis. Kituose paieškos įrankių grupėse – įvairių naujienų tarnybų pranešimai ir kt. “SearchWiz” rezultatai buvo keistoki, nes atsakymuose pasitaikė nuorodų, pvz., į Lietuvos avialinijų skrydžių arba Užsienio reikalų ministerijos tinklapius, tačiau yra ir svetainių, pateikiančių “Reuters” ir kt. naujienų agentūrų pranešimus ieškoma tema.
Klausimas apie Claudios Schiffer biografiją (Claudia +Schiffer +biography) paieškos sistemoms pasirodė labai paprastas. Puikius atsakymus atsiuntė “SavvySearch”, “Mamma”, “ProFusion”, “Dogpile”, “SearchWiz”. “Inference Find” rastą informaciją pateikė 8 grupėse, viena iš jų taip ir vadinosi – “Claudia Schiffer”, kurioje ir buvo patys geriausi atsakymai į klausimą: nuo biografijos smulkmenų iki puikios fotogalerijos, apdovanojimų bei jos gerbėjų nuomonių. Vienintelėje “MetaCrawler” ieškant informacijos gauti tik 3 atsakymai, iš kurių tik 1 tebuvo vertas dėmesio.
Trečiąjį klausimą pabandžiau pateikti lietuviškai. Tai (a) +teisės +aktai ir (b) teisės aktai (frazė). “SavvySearch” pateikė (a) 14 atsakymų, tarp kurių buvo nuoroda į LR Seimo svetainę. Klausimą užrašius kaip frazę gauti 4 atsakymai, tarp jų – LR Seimas, Ūkio, Aplinkos apsaugos ir Finansų ministerijos teisės aktai. Daugialypės paieškos sistemoje “Mamma” abiem atvejais nieko tinkamo nerasta. “MetaCrawler” jungiant reikšminius žodžius loginiu IR rasti 42 dokumentai, tarp jų jau pirmajame puslapyje yra nuoroda tiesiai į LR Seimo dokumentų paieškos tinklapį! Užklausos ieškant kaip frazės nuorodos tiesiai į minėtą LR Seimo puslapį neradome. “ProFusion” pirmuoju atveju (a) 3 geriausiuose paieškos įrankiuose rado 56 atsakymus, iš kurių pirmasis – juridinės informacijos paslaugų firma “Teisės aktai”, 3 greičiausiuose – 56 labai panašūs atsakymai. Užklausą užrašius kaip frazę gauti labai panašūs kiek kitaip išsirikiavę atsakymai. “Inference Find” abiem klausimo formulavimo atvejais siūlė atsakymus 4 grupėse, LR Seimo nerasta, daugiausiai ministerijų dokumentai. “Dogpile” (a) pasiūlė 10 dokumentų iš “GoTo.com”, 494 dokumentus iš “Google”, per 10 iš “Infoseek”, 2 iš “Lycos” ir per 2 000 iš “AltaVista”. Čia matyti, kurios paieškos sistemos supranta lietuvišką klausimą. “SearchWiz” abiem klausimo formulavimo atvejais atsiuntė panašius rezultatus, pavyzdžiui, 10 iš “AltaVista”, 20 – “Yahoo”, 2 – “Lycos”, 10 – “Excite”, 15 – “WebCrawler” (iš kurių 1-oji nuoroda į LR Seimo puslapį), 15 – “Infoseek”.
Didelių išvadų iš šio improvizuoto testo nesinori daryti, tačiau akivaizdžiai matyti, kaip svarbu ieškant informacijos įvertinti ieškomą temą, parinkti reikšminius žodžius bei paieškos įrankį ir tinkamai naudoti loginius operatorius bei frazes.