Informacijos paieška
Pradėjęs 1991-aisiais kaip CERN bendro naudojimo dokumentų apie branduolinę fiziką sistema, WWW virto begaliniu informacijos vandenynu su asmeninėmis svetainėmis, elektroninėmis bibliotekomis, menamos tikrovės (virtualiais) muziejais, gaminių, prekių ir paslaugų katalogais, vyriausybinių organizacijų žiniomis, mokslinių tyrimų ataskaitomis, straipsniais ir apžvalgomis, failų (FTP), naujienų (“Usenet”) ir el. pašto stotimis. Kai kurios apžvalgos teigia, kad šiuo metu yra apie 150 mln. WWW puslapių ir jų skaičius padvigubėja kas 4 mėnesiai (tik aš nežinau, ar teikiant tuos skaičius atsižvelgiama į “mirusius” puslapius, nes paieškos sistemų atsakymuose sutinku nepaprastai daug nuorodų į neegzistuojančius puslapius. Mažai žinoma apie komercinių paieškos sistemų architektūrą, informacijos apdorojimo metodus ir užklausų vykdymo strategijas. Toks “nuosavybės” detalių slėpimas padėjo atsirasti požiūriui, kad paieškos sistemos turi daugiau mistikos, nei racionalaus prado. Kaip klajoti šiame informacijos Voratinklyje? Vienas iš būdų – į ten pasiųsti “robotą” (valkatą, bastūną, kirminą, vorą ar “informatorių”). Šis programinės įrangos gaminys gauna užklausą ir sistemingai peržiūri Voratinklį, ieškodamas užklausą tenkinančių dokumentų, jiems priskirdamas tinkamumo įverčius, ir pateikia surūšiuotą nuorodų sąrašą. Tačiau dėl Voratinklio apimties ir jo plėtimosi tempų, šis metodas nėra praktiškas kiekvienai užklausai.