Paieškos sistemos

Paieškos įrankiai

Problema, kaip rasti informacijos internete, atsirado beveik kartu su pačiu internetu, nes nėra (ir negali būti!) vienos svetainės, kuriuoje atsispindėtų visa internete esanti informacija. Šiandien yra gausybė interneto svetainių, kurios skirtos informacijos paieškai. Tokios svetainės vadinamos paieškos įrankiais.
Interneto paieškos įrankius, atsižvelgiant į pasauliniuose kompiuterių tinkluose esančios informacijos rinkimo, komplektavimo bei pateikimo vartotojui principus, sąlyginai galima grupuoti į:

• interneto adresų katalogus (angl. “WWW Directory”);
• paieškos sistemas (angl. “Search Engines”);
• elektronines bibliotekas (angl. “Electronic Library” arba “Virtual Library”);
• naujienų pokalbių grupes (angl. “Usenet Newsgroups”).

Interneto adresų katalogai – tai svetainės, kurių tikslas – rinkti, grupuoti pagal temas ir pateikti vartotojui pasauliniuose kompiuterių tinkluose esančią informaciją. Juose didžiausias dėmesys skiriamas informacijos grupavimui pagal temas. Temos katalaguose sisteminamos hierarchiškai, pavyzdžiui: Menas → Architektūra → Konferencijos. Dažnai ir adresų katalogai turi labai daug temų ir potemių, todėl be temų sąrašo yra ir paieška kataloge. Interneto adresų kataloguose ieškant informacijos galima derinti informacijos peržiūrą pagal temas bei paiešką kataloge.
Paieškos sistemos – tai svetainės, kurios indeksuoja pasauliniuose kompiuterių tinkluose esančią informaciją, kuria rastų dokumentų duomenų banką bei attlieka paiešką jame. Daugelis paieškos sistemų informacijai rinkti ir indeksuoti naudoja programas, vadinamas “voriuku” (angl. “spider”). Šios programos “apžiūri” interneto svetainėse esančius dokumentus ir grįžta į centrinį paieškos sistemos kompiuterį, kuriame saugoma jų surinkta ir indeksuota informacija. Kai mes kreipiamės į paieškos si

istemą ko nors klausdami, paieškos sistemos centrinis kompiuteris atsakymų ieško savo indeksuotame duomenų banke. Paieškos sistemos labai dažnai kuria ir interneto adresų katalogus.
Elektroninės bibliotekos – tai svetainės, kurių tikslas – kurti patikimos ir įvertintos informacijos archyvus. Pagrindinis faktorius, skiriantis elektronines bibliotekas nuo paieškos sistemų bei interneto adresų katalogų yra tas, kad jose kaupiama tik patikrinta ir specialistų įvertinta informacija. Elektroninės bibliotekos dažnai renka interneto dokumentus tik viena tema, pavyzdžiui, mokslo, filosofijos, literatūros, istorijos ir kt. Elektroninėse bibliotekose informacijos paieška gali būti labai įvairi: galima keliauti hipernuorodomis, ieškoti pagal reikšminį žodį arba derinti abu šiuos būdus.
Naujienų pokalbių grupių paieškos svetainės skiriasi nuo anksčiau išvardytų tik tuo, kad juose galima ieškoti specifinės informacijos: į įvairias grupes susibūrusių interneto vartotojų, kurie elektroninio pašto pagalba keičiasi informacija, attsiųstų žinučių ar rašinių.
Iš dalies šių paieškos įrankių grupės persidengia. Kartais iš pirmo žvilgsnio sunku suprasti, kokiai paieškos įrankių grupei priklauso viena ar kita svetainė, nes jų pavadinimai neatspindi informacijos rinkimo bei komplektavimo principų.
Kaip iš gausybės paieškos įrankių pasirinkti tinkamą? Vienareikšmio atsakymo nėra. Įvairiuose paieškos įrankiuose galima rasti ir tos pačios, ir skirtingos informacijos, nes skiriasi informacijos rinkimo, indeksavimo ir pateikimo vartotojui principai. Norint pasirinkti optimaliausią paieškos variantą, reikia žinoti galimus informacijos paieškos būdus ir mokėti juos derinti, susipažinti su pa
aieškos sistemų bei interneto adresų katalogų savybėmis, mokėti teisingai suformuluoti klausimą bei rinktis teisingą atsakymą.

Kaip formuoti užklausą?

Gerus paieškos rezultatus galima gauti tik teisingai suformulavus užklausą.Užklausas reikia formuoti pagal tam tikras taisykles. Nors kiekvienai sistemai taikomos skirtingos taisyklės, bet yra ir bendrų bruožų.
Užklausa sudaroma iš raktinių žodžių (“keywords”). Tai turėtų būti specifiniai žodžiai, kurie labiausiai tikėtini tik jus dominančiuose tinklalapiuose. Pavyzdžiui, ieškant informacijos apie kompiuterio klaviatūros tvarkykles (“keyboard driver”), tinkami raktiniai žodžiai būtų “keyboard”, “driver”, “device”, “software”. Jei žinoma kokios firmos tvarkyklė gali būti, reikėtų į užklausą įtraukti ir jos pavadinimą.
Formuluojant klausimą labai svarbu, ar mažosiomis ar didžiosiomis raidėmis jį užrašysime. Naudokite tik mažąsias raides, jai norite, kad paieškos programa neatsižvelgtų į didžiąsias raides. Jei ieškome, pavyzdžiui, “Organization”, gausime tik tas svetaines, kuriose šis žodis rašomas didžiąja raide. Jei ieškosime “organization”, gausime svetaines su žodžiais “organization”, “ORGANIZATION’ ir bet kokia kita didžiųjų ir mažųjų raidžių kombinacija.
Užklausoje esančių žodžių tvarka taip pat svarbi, nes kai kurios sistemos laiko svarbesniais tuos žodžius, kurie užklausoje yra pirmieji. Žodžių tvarka, galbūt, neturės įtakos rastų puslapių skaičiui, tačiau gali nulemti jų rikiavimo tvarką. Tai svarbu, nes dažnai paieškos rezultatas – keli tūkstančiai interneto adresų, tarp kurių yra tik keli tinkami.
Norėdami praplėsti savo paiešką, naudokite universalųjį simbolį “*” po žodžio šaknies. Pv

vz., “lietuv*”. Šiuo atveju paieškos sistema siųs visus dokumentus, kuriuose yra šio žodžio šaknis, pvz., lietuviškos, Lietuvos, lietuvių ir t.t.
Užklausose galima naudoti specialias komandas – operatorius, leidžiantis susiaurinti ar išplėsti paieškos sritį. Pavyzdžiui, žodelis “AND” arba ženklas “+” naudojami, kai reikia rasti tekstus, kuriuose būtų abu žodžiai, pvz.,
Jonas AND Skendelis arba Jonas + Skendelis
Žodelis “NOT” arba ženklas “-”, padėtas prieš žodį paieškos rakte, reiškia, kad ieškomi WWW dokumentai, kuriuose nėra žodžių, turinčių paieškos rakte “-” ženklą.
Žodelis “OR” parašytas tarp dviejų raktinių žodžių reiškia, kad paieškos rezultatu bus tie tekstai, kuriuose yra bent vienas iš nurodytų žodžių.
Skliausteliai “( . . . )” leidžia grupuoti kelias užklausas (sukurti kelis scenarijus), kurios atskiriamos kableliais, pvz., štai užklausa puslapių, kuriuose būtų žodis “basic” kartu arba su “Netscape” arba su “Explorer”:
(Basic + Netscape) , (Basic + Explorer)
Užklausoje taip pat galima nurodyti frazę. Frazė yra žodžių seka tarp kabučių (“”). Kabutėse parašyti žodžiai rastuose puslapiuose turi būti išdėstyti ta pačia tvarka. Be kabučių parašyti žodžiai suprantami kaip atskiri nepriklausomi paieškos elementai.
Kai kuriuose paieškos įrankiuose klausimui formuluoti galima naudoti artumo operatorius, kurie nurodo, kiek reikšminiai žodžiai gali būti nutolę vienas nuo kito. Artumo operatorius NEAR (arti), kartais trumpinamas N, randa dokumentus su žodžiais, kurie yra iš abiejų ieškomo termino pusių, bet nutolę ne toliau, kaip nurodytas skaičius, pv
vz., užrašę “tax N5 reform” gausime dokumentus, kuriuose žodis “reform” bus nutolęs nuo žodžio “tax” ne toliau, kaip per 5 žodžius iš vienos ar kitos pusės, pvz.:tax reform; reform of income tax;
Artumo operatorius WITHIN (viduje, ribose), kartais trumpinamas W, randa dokumentus su žodžiais, kurie yra po ieškomo termino, bet nutolę ne toliau, kaip nurodytas skaičius, pvz., užrašę “tax W5 reform” gausime dokumentus, kuriuose žodis “reform” bus po žodžio “tax” ne toliau, kaip per 5 žodžius, pvz.:tax reform; tax accountic and reform;
Artumo operatorius BEFORE (prieš) ir AFTER (po) atlieka tą pačią funkciją, kaip ir aukščiau minėti operatoriai, t.y. apibūdina reikšminių žodžių vietą dokumente (prieš ar po pirmojo reikšminio žodžio). Pvz., užrašius klausimą “medicininė AFTER6 diagnostika”, bus siunčiami tik tie dokumentai, kuriuose žodis “diagnostika” seka po žodžio “medicininė”, bet nutolęs nuo pirmojo ne toliau, kaip per 6 žodžius.
Be loginių operatorių, informacijos galima ieškoti, nurodant, kokioje dokumento dalyje turi būti reikšminiai žodžiai ar santrumpos. Dažniausiai pasitaikanti paieška pagal dokumento dalis yra tokia: “url:” (interneto adreso dalis), “title:” (pavadinimas), “location:” (vieta internete), “domain:”
biblioteka + url:lnb
library + domain:lt
pets – image:cat

Kaip rikiuojami paieškos rezultatai?

Paieškos sistema automatiškai rūšiuoja siunčiamus rezultatus taip, kad tinkamiausi dokumentai būtų pirmiausi. Dažnai nesvarbu, ar gauname 200 ar 2 000 000 dokumentų, atitinkančius norimus kriterijus – tinkamiausius iš jų randame pirmuose dviejuose puslapiuose. Jei nerandate reikalingos informacijos pirmuosiuose puslapiuose, patikslinkite paieškos programai duotus nurodymus. Rezultatų puslapyje pateikiamas rastų tinklalapių sąrašas su trumpais aprašymais. Sąraše pateikiamos tinklalapių antraštės ir adresai. Pagal aprašymus ir antraštes, galima nuspręsti, ar tinklalapis tinkamas.

Paieškos sistemų analizė

Paieškos sistemų struktūrą sąlygiškai galima skirstyti į tris pagrindines dalis.
Pirmoji dalis – tai programos “voriukai” (angl. “spider”) informacijai rinkti ir indeksuoti. Šios programos “aplanko” svetaines, “perskaito” jose esančią informaciją, ir juda toliau svetainėje esančiomis nuorodomis. Surinkę informaciją “voriukai” grįžta į paieškos sistemos pagrindinį kompiuterį. Tos pačios svetainės po kurio laiko (pvz., kartą ar du per mėnesį), vėl “apžiūrimos” ir informacija apie visus pakeitimus perduodama į centrinio kompiuterio duomenų banką.
Antroji paieškos sistemos dalis – tai informacijoa archyvas, dar vadinamas indeksu arba katalogu. Šį katalogą kuria “voriukai”, kurie rastą informaciją kopijuoja pagrindiniame kompiuteryje. Paieškos sistemų archyvai be galo dideli, juose yra rastų tinklapių kopijos, kurios papildomos ir atnaujinamos.
Trečioji dalis – tai paieškos įrankio programinė įranga. Ji tarp milijonų “apžiūrėtų” tinklapių ieško atsakymo į užduotą klausimą. Rastus rezultatus išrikiuoja eilės tvarka, kuri paieškos programos atžvilgiu geriausiai atitinka ieškomą informaciją.
Šias išvardytas dalis turi visos paieškos sistemos. Tačiau jų sąveika (algoritmas) yra skirtinga, todėl uždavę tą patį klausimą gausime skirtingus rezultatus.
Lentelėse 1 – 3 esanti informacija padės pasirinkti tinkamą paieškos įrankį.

Lentelė 1: Paieškos sistemų informacijos šaltiniai

Alta Vista WWW, naujienos, MP3, garso ir vaizdo įrašų archyvai
Excite WWW, naujienos, elektroninio pašto adresai, garso ir vaizdo įrašų archyvai
Google WWW, interneto adresų katalogas
Hotbot WWW, naujienos, MP3, garso ir vaizdo įrašų archyvai, elektroninio pašto adresai
Lycos WWW, garso, vaizdo, multiterpės įrašų archyvai
Search.lt WWW, katalogas, spauda, naujienos

Lentelė 2: Paieškos sistemų klausimo formulavimo ypatybės

Alta Vista Excite Google Hotbot Lycos
Operatoriai
AND, NOT, OR Išplėstinėje paieškoje Taip Ne Taip Taip
Didžiosios raidės Taip Taip Ne Taip Taip
Įterpia operatorių OR OR AND AND AND
Frazės Naudoti “” Naudoti “” Naudoti “” Naudoti “” arba rinktis iš meniu
Trumpinimas Naudoti * Ne Ne Naudoti * arba rinktis iš meniu Ne
Artumo operatoriai Taip Ne Ne Ne Taip
Adresų katalogas Taip Taip Taip Taip Taip
Ieško rastuose atsakymuose Ne Ne Ne Taip Taip
Lentelė 3: Operacijos ženklų naudojimo populiariausiuose paieškos sistemose palyginimo lentelė

Operacijos ženklas Trumpas apibūdinimas Testuojamos paieškos sistemos

AltaVista Exite InfoSeek Lycos
+ Žymi žodžius, kurie būtinai turi būti rastuose puslapiuose. Žodžiai be + traktuojami kaip “galimi” + + + –
– Žymi žodžius, kurių neturi būti rastuose puslapiuose. + + + +
” Kabutėse parašyti žodžiai rastuose puslapiuose turi būti išdėstyti ta pačia tvarka. Be kabučių parašyti žodžiai suprantami kaip atskiri nepriklausomi paieškos elementai. + – + –
and, & Sujungia du paieškos elementus: rastoje informacijoje turi būti abu. + + – –
or, | Sujungia du paieškos elementus: rastoje informacijoje turi būti bent vienas. + + – –
not Ženklo “-” analogas užklausose su “and”, “or”. + + – –
near, [] Nurodo, kad du rastus žodžius gali skirti ne daugiau kaip 10 kitų žodžių. AltaVista serveryje tarp žodžių reikia rašyti “near”, o InfoSeek – įterpti juos tarp laužtinių skliaustų. + – + –
() Apjungia keletą užklausos operacijų. + + – –
* Reiškia bet kokią raidžių ir skaičių seką. + – – +

Informacijos paieškos sistemos ir katalogai Lietuvoje

Google http://www.google.lt/
DELFI http://paieska.delfi.lt
Tiekia naujienas, elektroninį paštą, nuorodų katalogus, paieškos sistemos paslaugas ir kt.
Info.lt http://www.info.lt/
Specializuota paieška, naujienos.
Kelrodis http://www.tdd.lt/kelrodis/
Trumpas pagalbininkas pradedantiesiems, interneto naujienos, naujos svetainės.
Laikas.lt http://www.laikas.lt/nuorodos/
Lietuva Internete http://www.on.lt/index.html.lt
Lietuva Internete: WWW buveinių registras http://www.on.lt/idx.htm
Išsami WWW buveinių rodyklė.
NetSprint http://www.netsprint.lt/
Search.lt http://www.search.lt/
Bendro pobūdžio bei specializuotos informacijos paieškos sistema internete.
Surask http://www.surask.lt/
Lietuviškų svetainių paieška.
Takas http://www.takas.lt/
Lietuvos telekomo portalas.
Tinklapių katalogas http://katalogas.net/
Top100.lt http://www.top100.lt/
Interneto puslapių ir serverių statistika, reitingai.
Žemėlapis.lt http://www.zemelapis.lt/
Lietuvos miestų žemėlapiai, gatvių paieška, įmonių bei organizacijų informacija.
Informacijos paieškos sistemos užsienyje

http://www.altavista.com
http://www.excite.com/
http://www.google.com/
http://www.go.com/
http://www.infoseek.com
http://www.yahoo.com/
http://www.lycos.com/
http://www.metaCrawler.com/
http://www.mamma.com/
http://www.multicrawl.com/

Daugialypė paieška
Neretai virtualią kelionę pradedame nuo paieškos sistemų ar interneto adresų katalogų svetainių. Tad norėčiau panagrinėti vieną iš paieškos įrankių grupių – daugialypės paieškos sistemas (metasearch engines). Daugialypės paieškos sistema – tai paieškos įrankis, kuris pateiktą klausimą siunčia iš karto kelioms paieškos sistemoms ar adresų katalogams, o ten rastus rezultatus sugrupuoja pagal naudotą paieškos sistemą. Kartais rezultatai pateikiami pagal jų svarbą, o atitinkama paieškos sistema nurodoma rastų dokumentų referate.
Daugialypės paieškos įrankiai vertinami pagal tai, kokį skaičių paieškos įrankių apklausia, kokias interneto sritis “apžiūri”, kaip pateikiami rasti rezultatai ir kaip jie rūšiuojami. Svarbu, ar paieškos sistema, pateikdama atsakymus, atmeta pasikartojančius rezultatus ir neveikiančias nuorodas, ar užklausai formuluoti galima naudoti loginius operatorius bei frazes, kiek ilgai trunka paieška. Tokios paieškos sistemos turi dirbti labai greitai, joms keliami net dizaino reikalavimai, kad rasta informacija būtų gerai matoma ir jos neužgožtų, pavyzdžiui, įvairūs mirgantys paveikslėliai.
Daugialypės paieškos sistemų privalumas tas, kad iš karto galime apžiūrėti daugiau interneto dokumentų ieškoma tema, atsakymai pateikiami nedidelėmis grupėmis, todėl jas galime nagrinėti efektyviau, be to, į jas patenka geriausiai užklausą atitinkantys dokumentai iš atskirų paieškos sistemų. Atlikus paiešką daugialypėje paieškos sistemoje aiškiai matyti, kurioje paieškos sistemoje yra geriausi atsakymai ieškoma tema, galima juos palyginti ir keliauti į tą sistemą tęsti paieškos.
Tačiau naudojant daugialypės paieškos sistemas neįmanoma visapusiškai išnaudoti atskirų paieškos įrankių privalumų, pvz., paprastųjų paieškos sistemų pažangiosios paieškos galimybių. Nors daugialypės paieškos sistemos veikia gana sparčiai, tačiau dar vienas jų trūkumas yra tas, kad jos neturi centralizuotos paieškos strategijos, kurią suprastų visi paieškos įrankiai. Vadinasi, jei daugialypės paieškos sistemoje naudosime daug loginių operatorių, frazių, kurių kai kurios paieškos sistemos nesupranta, jie bus ignoruojami. Nemažai daugialypės paieškos sistemų, pateikdamos rezultatus, užrašo, kaip suprato mūsų formuluotą klausimą kiekviena iš panaudotų. Tai reikėtų įvertinti analizuojant atsakymus.
Daugialypės paieškos sistemos padeda rasti ne tik įprastą Voratinklio turinį, bet ir jus dominančią vaizdo, garso informaciją, naujienų grupes, MP3 archyvus ir t.t., ne vienoje iš jų galime klausti lietuviškai. Atsižvelgdama į atsiliepimus spaudoje bei specialistų vertinimus, jūsų dėmesiui siūlau keletą populiarių ir nemažą darbo patirtį turinčių bei vieną dar visai naują daugialypį paieškos įrankį.

“SavvySearch”

Tai viena didžiausių daugialypės paieškos sistemų, galinti ieškoti net 200 įvairiose svetainėse: paieškos įrankiuose, kataloguose, aukcionuose, naujienų archyvuose ir kt. (nerekomenduoju pasirinkti visų iš karto!). Šią kolekciją galima suskirstyti į tris grupes: bendrųjų interneto paieškos įrankių grupę (pvz., naujienų grupės, paieškos sistemos, adresų katalogai); specialiųjų interneto paieškos įrankių grupę (pvz., specialiosios paieškos sistemos, enciklopedijos); interneto parduotuvių grupę. Pastaroji pravers tiems, kurie jau perka internete, nes kiekviena parduotuvių kolekcija siunčia klausimą virtualiems prekiautojams pagal produktų kategoriją ir pateikia sąrašą prekeivių su tų produktų kainomis, tad galima pasirinkti ne tik geriausią, bet ir pigiausią prekę.
Atsitiktiniai svetainės lankytojai gali rasti informacijos vadovaudamiesi bendrais paieškos internete principais. Tačiau jei žadate šiuo įrankiu naudotis dažniau, pravartu susipažinti su paieškos ypatumais. Klausimui formuluoti galima naudoti frazes tiek pažymint tam skirtoje srityje, tiek užrašant frazę kabutėse, loginius operatorius and, or, not ( atitinkamai +, |, -), įterptinį grupavimą (užrašius žodžius paprastuose skliaustuose). Pastaroji galimybė klausimą padaro tikslesnį, bet ne visos paieškos sistemos tai supranta.
Užrašę klausimą dar turime nuspręsti, kurioje paieškos įrankių kolekcijoje ieškosime informacijos. Jei to nepadarysime, atsakymo bus ieškoma paieškos įrankių grupėje, kurioje yra daugiausiai bendrojo pobūdžio informacija. Jei atsakymai netenkins, galima paiešką kartoti kituose paieškos įrankiuose.
Rasti atsakymai pateikiami įprastais referatais, tačiau juose, be pačios informacijos, dar yra nurodytos visos paieškos sistemos, kuriose yra ši informacija. Paiešką galime išsaugoti pasirinkę nuorodą Save this search. Išsaugotų paieškų sąrašas labai praverčia nusprendus grįžti prie jau vykdytų užklausų.

“Mamma”

Tituliniame tinklapyje pasiskelbusi visų paieškos įrankių motina (įkurta 1996-aisiais), šiandien ši paieškos svetainė yra viena iš didžiausių, per mėnesį atsakanti maždaug į 4,2 mln. užklausų. Atsakymų į jas ieško Voratinklyje, naujienų grupėse, vaizdų ir MP3 archyvuose, virtualiose parduotuvėse. Vartotoją turėtų vilioti aiški, patogi navigacija, galimybė rinktis, kuriose informacijos grupėse ieškosime.
Klausimui formuluoti patariama naudoti įprastus “+” ir “-” ženklus, paieškos mechanizmas skiria mažąsias ir didžiąsias raides, frazes, galima ieškoti informacijos tik dokumentų pavadinimuose. “Mamma” turi 2 paieškos langus, tad norint patikslinti klausimą, pasirinkti paieškos įrankius, pakeisti rezultatų skaičių puslapyje bei nurodyti paieškos trukmę, galima rinktis patobulintos paieškos “Power Search” tinklapį klausimui formuluoti.
Atsakymai pateikiami po 10 viename tinklapyje, referatuose nurodoma, koks paprastosios paieškos įrankis buvo naudotas. Rastus rezultatus galima persiųsti kitam elektroniniu paštu.
Ieškant vaizdų atsakymai pateikiami ne mažo formato paveikslėliais, kaip įprasta vaizdų paieškoje, bet referatais, todėl kartais sunku pasirinkti reikiamą, vaizdai gali būti ne itin vertingi.

“MetaCrawler”

“MetaCrawler” įkurta 1995 m. Mičigano universitete. Šiandien ši svetainė ne tik viena populiariausių daugalypės paieškos įrankių, bet ir interneto vartai, teikiantys pašto paslaugas, kviečiantys į elektroninės prekybos centrą ir kt. Todėl svetainė negaili pagyrų sau ir prisistato kaip daugialypės paieškos įrankis Nr. 1. Be to, “MetaCrawler” deramai įvertinta daugelio specializuotų leidinių, o “PC Magazine” 1997 ir 1998 m. ją buvo pripažinęs geriausiu paieškos įrankiu.
Išsamūs svetainės aprašymai nuo istorijos iki teikiamų paslaugų bei rastų rezultatų pristatymas padeda atskleisti paieškos įrankio galimybes, nes atsakymai į klausimus renkami tik geriausiose paieškos sistemose ir kataloguose, išmetami pasikartojantys dokumentai.
Šiuo paieškos įrankiu naudotis labai paprasta. Paieškos sintaksė nuosekli, todėl nereikia mokytis, kaip formuluoti klausimą – kad paieškos sistema suprastų jūsų norus, užtenka pasirinkti any words, all words arba as a phrase. Galima rinktis patobulintos paieškos langą, ieškoti informacijos nurodant šalis ar suformuoti paieškos langą pagal savo poreikius bei jį išsaugoti.

“Inference Find”

Vartotojams paslaugos siūlomos anglų, vokiečių ir prancūzų kalba. Prieš pradėdami paiešką galime pasirinkti, kiek sekundžių ji turėtų užtrukti.
“Inference Find” paieškai naudoja 6 savo nuožiūra parinktus geriausius paieškos įrankius (“WebCrawler”, “Yahoo”, “Lycos”, “Alta Vista”, “InfoSeek” ir “Excite”), bet reikalui esant galime pasirinkti reikiamą. Sistema pašalina informacijos perteklių, atsirenka geriausius dokumentus ir grupuoja rezultatus pagal jų panašumą.

“Dogpile”

Tai vienas didžiausių, gerai žinomas ir populiarus “Go2Net” priklausantis paieškos įrankis, savo vartotojams teikiantis įvairialypes paslaugas. Užklausos langas paprastas ir aiškus, galima naudotis katalogu. Atsakymai pateikiami grupuojant juos pagal naudotą paieškos įrankį. “Dogpile” bando atspėti, ko ieškote, todėl klausia “are you looking for:” ir sūlo savo variantus, tačiau neišmeta pasikartojančių atsakymų.
Pasirinkę geografinę paiešką ir užrašę kurį nors JAV miestą, galėsite ieškoti to regiono interneto svetainėse: sužinosime, koks ten oras, pavartysime geltonuosius ir baltuosius puslapius, žemėlapius.

“SearchWiz”

Viena naujausių daugialypės paieškos svetainių paiešką atlieka 10 paprastųjų paieškos įrankių, iš kurių galime pasirinkti reikiamus. Kiek vaikiškai atrodantis pirmasis paieškos langas gali sudaryti klaidingą įspūdį: sistema sugeba atsakyti ir į sudėtingus klausimus, ieško verslo informacijos, “varto” baltuosius bei geltonuosius puslapius.
Pateikiami tik geriausiai klausimą atitinkantys atsakymai ir sugrupuojami pagal panaudotą paieškos įrankį, skaitytojai informuojami apie rastas pasikartojančias nuorodas. Paspaudę šalia naudoto paieškos įrankio pavadinimo esančią nuorodą Query, pateksime į minėto paieškos įrankio svetainę. “SearchWiz” analizuoja dažniausiai užduodamus klausimus, todėl prie rastų rezultatų atsiranda keletas reikšminių žodžių, labiausiai atitinkančių klausimą – juos pasirinkus automatiškai atliekama nauja paieška.

Vaizdinės informacijos paieška

Ieškant įvairių iliustracijų, fotografijų, diagramų, grafikų, patentų brėžinių, prekių ženklų ar kitokios vaizdinės informacijos pravartu susipažinti su tokios paieškos ypatumais ir galimybėmis.Ieškant vaizdų ir ieškotojui, ir paieškos priemonei tenka sudėtingesnis uždavinys: reikia labai aiškiai apibūdinti, kokio būtent atvaizdo ieškome, o paieškos įrankis privalo ne tik teisingai tai suprasti, bet ir sugebėti jį “atpažinti”. Paieškos robotai neturi akių, jiems tenka “apžiūrinėti” santrumpas interneto adrese, HTML žymas, apibūdinančias vaizdus ir failų plėtinius, kartu su vaizdų esantį tekstą. Todėl vaizdų paieška kartu su vertingais paveikslėliais dažnai pateikia ir visai nereikalingų. Kita vertus, labai daug vaizdų gali būti nerasta, nes jų pavadinimuose nebūtinai turi būti ieškomos temos pavadinimas. Todėl daugelis vaizdų paieškos priemonių turi puikius katalogus, naudoja vaizdų archyvus, muziejus ir galerijas.
Tiek universalios, tiek specializuotos paieškos sistemos rastus vaizdinės informacijos atsakymus pateikia arba įprastu būdu – trumpais referatais, arba mažo formato paveikslėliais. Jų dydis parenkamas taip, kad vaizdai būtų gerai apžiūrimi ir greitai siunčiami į ekraną. Patogu, kai didesnio formato vaizdai atsiveria kitame lange po vieną, todėl taip informaciją pateikia daugelis vaizdinės informacijos svetainių.
Nors vaizdinė informacija internete yra skelbiama tam ,kad ją pamatytų kuo daugiau žmonių, tačiau atvaizdų kopijavimas ir naudojimas yra ribotas. Labai didelis dėmesys skiriamas vaizdinės informacijos autorių teisių apsaugai. Beveik kiekviena vaizdinės informacijos paieškos svetainė primena, kad rasti atvaizdai yra saugomi autorių teisių. Dažniausiai paieškos įrankio šeimininkai nėra rastų atvaizdų autorių teisių savininkai, todėl naudojant vaizdinę informaciją būtina susipažinti, kas rašoma apie vaizdinės informacijos kopijavimą ir naudojimą.
Susipažinti su svetainėmis ir paieškos įrankiais, talkinančias ieškant vaizdų:

“Alta Vista – Image Search” (http://www.altavista.com/cgi-bin/query?mmdo=16&stype=simage)
“The Amazing Picture Machine” (http://www.ncrtec.org/picture.htm)
“Corbis – The Place for Pictures on the Internet” (http://www.corbis.com/)
“Lycos MultiMedia” (http://multimedia.lycos.com/)
“Google video” (http://video.google.com/)

Panaudota literatūra ir interneto šaltiniai:

1. “Paieška internete” – Aušra Vaškevičienė, Kaunas 2001
2. “Informatika. Laboratoriniai darbai” – KTU, 2002
3. “Daugialypė paieška” – Aušra Vaškevičienė
4. Interneto medžiaga:

http://internet.unib.ktu.lt/www/paieska_lietuv.htm

http://www.elnet.lt/vartiklis/internet/search/nr1.htm

http://www.ism.lt/vid.php3?mid=63〈=lt

http://www.ivpk.lt/msis/Default.aspx-lsn_page_view=73_7.htm

http://www.mamma.com/

http://www.metacrawler.com/

http://webmetasearch.com/

http://www.dogpile.com/

http://www.searchwiz.com/

Leave a Comment