IPS yra Informacijos paieškos sistemų paskirtis ir funkcijos
IPS yra Informacijos paieškos sistemų paskirtis ir funkcijos

Video: IPS yra Informacijos paieškos sistemų paskirtis ir funkcijos

Video: IPS yra Informacijos paieškos sistemų paskirtis ir funkcijos
Video: РЭРЗ | Ростовский электровозоремонтный завод (ГК «ЛокоТех») 2024, Balandis
Anonim

Šiuolaikiniam žmogui sunku įsivaizduoti gyvenimą be interneto ir beveik momentinės prieigos prie informacijos š altinių. Vartotojas retai susimąsto, kaip tinkle atliekama norimo turinio paieška. Bet tai labai įdomu.

Informacijos paieškos sistema (IPS) yra sudėtinga programinės ir techninės įrangos sistema, kuri parenka informaciją vartotojo prašymu. Informacija serveriuose saugoma skaitmeniniu pavidalu, kaip anksčiau bibliotekų lentynose buvo knygos. Sistema susideda iš daugelio posistemių. Kiekvienas atlieka savo užduotį apdorodamas vartotojo užklausą ir suteikdamas jam informaciją teksto ar garso forma. Spręstinų užduočių gausa lemia šiuolaikinių informacijos paieškos sistemų (informacijos paieškos sistemos santrumpa) architektūros sudėtingumą. Savotiška „juodoji dėžė“: įvestyje – užklausos tekstas, kas viduje – nežinomas, išvestyje – išsami informacija.

Kortelės failas realiame gyvenime
Kortelės failas realiame gyvenime

Įvesties srautai

Prašo informacijos, kurią asmuo formuoja teksto forma savo programėlės ekrane,sudaro nedidelę paieškos variklio apdorojamų užklausų dalį. Pagrindinius paieškos užklausų masyvus sudaro robotai, kurie priima žmogaus užklausą ir atlieka kelių žingsnių paiešką bei grįžtamąjį ryšį su vartotoju. Informacijos paieškos sistemose yra gerai žinomos „Google“, „Yandex“ir kitos, kasdien apdorojančios milijonus užklausų.

Š altinio paieškos objektai

Pradiniai paieškos objektai yra dokumentai, įrašai, vaizdo įrašai, vaizdai ir kt. Jie sukurti už IPS ribų. Bendrojoje informacijos saugojimo ir paieškos sistemoje turėtų būti integruota bibliografinė sistema – tam tikras katalogas, leidžiantis ieškoti bet kokių objektų.

Objektai arba jų skaitmeninės transformacijos tampa „įėjimo š altiniu“į IPS. Būtent tarp jų pasirenkama vartotojui reikalinga informacija.

Ieškokite informacijos
Ieškokite informacijos

Išoriniai š altiniai

Informacijos pasirinkimo rodinyje naudojami išoriniai žinių š altiniai. Tai yra informacija, kurios vartotojas ieško. Filmo pavadinimas, citata iš knygos ir kt. Norint atlikti paiešką kompiuteriu, ši informacija turi būti išversta į užklausą algoritmine kalba. IPS tai atliekama naudojant užklausų kūrimo, indeksavimo ir kūrimo bloką.

Idealiu atveju šie trys procesai – vaizdavimas, indeksavimas ir užklausų kūrimas – turėtų remtis identiškais žinių š altiniais, tačiau praktiškai tai neįmanoma.

Žinių š altiniai turėtų būti nuolat peržiūrimi ir atnaujinami, o naujinys turi būti identiškas irsinchronizuoti. O išorinis žinių š altinis visada chronologiškai pateikiamas prieš jo naudojimą paieškos sistemose užklausai, kartais kelerius metus.

Informacijos paieškos sistema
Informacijos paieškos sistema

Spektakliai

Pradiniai objektai yra sudaryti iš įvesties duomenų tam tikru deriniu arba transformuojami pagal konkrečios informacijos paieškos sistemos taisykles ir algoritmus.

Rodiniai yra daugiau ar mažiau pakeistos pradinio paieškos objekto kopijos. Neredaguotų pilnų tekstų rinkinyje kiekvienas tekstas yra savo paties reprezentacija. Muziejaus eksponatų ir artefaktų objektų kolekcijoje reprezentacija gali būti transformuotas objekto aprašymas su jo atvaizdu. Kai kuriais atvejais atvaizdavimas gali būti iš dalies kilęs iš originalaus objekto, o iš dalies iš aprašymo: bibliografinėse paieškos sistemose vaizdiniai išvedami iš objekto – pavyzdžiui, pavadinimas, autoriaus vardas bus derinamas su kūrinio anotacija.

Suraskite tai, ko jums reikia
Suraskite tai, ko jums reikia

Ieškomas indeksas

Kadangi informacija informacijos paieškos sistemose yra saugoma atvaizdavimo forma, logiška manyti, kad paieška atliekama pagal atvaizdą ir, pasirinkus, suteikiama vartotojui. Praktikoje taip nėra. Pavyzdžiui, dabartiniai internetinės bibliotekos katalogai paprastai apriboja paiešką iki kelių laukų: autoriaus, pavadinimo ir subtitrų rodinyje, kuriame yra kitų laukų, kuriuose neieškoma. Tai yra pakankama priežastis, kodėl būtina atskirtirodinys ir paieškos rodyklė, kuri yra rodinio paieškos dalis. Tai apibrėžia viską, ko reikia ieškoti. Indeksas, kuriame galima ieškoti, kaip ir rodinio ir š altinio objektas, gali būti padalytas į atskirus subindeksus, kad būtų galima atlikti tikslesnes, tikslines paieškas

Paieškos sistemos paprastai turi sintetinę struktūrą, kad atitiktų galiojančius paieškos rezultatus. Ši struktūra yra antrasis ieškomo indekso komponentas.

Procedūriniu požiūriu indeksavimo procesas gali būti įgyvendinamas įvairiais būdais: indeksą, kuriame galima ieškoti, galima gauti:

  • tiesiogiai nukopijuojamas ieškomas vaizdas;
  • nukopijuodami išsamią rodinio informaciją. Tai gali būti dalis arba visi rodiniai, kurie fiziškai egzistuoja tik kaip fragmentai, paskirstyti pagal paieškos indekso kūrimo taisykles, kurios bus renkamos prireikus.
Paieškos valdymas
Paieškos valdymas

Užklausų dizaino taisyklės ir oficialūs užklausos

Užklausos inžinerija yra funkcija, tarpininkaujanti tarp vartotojo užklausos ir oficialios užklausos. Jis pakeičia vartotojo užklausą, suderindamas ją su paieškos komandų žodynais, indekso specifikacija ir indeksu prieš nuskaitymą. IPS plėtros pradžioje šis vaidmuo tradiciškai buvo skiriamas kvalifikuotiems IT specialistams.

Kompiuterinių užklausų, kurios gali suderinti žodyno užklausas, kūrimas paieškos indeksų sistemoje, paprastai vadinamas „žodyno įvesties“moduliu. Šios funkcijos automatizavimas yra daug žadantis ir siūlo ekspertų ir tikimybinių paieškos metodų galimybes.

Oficiali užklausa tampa oficialia užklausa po to, kai naudotojo užklausa konvertuojama. Tokių formalių transformacijų pavyzdžiai yra sutrumpinimas, pakeitimas, normalizavimas, vektorizavimas ir kiti „išorinio“atvaizdavimo transformavimai į „vidinius“kompiuterio IPS (iššifravimo – informacijos paieškos sistemos) atvaizdus.

Išskirti dokumentų nuorodų rinkiniai

Gautas informacijos š altinių rinkinys logiškai yra rodinių, sukurtų pagal atitikties taisykles, taikomas formaliai užklausai pagal ieškomą indeksą, poaibis.

Paprastai, bet nebūtinai, yra atskiras atkurtos informacijos rinkinio rūšiavimo procesas. Internetinių bibliotekų katalogai paprastai pertvarko gautus rinkinius pagal autorių abėcėlės tvarka prieš rodydami. Informacijos paieškos sistemose, kurios sukuria griežtus reitingus, reitingavimo tvarka yra prieš bet kokį perskirstymą.

Duomenų analizė
Duomenų analizė

Išvesties srautai

Paieškos rezultatų išvedimas tradiciškai atliekamas ekrane, dažniau kaip objektų srautas, kuris bus naudojamas kitur ar kitais tikslais, užbaigia pagrindinę paieškos kilpą. Tokie srautai gali būti siunčiami į vizualizacijos įrenginius, saugoti tolesniam apdorojimui arba naudoti kaip įvesties srautus į kitas atrankos paslaugas.

Informacijos paieškos sistemos leidžia gauti grįžtamąjį ryšį išbet kurio atrankos proceso rezultatas. Bet kurio proceso rezultatas gali būti grįžtamasis ryšys kitiems procesams. Atsiliepimai gali būti eksperto sprendimo pagrindas bet kuriame etape.

Rekomenduojamas: