2024 Autorius: Howard Calhoun | [email protected]. Paskutinį kartą keistas: 2023-12-17 10:34
Šiuolaikiniam žmogui sunku įsivaizduoti gyvenimą be interneto ir beveik momentinės prieigos prie informacijos š altinių. Vartotojas retai susimąsto, kaip tinkle atliekama norimo turinio paieška. Bet tai labai įdomu.
Informacijos paieškos sistema (IPS) yra sudėtinga programinės ir techninės įrangos sistema, kuri parenka informaciją vartotojo prašymu. Informacija serveriuose saugoma skaitmeniniu pavidalu, kaip anksčiau bibliotekų lentynose buvo knygos. Sistema susideda iš daugelio posistemių. Kiekvienas atlieka savo užduotį apdorodamas vartotojo užklausą ir suteikdamas jam informaciją teksto ar garso forma. Spręstinų užduočių gausa lemia šiuolaikinių informacijos paieškos sistemų (informacijos paieškos sistemos santrumpa) architektūros sudėtingumą. Savotiška „juodoji dėžė“: įvestyje – užklausos tekstas, kas viduje – nežinomas, išvestyje – išsami informacija.
Įvesties srautai
Prašo informacijos, kurią asmuo formuoja teksto forma savo programėlės ekrane,sudaro nedidelę paieškos variklio apdorojamų užklausų dalį. Pagrindinius paieškos užklausų masyvus sudaro robotai, kurie priima žmogaus užklausą ir atlieka kelių žingsnių paiešką bei grįžtamąjį ryšį su vartotoju. Informacijos paieškos sistemose yra gerai žinomos „Google“, „Yandex“ir kitos, kasdien apdorojančios milijonus užklausų.
Š altinio paieškos objektai
Pradiniai paieškos objektai yra dokumentai, įrašai, vaizdo įrašai, vaizdai ir kt. Jie sukurti už IPS ribų. Bendrojoje informacijos saugojimo ir paieškos sistemoje turėtų būti integruota bibliografinė sistema – tam tikras katalogas, leidžiantis ieškoti bet kokių objektų.
Objektai arba jų skaitmeninės transformacijos tampa „įėjimo š altiniu“į IPS. Būtent tarp jų pasirenkama vartotojui reikalinga informacija.
Išoriniai š altiniai
Informacijos pasirinkimo rodinyje naudojami išoriniai žinių š altiniai. Tai yra informacija, kurios vartotojas ieško. Filmo pavadinimas, citata iš knygos ir kt. Norint atlikti paiešką kompiuteriu, ši informacija turi būti išversta į užklausą algoritmine kalba. IPS tai atliekama naudojant užklausų kūrimo, indeksavimo ir kūrimo bloką.
Idealiu atveju šie trys procesai – vaizdavimas, indeksavimas ir užklausų kūrimas – turėtų remtis identiškais žinių š altiniais, tačiau praktiškai tai neįmanoma.
Žinių š altiniai turėtų būti nuolat peržiūrimi ir atnaujinami, o naujinys turi būti identiškas irsinchronizuoti. O išorinis žinių š altinis visada chronologiškai pateikiamas prieš jo naudojimą paieškos sistemose užklausai, kartais kelerius metus.
Spektakliai
Pradiniai objektai yra sudaryti iš įvesties duomenų tam tikru deriniu arba transformuojami pagal konkrečios informacijos paieškos sistemos taisykles ir algoritmus.
Rodiniai yra daugiau ar mažiau pakeistos pradinio paieškos objekto kopijos. Neredaguotų pilnų tekstų rinkinyje kiekvienas tekstas yra savo paties reprezentacija. Muziejaus eksponatų ir artefaktų objektų kolekcijoje reprezentacija gali būti transformuotas objekto aprašymas su jo atvaizdu. Kai kuriais atvejais atvaizdavimas gali būti iš dalies kilęs iš originalaus objekto, o iš dalies iš aprašymo: bibliografinėse paieškos sistemose vaizdiniai išvedami iš objekto – pavyzdžiui, pavadinimas, autoriaus vardas bus derinamas su kūrinio anotacija.
Ieškomas indeksas
Kadangi informacija informacijos paieškos sistemose yra saugoma atvaizdavimo forma, logiška manyti, kad paieška atliekama pagal atvaizdą ir, pasirinkus, suteikiama vartotojui. Praktikoje taip nėra. Pavyzdžiui, dabartiniai internetinės bibliotekos katalogai paprastai apriboja paiešką iki kelių laukų: autoriaus, pavadinimo ir subtitrų rodinyje, kuriame yra kitų laukų, kuriuose neieškoma. Tai yra pakankama priežastis, kodėl būtina atskirtirodinys ir paieškos rodyklė, kuri yra rodinio paieškos dalis. Tai apibrėžia viską, ko reikia ieškoti. Indeksas, kuriame galima ieškoti, kaip ir rodinio ir š altinio objektas, gali būti padalytas į atskirus subindeksus, kad būtų galima atlikti tikslesnes, tikslines paieškas
Paieškos sistemos paprastai turi sintetinę struktūrą, kad atitiktų galiojančius paieškos rezultatus. Ši struktūra yra antrasis ieškomo indekso komponentas.
Procedūriniu požiūriu indeksavimo procesas gali būti įgyvendinamas įvairiais būdais: indeksą, kuriame galima ieškoti, galima gauti:
- tiesiogiai nukopijuojamas ieškomas vaizdas;
- nukopijuodami išsamią rodinio informaciją. Tai gali būti dalis arba visi rodiniai, kurie fiziškai egzistuoja tik kaip fragmentai, paskirstyti pagal paieškos indekso kūrimo taisykles, kurios bus renkamos prireikus.
Užklausų dizaino taisyklės ir oficialūs užklausos
Užklausos inžinerija yra funkcija, tarpininkaujanti tarp vartotojo užklausos ir oficialios užklausos. Jis pakeičia vartotojo užklausą, suderindamas ją su paieškos komandų žodynais, indekso specifikacija ir indeksu prieš nuskaitymą. IPS plėtros pradžioje šis vaidmuo tradiciškai buvo skiriamas kvalifikuotiems IT specialistams.
Kompiuterinių užklausų, kurios gali suderinti žodyno užklausas, kūrimas paieškos indeksų sistemoje, paprastai vadinamas „žodyno įvesties“moduliu. Šios funkcijos automatizavimas yra daug žadantis ir siūlo ekspertų ir tikimybinių paieškos metodų galimybes.
Oficiali užklausa tampa oficialia užklausa po to, kai naudotojo užklausa konvertuojama. Tokių formalių transformacijų pavyzdžiai yra sutrumpinimas, pakeitimas, normalizavimas, vektorizavimas ir kiti „išorinio“atvaizdavimo transformavimai į „vidinius“kompiuterio IPS (iššifravimo – informacijos paieškos sistemos) atvaizdus.
Išskirti dokumentų nuorodų rinkiniai
Gautas informacijos š altinių rinkinys logiškai yra rodinių, sukurtų pagal atitikties taisykles, taikomas formaliai užklausai pagal ieškomą indeksą, poaibis.
Paprastai, bet nebūtinai, yra atskiras atkurtos informacijos rinkinio rūšiavimo procesas. Internetinių bibliotekų katalogai paprastai pertvarko gautus rinkinius pagal autorių abėcėlės tvarka prieš rodydami. Informacijos paieškos sistemose, kurios sukuria griežtus reitingus, reitingavimo tvarka yra prieš bet kokį perskirstymą.
Išvesties srautai
Paieškos rezultatų išvedimas tradiciškai atliekamas ekrane, dažniau kaip objektų srautas, kuris bus naudojamas kitur ar kitais tikslais, užbaigia pagrindinę paieškos kilpą. Tokie srautai gali būti siunčiami į vizualizacijos įrenginius, saugoti tolesniam apdorojimui arba naudoti kaip įvesties srautus į kitas atrankos paslaugas.
Informacijos paieškos sistemos leidžia gauti grįžtamąjį ryšį išbet kurio atrankos proceso rezultatas. Bet kurio proceso rezultatas gali būti grįžtamasis ryšys kitiems procesams. Atsiliepimai gali būti eksperto sprendimo pagrindas bet kuriame etape.
Rekomenduojamas:
Paieškos grupė „Lisa Alert“: kodėl ji taip vadinama?
Savanoriai, dalyvavę Lizos Fomkinos paieškoje 2010 m. rugsėjo 24 d., buvo šokiruoti to, kas nutiko. Tą pačią dieną jie suorganizavo savanorių paieškos būrį „Liza Alert“. Kodėl jis taip vadinamas, žino kiekvienas šio judėjimo dalyvis
Kas yra informacijos verslas? Informacinis verslas nuo A iki Z
Šiandien informacijos verslas pelnytai laikomas pagrindiniu visuomenės vystymosi š altiniu. Leiskite mums išsamiai apsvarstyti, kaip ir kuo ši veikla grindžiama
Apskaita yra Informacijos apibendrinimo proceso ypatumai
Apskaita yra ūkio objektų ir procesų valdymo elementas. Jos esmė – įvykių ir faktų parametrų ir statuso fiksavimas, informacijos rinkimas, apibendrinimas, kaupimas ir jos atspindėjimas atitinkamuose teiginiuose. Buh alterinė apskaita vykdoma įvairiose veiklos srityse
Informacijos ir nuorodų sistema: tipai ir pavyzdžiai. Kas yra informacijos ir nuorodų sistema?
Informacijos sklaida, tolesnis jos rinkimas ir apdorojimas šiuolaikinėje visuomenėje vyksta dėl ypatingų išteklių: žmogiškųjų, finansinių, techninių ir kitų. Tam tikru momentu šie duomenys surenkami vienoje vietoje, susisteminami pagal iš anksto nustatytus kriterijus, sujungiami į specialias patogias naudoti duomenų bazes
Informacijos srautai logistikoje yra Sąvoka ir klasifikacija, charakteristikos ir pavyzdžiai
Informacinė logistika susijusi su duomenų srautų, lydinčių materialines vertybes jų judėjimo procese, organizavimu. Tai leidžia susieti tiekimą, gamybą ir pardavimą. Informacijos srautai logistikoje yra įrankis, skirtas produkcijos judėjimo ir sandėliavimo procesams valdyti