MOKYMO KURSAS INFORMACINIS RAŠTINGUMAS DUOMENŲ ARCHYVO VARTOJIMUI

Similar documents
75 Atspaudas/Offprint Patrauklios kaimo aplinkos išsaugojimas ir formavimas Sargeliai: Kruenta ISBN

Style and Harmony of Urban Green Space Landscape

PSICHOLOGINIAI VIEŠŲJŲ RYŠIŲ ASPEKTAI

MOKYKLŲ TYRIMAS: INFORMACINĖS IR KOMUNIKACINĖS TECHNOLOGIJOS (IKT) ŠVIETIME

Bendrieji Europos kalbų mokymosi, mokymo ir vertinimo. metmenys

Europos ekonomikos ir socialinių reikalų komitetas. Europos ekonomikos ir socialinių reikalų komiteto NUOMONĖ

Kultūros paveldo ir lituanistinių mokslo duomenų skaitmeninimas Lietuvoje: 2011 metų situacija *

MAGISTRO DARBO RAŠYMO METODIKA

INTERNETO PASLAUGŲ KOKYBĖS VERTINIMO YPATUMAI PECULIARITIES OF QUALITY ASSESSMENT OF INTERNET SERVICES

Bakalauro studijų darbų rengimo METODINĖS REKOMENDACIJOS

ALYTAUS KOLEGIJA AK SAVARANKIŠKŲ IR BAIGIAMŲJŲ DARBŲ RENGIMO METODINIAI REIKALAVIMAI

MOKYMOSI PAGALBOS GAIRĖS

Visuomenės sveikatos programų vertinimas

Veiklos taisyklių specifikavimo šablonais metodika ir jų manipuliavimo tyrimas Magistro tezės

MOKYKLOS INFORMACINĖ SISTEMA KAIP MOKYKLOS VALDYMO ĮRANKIS

Internete esančių duomenų apsauga

DUOMENŲ BAZIŲ PROJEKTAVIMAS

TARK SAVO ŽODĮ! Peržiūrėtos Europos chartijos dėl jaunimo dalyvavimo vietos ir regioniniame gyvenime vadovas

LIETUVOS RESPUBLIKOS VALSTYBĖS KONTROLĖ INFORMACINIŲ SISTEMŲ AUDITO VADOVAS. Lietuvos Respublikos valstybės kontrolė

LIETUVOS ŽEMĖS ŪKIO UNIVERSITETAS. Ekonomikos ir vadybos fakultetas

Farmakologinio budrumo rizikos vertinimo komiteto (PRAC) viešųjų svarstymų rengimo ir eigos taisyklės

GEROS PAMOKOS RECEPTAI

ILGALAIKIO MATERIALIOJO TURTO KOMPLEKSINĖS ANALIZĖS METODIKA

BAIGIAMOJO DARBO RENGIMO METODINIAI NURODYMAI

RIZIKOS VERTINIMAS EKSTREMALIŲ SITUACIJŲ VALDYME

POLITIKOS GAIRĖS INKLIUZINIAM ŠVIETIMUI DIEGTI. Rodiklių parengimo iššūkiai ir galimybės

INFORMACIJA IR VEIKLA, SUSIJUSI SU DIDŽIAISIAIS DUOMENIMIS

Lietuvos erdvinės informacijos infrastruktūra Lietuvos erdvinės informacijos portalas

2014 m. balandžio 15 d. bendrasis pranešimas dėl juodai baltų prekių ženklų apsaugos apimčiai taikomos bendrosios praktikos

Jolanta Balčiūnaitė INTERAKTYVIŲ TECHNOLOGIJŲ TAIKYMAS DĖSTANT FIZIKĄ ŽEMESNĖSE KLASĖSE. Magistro darbas

MAGISTRO DARBO RAŠYMO METODINIAI NURODYMAI

Virginija Limanauskienė Kęstutis Motiejūnas. PrograMinės įrangos diegimo

Ne pelno organizacijos ir jų reglamentavimas. I. Ne pelno organizacijų samprata ir reglamentavimo pagrindai

ESENER įmonių apklausa: saugos ir sveikatos darbe valdymo, psichosocialinės rizikos ir darbuotojų dalyvavimo reikšmės supratimas

Šeimų savigalbos grupių veikla socialinio kapitalo perspektyvoje

PRANEŠIMAS APIE LAISVĄ DARBO VIETĄ REZERVO SĄRAŠUI SUDARYTI

Pasiekimų vertinimo sistemų ir pažymių pervedimo praktikos analizė

TURINYS. 2 / Liudmila Rupšienė Kokybinio tyrimo duomenų rinkimo metodologija / 3. Pratarmė / 5

TAUTINIŲ MAŽUMŲ APSAUGA KAIP POZITYVIOS DISKRIMINACIJOS PAVYZDYS

Sulietuvintos organizacijos valdymo sistemos Oracle PeopleSoft tyrimas

Recenzentai: prof. dr. Irena Bakanauskienė prof. dr. Nijolė Petkevičiūtė

Socialinio tyrimo terminija:

KOMISIJOS KOMUNIKATAS EUROPOS PARLAMENTUI, TARYBAI, EUROPOS EKONOMIKOS IR SOCIALINIŲ REIKALŲ KOMITETUI IR REGIONŲ KOMITETUI

AGENDA8 / Universitetai ir kolegijos Lietuvoje: kas jie tokie?

N LIGONINĖS MEDICINOS PERSONALO POŽIŪRIO Į KOMANDINĮ DARBĄ VERTINIMAS

KAUNO TECHNOLOGIJOS UNIVERSITETAS INFORMATIKOS FAKULTETAS PRAKTINĖS INFORMATIKOS KATEDRA

BAIGIAMOJO RAŠTO DARBO RENGIMO METODINIAI NURODYMAI

Reikšmingo iškraipymo rizikos nustatymas ir įvertinimas susipažįstant su įmone ir jos aplinka

Serija: Intelektinė nuosavybė verslui KURIANT ATEITĮ. Įvadas į patentus smulkioms ir vidutinėms įmonėms

Flexible Product Drying System Design and Application

INOVATYVIŲ MOKYMO (-SI) METODŲ IR IKT TAIKYMAS I KNYGA

MEDIJŲ IR INFORMACINIS RAŠTINGUMAS LIETUVOJE: LAIKAS KEISTI POŽIŪRĮ?

Bendruomenės inicijuotos vietos plėtros gairės vietos subjektams

T-Kit Nr. 10 Ugdomasis vertinimas darbo su jaunimu srityje

TYRIMO ATASKAITA PROTŲ NUTEKĖJIMO MAŽINIMAS IR PROTŲ SUSIGRĄŽINIMAS

INFORMACINĖS SISTEMOS MEDICINOJE

KAUNO TECHNOLOGIJOS UNIVERSITETAS DINAMINIŲ INOVACINIŲ GEBĖJIMŲ VYSTYMAS SMULKAUS VIDUTINIO DYDŽIO ORGANIZACIJOJE: ATVEJO ANALIZĖ

Skolos bijosi turtų nepadarysi. Leksikos skolinimosi poreikiai ir polinkiai m. rašytiniuose tekstuose

APP Inventor. Piešimo aplikacija

PRANEŠIMAS APIE GERĄJĄ PATIRTĮ

KOKYBĖS VADYBOS DIEGIMAS ORGANIZACIJOJE: ŽMOGIŠKASIS ASPEKTAS

VILNIAUS UNIVERSITETO EKONOMIKOS FAKULTETOS APSKAITOS IR AUDITO KATEDRA. Bakalauro studijų profesinės praktikos įforminimo ir gynimo tvarka

KAUNO TECHNOLOGIJOS UNIVERSITETAS EKONOMIKOS IR VERSLO FAKULTETAS MAGISTRO DARBAS

NEGALIOS ĮTAKA SPORTUOJANČIŲ ASMENŲ GYVENIMO KOKYBĖS FIZINEI SRIČIAI

MOKYKLŲ SAVĘS VERTINIMAS: PROCESAS IR DUOMENŲ PANAUDOJIMAS

KAUNO TECHNOLOGIJOS UNIVERSITETAS INFORMATIKOS FAKULTETAS KOMPIUTERIŲ TINKLŲ KATEDRA

LIETUVOS STANDARTAS LST EN ISO /AC PATAISA AC

KAIP PRAKTIŠKAI ĮGYVENDINTI STRATEGINIUS PLANUS

Jaunų žmonių grąžinimas į visuomenę

Reikalavimai Skandinavistikos centre rašomiems mokslo (projektiniams, bakalauro, gretutinės specialybės projekto, magistro) darbams

Europos produktyviojo mokymosi institutas m. sausis. Produktyvusis mokymasis kas tai yra? Įvadas

ŠIAULIŲ UNIVERSITETAS EDUKOLOGIJOS FAKULTETAS BAIGIAMŲJŲ (BAKALAURO, MAGISTRANTŪROS STUDIJŲ) DARBŲ RENGIMO METODINIAI REIKALAVIMAI

Inga Milišiūnaitė Jolita Butkienė Inga Juknytė-Petreikienė Viktoras Keturakis Daiva Lepaitė

II. SOCIALINIO DARBO TEORIJA IR PRAKTIKA

INOVATYVIŲ MOKYMO (-SI) METODŲ IR IKT TAIKYMAS II KNYGA

Naujų kaimo plėtros programų sėkmės veiksniai

EKONOMIKOS IR INFORMATIKOS TERMINIJOS YPATUMAI

N{OKYfOJO VAIDMENS PROBLEMA P.EDEUfOLOGIJO.JE. Kaz.ys Poškus

VERTYBĖS IR KULTŪRINIS INDENTITETAS KOMUNIKACIJOS KONTEKSTE

VILNIAUS KOLEGIJA. Violeta BALTRŪNIENĖ Olga BUCKIŪNIENĖ Nijolė KAŠĖTIENĖ Irena PAŽĖRIENĖ STUDIJŲ DARBŲ RENGIMO METODINIAI NURODYMAI

VILNIAUS UNIVERSITETAS EKONOMIKOS FAKULTETAS VADYBOS KATEDRA. Indrė PATAPIENĖ Kokybės vadybos programa

MOKYKLŲ FIZINĖS APLINKOS IR UGDYMO NUOSTATŲ SĄSAJŲ TYRIMAI

Kalbos mokymosi metodologija T- kit as

DALYKŲ INTEGRACIJA MUZIKINIAME UGDYME

GENERATIONES. Edition 17

Eksporto plėtra į Skandinaviją. Eksporto partnerių paieška ir ryšių užmezgimas bei palaikymas

KAUNO TECHNOLOGIJOS UNIVERSITETAS EKONOMIKOS IR VERSLO FAKULTETAS ŽAIDYBINIMO IR MORALINIO ORGANIZACIJOS KLIMATO SĄSAJOS MAGISTRO DARBAS

Netradicinės mokyklos organizavimo alternatyvos

VIETOS VEIKLOS GRUPIŲ VADYBOS, ĮGYVENDINANT VIETOS PLĖTROS STRATEGIJAS, STIPRINIMAS

PRIVATAUS GYVENIMO RIBOJIMAS ELEKTRONINIŲ RYŠIŲ SRITYJE NUSIKALTIMŲ TYRIMO TIKSLAIS: PROBLEMOS IR GALIMI SPRENDIMAI

LIETUVIŲ KALBOS GRAMATIKOS INFORMACINĖ SISTEMA: I MORFOLOGIJA

ASMENŲ SU FIZINE JUDĖJIMO NEGALIA SOCIALINĖ INTEGRACIJA LIETUVOJE: PADĖTIES ANALIZĖ

Tekstas neredaguotas Medžiagą parengė Nijolė Grybovienė. Pažinimo ir asmeninės kompetencijų ugdymo pavyzdžiai

ASMENINIŲ IR ORGANIZACINIŲ VERTYBIŲ SĄSAJOS LIETUVOS ĮMONĖSE

EKONOMINĖS IR KULTŪRINĖS VERTYBĖS: PANAŠUMAI IR SKIRTUMAI

ŪKININKŲ KONSULTAVIMO METODŲ PASIRINKIMĄ LEMIANČIOS SĄLYGOS

Naujausių informacinių technologijų naudojimas švietime

Ugdymo turinio kaita: kas lemia sėkmę?

Virtualus bendravimo ir informacinių bei kompiuterinių technologijų mokymosi portalas žmonėms su negalia. ViPi vadovas.

Mokinių specialiųjų poreikių, pasiekimų ir pažangos vertinimas inkliuzinėje aplinkoje Pagrindiniai strategijos ir praktikos klausimai

Transcription:

EUROPOS SĄJUNGA Europos socialinis fondas KURKIME ATEITĮ DRAUGE! Projektas Empirinių duomenų ir informacijos HSM tyrimams kaupimas ir valdymas : Lietuvos HSM duomenų archyvas (LiDA) SFMIS Nr. BPD2004-ESF-2.5.0-03-05/0042 MOKYMO KURSAS INFORMACINIS RAŠTINGUMAS DUOMENŲ ARCHYVO VARTOJIMUI KAUNAS, 2008

Autorė: Marija Prokopčik Autorė dėkoja kolegėms Jūratei Kuprienei ir dr. Reginai Varnienei už pagalbą rengiant mokomąją medžiagą 2

Turinys ĮVADAS... 4 1. NATŪRALIŲ IR KONTROLIUOJAMŲ KALBŲ SAMPRATA, JŲ PRIVALUMAI, TRŪKUMAI IR GALIMYBĖS INFORMACIJOS TVARKYBOS IR IEŠKOS POŽIŪRIU... 5 NATŪRALIŲ IR KONTROLIUOJAMŲ KALBŲ SAMPRATA... 5 NATŪRALIŲ KALBŲ TRŪKUMAI INFORMACIJOS TVARKYBOS IR IEŠKOS POŽIŪRIU... 6 REIKALAVIMAI IPK IR JŲ REALIZAVIMO PRIEMONĖS... 8 KONTROLIUOJAMOS (DIRBTINĖS) KALBOS... 9 SVARBIAUSIOS DOKUMENTŲ KLASIFIKACIJOS... 10 2. DALYKINĖ TEMINĖ DOKUMENTŲ ANALIZĖ IR INDEKSAVIMO PROCESAS... 18 3. KONTROLIUOJAMI ŽODYNAI. TEZAURAI, KAIP LEKSIKOGRAFINĖS KONTROLĖS UŽTIKRINIMO PRIEMONĖ... 26 TEZAURAI, JŲ PASKIRTIS IR FUNKCIJOS... 26 TEZAURŲ STRUKTŪRA IR FIKSUOJAMI SANTYKIAI... 28 TEZAURŲ RENGIMAS IR VERTINIMAS... 30 4. SVARBIAUSI HUMANITARINIŲ IR SOCIALINIO MOKSLŲ SRITIES TEZAURAI... 32 INFORMACIJOS TVARKYMUI IR PAIEŠKAI DUOMENŲ ARCHYVUOSE NAUDOJAMI HSM SRITIES TEZAURAI... 38 LIDA TEZAURAS... 41 5. METADUOMENYS. METADUOMENŲ SCHEMOS IR ELEMENTŲ RINKINIAI. EMPIRINIŲ DUOMENŲ APRAŠYMO STANDARTAS IR JO TAIKYMAS ARCHYVO REIKMĖMS.... 48 LIDA IR LINGVISTINIS APRŪPINIMAS... 48 LIDA ARCHYVAS... 53 METADUOMENYS... 57 DUBLIN CORE METADUOMENŲ INICIATYVA... 60 DDI... 62 LIDA METADUOMENŲ SĄSAJA SU BIBLIOTEKŲ KATALOGŲ ĮRAŠAIS... 63 EMPIRINIŲ DUOMENŲ APRAŠYMO STANDARTAS IR JO TAIKYMAS ARCHYVO REIKMĖMS... 66 LIDA PRIEIGA IR METADUOMENŲ PERŽIŪRA... 69 KITI ARCHYVAI IR DUOMENŲ RINKINIŲ PERŽIŪRA... 84 NAUDOTOS LITERATŪROS IR ŠALTINIŲ SĄRAŠAS:... 86 SANTRUMPŲ SĄRAŠAS:... 89 6. PRIEDAS. MOKYMO KURSO SKAIDRĖS 3

Įvadas Duomenų tvarkymas ir jų paieška socialinės ir humanitarinės srities duomenų archyvuose reikalauja atitinkamų teorinių žinių ir praktinių įgūdžių. Lietuvos socialinių ir humanitarinių mokslų tyrinėtojai, kurie yra potencialūs LiDA kūrėjai ir naudotojai, neturi pakankamų šios srities žinių ir praktinių įgūdžių, neturi patirties naudojant tezaurų tipo kontroliuojamus žodynus, rengiant ir tvarkant metaduomenis. Mokymo kursas,,informacinis raštingumas duomenų archyvo vartojimui skirtas socialinių ir humanitarinių mokslų duomenų vartotojams ekspertams, doktorantams, pedagogams, dėstytojams, mokslininkams ir kitiems.tyrėjams. Mokymų medžiagos rengimo tikslas yra suteikti teorinių žinių ir praktinių įgūdžių, būtinų HSM duomenų organizavimui ir jų paieškai; supažindinti su pagrindinėmis informacijos paieškos kalbomis, jų organizavimo būdais ir priemonėmis, HSM duomenų analize ir indeksavimo procesais, kontrolės žodynais, visų pirma, tezaurais ir svarbiausiomis metaduomenų schemomis; ugdyti gebėjimus naudotis archyvavimo reikmėms parengtu lietuvišku HSM tezauru ir empirinių duomenų aprašymo standartu. Mokymo kurso medžiagą sudaro šie skyriai: natūralių ir kontroliuojamų kalbų samprata, jų privalumai, trūkumai ir galimybės informacijos tvarkybos ir ieškos požiūriu; dalykinė teminė dokumentų analizė ir indeksavimo procesas; kontroliuojami žodynai :tezaurai, kaip leksikografinės kontrolės užtikrinimo priemonė; svarbiausi HSM srities tezaurai, HSM tezauro lietuvių kalba naudojimas archyvo reikmėms; metaduomenys, metaduomenų schemos ir elementų rinkiniai, empirinių duomenų aprašymo standartas ir jo taikymas archyvo reikmėms. Šiuose skyriuose medžiaga yra pristatoma nuosekliai derinant teorines žinias ir siekiant formuoti praktinius įgūdžius. Kiekviena tema pradedama nuo atitinkamos tematikos terminų pristatymo, apibrėžimų, medžiagos, kuri reikalinga aptariamos problematikos supratimui. Praktinėje dalyje pateikiami konkretūs pavyzdžiai, pristatomos analizuojamų priemonių rengimo ir taikymo galimybės organizuojant HSM informaciją archyve ir vykdant jos paiešką. 4

1. Natūralių ir kontroliuojamų kalbų samprata, jų privalumai, trūkumai ir galimybės informacijos tvarkybos ir ieškos požiūriu Informacijos tvarkymas ir jos ieška siejama su informacijos organizavimu. Organizuodami informaciją, mes ją grupuojame, klasifikuojame, kategorizuojame, t.y. jungiame į klases, grupes, kategorijas. Informacija organizuojama tam, kad būtų galima surasti mus dominančius objektus, informaciją apie juos. Kitas svarbus informacijos organizavimo rezultatas galimybė išsaugoti ją ateities kartoms. Mūsų objektas informacija saugoma archyvuose, bibliotekose ar muziejuose, kitose panašiose talpyklose, t.y. kalbama apie informaciją, kuri užfiksuota tam tikrose laikmenose (o jeigu virtuali, tai tam tikru būdu apipavidalinta). Būtent šią informaciją informacijos vienetus, informacijos paketus (angl. Information packages), - tai turbūt tiksliausias tinklalapio apibūdinimas, turime organizuoti taip, kad ją būtų kiek galint paprasčiau surasti. Informacijos vienetus galima organizuoti pagal formalius požymius autorius, antraštę, ISBN ar ISSN numerį, leidimo, vietą, metus, formą. Kita galimybė - šių informacijos vienetų organizavimas pagal jų turinį išskiriant temą, dalyką, objektą, t.y. atliekant jų intelektualaus turinio analizę. Kiekvieno informacijos vieneto dalykinė (teminė) analizė susijusi su jo intelektualiojo turinio nustatymu (apie ką yra informacijos vienetas, jo,,apie-ybė angl. aboutness), atitinkamų,,apie-ybę nusakančių sąvokų pasirinkimu,,įžodinimu ir šių sąvokų išreiškimu konkrečios informacijos paieškos kalbos (toliau IPK) terminais. Natūralios kalbos (toliau NK) žodžiai tuo būdu išverčiami į IPK terminus. Bendriausiu atveju IPK gali būti dvejopos linijinės hierarchinės struktūros IPK (nuo plačiausios prie siauriausios sąvokos nuo bendro prie specifinio) hierarchinės klasifikacijos ir žodinės abėcėlinės IPK, kur terminai (panašūs į NK žodžius) dėstomi abėcėlės seka. Natūralių ir kontroliuojamų kalbų samprata Akivaizdu, kad ne vienam kyla klausimas, kam reikalingos IPK, jeigu dabar paieška pagal dalyką tapo pagrindiniu informacijos radimo būdu ir ieškodami informacijos vartotojai masiškai naudoja NK. Kita vertus nors internete masiškai naudojama paieška pagal natūralios kalbos žodžius formuluojamus kaip reikšminiai žodžiai, didžiuliai nerelevančios informacijos kiekiai netenkina 5

daugelio vartotojų. Akivaizdu, kad didėjant pasiekiamos informacijos kiekiui vien paieškos pagal RŽ nepakanka. Daugelis žodžių, o anglų kalboje, kurią taip dažnai naudojame informacijos paieškai, beveik visi turi daugiau negu vieną prasmę ar reikšmę, o šios dar po kelis niuansus. Daugelis žodžių gali būti daiktavardžiai, veiksmažodžiai, būdvardžiai, prieveiksmiai. Paieškos sistemos, kurios tariamai leidžia vartotojui naudoti,,natūralią kalbą, iki šiol nesugeba atskirti visų reikšmių ar kalbos dalių, ypač kai kalbama apie plačias universalias sistemas. Tam tikrų pasiekimų yra siauresnėse sistemose. Kita problema tai, kad autoriai, rašantys apie tuos pačius dalykus naudoja skirtingus žodžius jiems įvardinti, o tų pačių dalykų ieškantys žmonės neranda reikiamų žodžių jiems pavadinti. Yra atlikta daugybė tyrimų, skirtų indeksavimo nuoseklumo reiškiniui. Koks bebūtų tokių tyrimų tikslas ir rezultatai, visi jie parodė, kad tai pačiai sąvokai išreikšti žmonės dažnai pasirenka skirtingus žodžius, t.y. indeksavimui būdingas nenuoseklumas. Tokia situacija rodo, kad norint suderinti visus žodžius, kuriuos būtų galima naudoti sąvokai išreikšti ir parodyti visas įmanomas tam tikro žodžio reikšmes, reikalinga tam tikra dirbtinė struktūra informacijos paieškos kalba, kuri paprastai naudojama kaip kontroliuojamas žodynas. IPK - dirbtinė kalba, skirta dokumentų ir užklausų turiniui išreikšti ir fiksuoti informacijos paieškos sistemoje (toliau IPS). Natūralių kalbų trūkumai informacijos tvarkybos ir ieškos požiūriu Natūrali kalba (kaip informacijos fiksavimo priemonė inf. tvarkymo ir ieškos požiūriu) turi trūkumų, kuriuos leidžia pašalinti arba apriboti IPK ir jų žodynų naudojimas. Pagrindinė trūkumų priežastis tai, kad NK turinys ir išraiškos priemonės nėra tapatūs: vienas turinys kelios išraiškos formos. NK, viena vertus, būdingas - gausumas (įvairumas, perteklius), kita vertus, yra situacijų, kai NK priemonių nepakanka tam tikrai sąvokai išreikšti. Gausumas Sinonimai Sinonimai (gr. synonymos- bendravardis) skirtingai skambantys, bet tą pačią arba artimą prasmę turintys žodžiai, žodžių formos, junginiai. Absoliučių sinonimų (kiškis zuikis) nėra daug, tačiau daug diferencinių (kalbėti byloti, kampas- kertė), dar daugiau žodžių tampa sinonimais tam tikrame kontekste. Taigi tekstų autoriai turi galimybę rinktis įvairius žodžius, žodžių junginius tai 6

pačiai sąvokai išreikšti. Todėl rengiant kontroliuojamus žodynus taip svarbu nustatyti visus sinonimus ir apjungti juos po vienu pavadinimu. Ar,,drabužiai,,,drapanos,,,apdaras,,,apranga reiškia tą patį dalyką? Jeigu ne tą patį, ar jų skirtumai tokie ryškūs, kad kiekvieną jų būtų galima laikyti atskiru leksiniu vienetu? Svarbu nustatyti ir tą, kuris geriausiai žinomas numatomam vartotojui. Kita vertus toks pasirinkimas paprastai priklauso nuo rengėjo. Žodžių formos Vystantis kalbai terminai, kuriuos žymi keli žodžiai, susilieja į vieną (pvz., on line; on-line; online). Kartais gali būti naudojamos visos trys formos. Dar vienas žodžių formų įvairovės pvz., yra britų ir amerikiečių rašybos būdai (catalog ir catalogue, colour ir color). Prielinksniai gali iš esmės pakeisti žodžio reikšmę: lygybė nelygybė, ginklavimasis ir nusiginklavimas. Paprastai kontroliuojamuose žodynuose nėra prasmės naudoti abi sąvokas, nes jos dažniausiai nagrinėjamos tik drauge. Svarbiausias žodžių formų skirtumas tai - vienaskaita ir daugiskaita. Taisyklės, kurią formą naudoti nėra. Paprastai laikoma, kad daugiskaita suponuoja platesnę sąvokos apimtį (pvz., geriau knygos, o ne knyga), kita vertus, daugiskaita ir vienaskaita gali turėti skirtingas reikšmes (menas ir menai) Santrumpos ir akronimai Santrumpos ir akronimai tradiciškai yra iššifruojami arba ne priklausomai nuo jų paplitimo, numatomų vartotojų ir jų žinių. Dėl globalus paieškos pobūdžio numatyti visus galimus vartotojus sudėtinga, todėl paprastai santrumpas ir akronimus reikėtų iššifruoti. Net visuotinai žinomas akronimas AIDS ispanų kalba yra SIDA. Tikslūs (specifiški) ir bendrieji terminai Tai pačiai sąvokai išreikšti galime naudoti tikslius (adekvačius) terminus arba bendruosius (apibendrinančius). Pavyzdžiui, Katės kabutės nelietuviškos yra ir kitose teksto vietose yra bendresnis terminas, negu Kačių veislės,,,kačių veislės bendresnis negu Siamo katės, o,,mėlynosios Siamo katės dar tikslesnis. Pvz., JAV Kongreso bibliotekos rubrikų sąraše (angl. Library of Congress Subject Headings) tiksliausias terminas -,,Siamo katės, o mažesnėms viešosioms bibliotekoms skirtame Sears rubrikyne (angl. SEARS list of subject headings),,katės, nors yra nuoroda, kad esant reikalui galima sukurti terminą konkrečiai kačių veislei. Lietuvos M. Mažvydo nacionalinės bibliotekos rubrikyne yra tik vienas terminas,,katės. 7

Spendimą apie tikslumą lemia informacijos išteklių pobūdis ir apimtis, vartotojų tipas. Jeigu fondas universalus pakanka termino,,katės, jeigu siauresnis galima naudoti tikslesnį terminą. Visuotinai paplitę /populiarūs terminai ir specialūs terminai Kai sąvoką galima išreikšti specialiu ir techniniu terminu, žodyno rengėjai turi nuspręsti, kuri forma tinkamesnė. Paprastai specialistams skirtame žodyne bus naudojamas specialus terminas, pvz., navikas, neoplazma, o bendros paskirties žodyne bus taikomas paplitęs terminas, pvz. vėžys. Kita vertus, atsižvelgiant į tarptautinės autoritetinės kontrolės mastą, paieškos metu turėtų būti aktyvuojami abu šie terminai. Tokias galimybes užtikrina ontologijų naudojimas. Nepakankamumas Homografai Homografai tai žodžiai, turintys vienodą formą, bet skirtingas reikšmes. (Merkurijus planeta, romėnų dievas, automobilis; kasa plaukų, bilietų, vienas iš žmogaus organų, vėžys gyvūnas ir susirgimas). Kiekviename žodyne turi būti numatytas būdas, kaip atskirti skirtingas reikšmes. Galima naudoti pastabas arba homografo sinonimą kaip teiktiną terminą (atitiktinį). Vienas būdų, kaip elgtis su homografais yra taikyti pastabas (paaiškinimus). Pavyzdžiui: Merkurijus (planeta) Merkurijus (Romėnų dievas). Paaiškinimai naudojami ir tada, kai reikia parodyti skirtingą termino naudojimo kontekstą: Svetimavimas (actekų teisė) Svetimavimas (žydų teisė) Svetimavimas (zulusų teisė) Be to, pastabos padeda paaiškinti nežinomus žodžius. Pavyzdžiui: Zulusai (Pietų Afrikos gentis). Dirbtinės IPK turėtų eliminuoti arba bent sumažinti šiuos trūkumus. Reikalavimai IPK ir jų realizavimo priemonės IPK keliami tokie reikalavimai: 8

vienareikšmiškumas - viena sąvoka = vienas žodis (išraiškos būdas); Tuo būdu apribojama sinonimika, homonimija, NK daugiareikšmiškumas, kalba formalizuojama; aiškus naudingų paieškai loginių santykių ir psichologinių asociacijų fiksavimas tarp IPK elementų; atvirumas; - galima keisti, pildyti; naudojimosi patogumas mnemoniškumas, paprastumas, kompaktiškumas. Pagrindinė tokių reikalavimų realizavimo priemonė atitinkamų IPK elementų ir žodyno struktūros pasirinkimas. Pagrindiniai IPK elementai; leksiniai vienetai (žodžiai, kodai, indeksai, jų junginiai); paradigminiai santykiai (baziniai, analitiniai) prasmės (panašumo, skirtumo ir kt.) santykiai tarp LV, kurie nepriklauso nuo konteksto, o priklauso nuo paieškos poreikių; sintagminiai santykiai (teksto, gramatiniai, sintaksės) santykiai tarp LV vienoje paieškos charakteristikoje. Jie priklauso nuo konteksto ir gali keistis. Kontroliuojamos (dirbtinės) kalbos Yra daugybė IPK klasifikavimo kriterijų (IPK struktūros elementai, leksinių vienetų koordinavimas arba postkoordinavimas). Mūsų reikmėms pakanka išskirti jau minėtas dviejų rūšių IPK linijinės hierarchinės struktūros IPK, hierarchinės klasifikacijos, (kai einama nuo plačiausios prie siauriausios sąvokos nuo bendro prie specifinio) arba ir žodinės abėcėlinės IPK, kur terminai (panašūs į NK žodžius) dėstomi abėcėlės seka. Linijinės hierarchinės struktūros IPK arba hierarchinės klasifikacijos Dokumentų arba bibliotekinės klasifikacijos tai dokumentų (informacijos vienetų) skirstymo sistemos, kuriose kiekviena klasė kitų atžvilgiu turi nuolatinę vietą. Klasifikacijos gali būti natūralios ir dirbtinės. Natūralios yra paremtos esminiais objektų požymiais, pvz., dokumentų klasifikavimas pagal turinį. Dirbtinės klasifikacijos remiasi antraeiliais, neesminiais objektų požymiais, pvz., dokumentų klasifikacija pagal dydį arba abėcėliškai pagal autorius, antraštes. Paprastai jos atlieka pagalbinį vaidmenį. 9

Dokumentų arba bibliotekinis bibliografinis klasifikavimas yra tiesiogiai susijęs su mokslo klasifikavimu: jis yra antrinis mokslo klasifikavimo atžvilgiu ir nuo jo priklauso arba juo remiasi. Svarbiausios dokumentų klasifikacijos Melvilio Djuji (Melvil Dewey, 1851-1931) dešimtainė klasifikacija (DDK) Pagrindinė DDK klasių eilė 000 Generalities Bendrasis 100 Philosophy & psychology Filosofija ir psichologija 200 Religion Religija 300 Social sciences Socialiniai mokslai 400 Languages Kalbos/Filologija 500 Natural sciences & mathematics Gamtos mokslai ir matematika 600 Technology (Applied sciences) Technologija (taikomieji mokslai) 700 The arts (Fine and decorative arts) Vaizduojamieji menai 800 Literature & rhetoric Literatūra 900 Geography & history Geografija ir istorija Sudarant indeksą, pirmasis trijų narių skaičiaus elementas rodo pagrindinę klasę, antrasis rodo skyrių, trečias - poskyrį: pvz. 600 Technologija, 610 Medicina, 620 Inžinerija, 630 Žemės ūkis; 611 žmogaus anatomija, 612 žmogaus fiziologija. Šiuo metu DDK yra viena labiausiai naudojamų dokumentų klasifikacijų pasaulyje. DDK autorines teises turi OCLC (angl. Online computer library center). Leidžiamas pilnas ir sutrumpinti (iki 20.000 dokumentų fondui) lentelių variantai, popierine ir elektronine forma (WebDewey ir WebDeweyAbridged). 2003 m. išėjo 22 pilnas leidimas. Nuo 1994 m. leidžiamas CD Dewey for Windows, nauja medžiaga atsispindi adresu http://www.oclc.org/dewey. Universalioji dešimtainė klasifikacija (UDK) 10

Ši klasifikacija plačiai naudojama Lietuvoje. UDK yra skirta visų žinijos sričių dokumentų klasifikavimui. Tai universali, daugiakalbė klasifikavimo sistema, kuri turi dešimtainę indeksaciją, hierarchinę skyrių struktūrą, yra sisteminė, t. y. remiasi mokslų sistematika. Tūkstančiai bibliotekų pasaulyje naudojasi UDK sisteminiam fondų sustatymui ir paieškai. Kompiuteriniuose kataloguose UDK naudojama kaip dalykinio naršymo ir paieškos priemonė. Pagrindinė klasių eilė: 0 Bendrasis sykius 1 Filosofija. Psichologija 2 Religija. Teologija 3 Visuomenės mokslai 4 [laisvas nuo 1961 m.] 5 Matematika. Gamtos mokslai 6 Taikomieji mokslai. Medicina. Technika 7 Menas. Fotografija. Žaidimai. Sportas 8 Kalbotyra. Filologija. Grožinė literatūra. Literatūros mokslas 9 Geografija. Biografijos. Istorija Klasės toliau skirstomos taikant dešimtainį principą. Einama nuo plačiausios (bendriausios) iki siauriausios (konkrečiausios) sąvokos: 0 Bendrasis skyrius 00 Įvadas. Žinių ir kultūros pagrindai 004 Kompiuterija ir kompiuterinė technologija. Duomenų apdorojimas 004.4 Programinė įranga 004.42 Kompiuterio programavimas. Kompiuterinės programos 004.422 Kompiuterinių programų sudėtinės dalys 004.422.3 Kintamieji 004.422.32 Kintamųjų rūšys 004.422.324 Statinis ir dinaminis kintamasis UDK puikiai tinka kompiuterinėms sistemoms. Naudojami charakteringi ženklai leidžia atlikti paiešką pagal bet kurį elementą ar jų derinį ir užtikrina paieškos tikslumą. Skaitmeninių kodų ir natūralios kalbos aprašymų derinimas užtikrina dvejopo rūšiavimo, pagal numerius ir abėcėlę, galimybę (katalogams, autoritetiniams failams, rodyklėms tvarkyti). 11

1995 metais Lietuvos nacionalinė M. Mažvydo biblioteka pasirašė MRF (angl. angl. Master Reference File) failo vertimo ir publikavimo licencijos sutartis su UDK Konsorciumu. Šios sutarties pagrindu rengiama lietuviška UDK bazė. 2001 m. UDK bazė integruota į bendrą Lietuvos nacionalinės M. Mažvydo bibliotekos LIBIS duomenų bazių struktūrą ir įgyvendinta šios bibliotekos kompiuterinio katalogo bibliografinių įrašų bei UDK duomenų bazių sąsaja. Žodinės abėcėlinės IPK Žodinės abėcėlinės IPK, tai tokios informacijos tvarkybai ir paieškai skirtos kalbos, kurių leksiniai vienetai - NK žodžiai ar jų junginiai dėstomi abėcėlės seka. Žodinės abėcėlinės IPK abėcėlinės dalykų klasifikacijos ir deskriptorinės kalbos. Žodinės abėcėlinės IPK fiksuojamos kontroliuojamuose žodynuose: rubrikynuose, tezauruose ontologijose. Abėcėlinės dalykinės IPK Dalykinimo esmė - dokumento turinys išreiškiamas tipiniais žodžiais - dalykinėmis rubrikomis. IPK žodyne (rubrikyne) rubrikos dėstomos abėcėlės seka. Dalykinė rubrika (toliau DR) - trumpa (formalizuota) dalyko žodinė išraiška. Atlikus konceptualiąją dokumento analizę ir nustačius reikiamas sąvokas, jos yra išreiškiamos, kaip dalykinė(ės) rubrika(os), t.y. natūralios kalbos žodžiai. Taigi dokumentas,,etika gyvenime ir versle: pažinimas ir taikymas (Beržinskas, Gediminas 2002. - 286, [1] p.) bus indeksuojamas naudojant dalykines rubrikas: verslo etika, asmenybės moralė, protas, moralė ir politika, o ne indeksą 17 (UDK), Kita vertus, šie žodžiai rubrikoje yra pasirenkami ne laisvai, o naudojant specialų rubrikų sąrašą, žodyną ar vardyną. Dalykinant išskiriamas dalykas kaip toks, nesiejant jo su mokslo šaka. Dalyko vieta hierarchinėje struktūroje nerodoma. Dalykinant naudojami kontroliuojami žodynai - rubrikynai (rubrikų sąrašai, vardynai). Populiariausias ir plačiausiai pasaulyje naudojamas kontroliuojamas dalykinių rubrikų žodynas yra JAV Kongreso bibliotekos rubrikų sąrašas (angl. Library of Congress Subject Headings - LCSH). LCSH apima visą žiniją. Jis naudojamas visų tipų bibliotekose JAV ir kitose anglakalbėse pasaulio valstybėse. Bet kuri biblioteka gali teikti savo siūlymus dėl naujų rubrikų įtraukimo. Tokius siūlymus teikia apie 100 bibliotekų, jų tarpe ir Lietuvos nacionalinė M. Mažvydo biblioteka. Gauti siūlymai svarstomi kiekvieną savaitę. Kasmet įtraukiama apie 8.000 naujų rubrikų. 12

Tradicinis LCSH įvaizdis 5 storos raudonos knygos. 2007 m. išėjo 30 leidimas (280.000 rubrikų ir nuorodų). Tai šios srities pasaulio standartas. Rubrikynas yra išverstas į kitas kalbas, naudojamas kaip pagrindas rengiant analogiškus kitų kalbų žodynus, pvz. lietuvių. Kitas unifikuoto standartinių dalykinių rubrikų sąrašo pavyzdys tai mažoms ir vidutinėms viešosioms ir mokyklų bibliotekoms skirtas Sears dalykinių rubrikų sąrašas (angl. Sears List of Subject Headings). Sears rubrikyne naudojami platesni terminai, mažiau yra specifinių, mokslininkų auditorijai skirtų terminų. Be to, čia yra mažiau skirsnių. LCSH BT Body covering (anatomy) Head RT Scalp NT Beards Bristles Eyerbrows Eyerlashes Gray hair Guard hair Hosehair Long hair Molting Mustaches Sale of human hair Whiskers Wigs Wool Hair Coloring USE Hair Dyeing and bleaching Hair dyes UF Dyes and dyeing Hair Hair tints Tints, hair BT Hair preparations SEARS Use for general materials on hair as well as for materials on hairdressing and haircutting. UF Barbering Coiffure Haircutting Hairdressing Hairstyles Hairstyling BT Head Personal grooming NT Wigs Dalykinė rubrika,,plaukai (HAIR) iš LCSH ir SEARS rubrikynų Lietuvos Martyno Mažvydo bibliotekos rubrikynas yra kuriamas JAV Kongreso bibliotekos rubrikyno pagrindu. Tai reiškia, kad jame gali kuriamos naujos lietuviškos rubrikos (neturinčios angliškų analogų), bet tai turi būti daroma pagal LCSH sistemos taisykles. Rubrikyną kuria Lietuvos nacionalinė biblioteka kaip autoritetinę dalykų bazę UNIMARC formatu. Kitoms įstaigoms jis yra parduodamas. Įstaiga įsigijusi rubrikyną įsipareigoja jame nieko nekeisti. Rubrikyną dokumentų dalykinimui ir dalykinei paieškai elektroniniuose kataloguose naudoja visos 13

Lietuvos bibliotekos, todėl jis žinomas vartotojui. Rubrikyne yra apie 150.000 įvairių mokslo sričių terminų. Dalykinė rubrika,,plaukai iš Lietuvos nacionalinės M. Mažvydo bibliotekos rubrikyno Deskriptorinės IPK Šios IPK yra paremtos koodinatinio indeksavimo metodu, kurio esmė yra tai, kad indeksuojama paties indeksuojamo teksto žodžiais. Indeksuojant, informacinio pranešimo turinys yra išreiškiamas aibe paprastas klases žyminčių NK žodžių, arba žodžių junginių, tarp kurių nėra linijinės priklausomybės. Jie žymi dokumento koordinates teminių dalykinių požymių erdvėje. Tai leidžia atspindėti bet kurį iš anksto nenumatytą dokumento temos, dalyko aspektą. Pagal koordinates atliekama paieška. Koordinatinio indeksavimo požymis ir esmė - manipuliavimas paprastomis klasėmis ir loginių operatorių naudojimas. Loginiai operatoriai, dar vadinami Būlio operatoriais, jų autoriaus Dž. Būlio (George Boole, 1815-1864) garbei, leidžia iš paprastų klasių sudaryti sudėtingas. sąjunga (ARBA, U) sankirta (IR, ) skirtumas (NE, /) 14

Sudėtinių klasių susidarymą iš paprastų gerai iliustruoja Veno diagramos. Džono Venno (John Venn, 1834-1923) anglų matematiko ir filosofo diagramos skirtos rodyti loginius santykius tarp aibių. Loginių operatorių naudojimas leidžia iš nedidelio skaičiaus paprastų klasių sukurti daug ir įvairių sudėtinių klasių. Dar viena svarbi deskriptorinių IPK lyginant su kitomis kalbomis ypatybė yra tai, atliekant deskriptorinį indeksavimą yra indeksuojama sąvokomis. Tai leidžia ženkliai apriboti indeksavimo subjektyvumą. Deskriptorinių kalbų kontrolės priemonė yra tezauras. Ontologijos Ontologija - tam tikros srities bendrai naudojamų sąvokų/konceptų, esybių tipų, jų tarpusavio priklausomybių, sąryšių, aksiomų, dėsningumų ir kt. visumos formalus aprašas. Filosofijoje ontologija suteikia kriterijus, kurie leidžia išskirti įvairius objektų tipus (konkretūs ir abstraktūs, egzistuojantys ir ne, realūs ir idealūs, priklausomi ir ne) bei jų ryšius (santykius, priklausomybes ir pan.) Žodis ontologija pirmiausia yra filosofijos terminas, turintis prasmę būtiesar visos tikrovės teorija, naudojamas ir kaip sinonimas terminui metafizika. Maždaug nuo 1990 m. šis terminas pradėtas naudoti ir kompiuterijos, dirbtinio intelekto srityse, kalbant apie žinių bendrą naudojimą (angl. knowledge sharing), programinių agentų tarpusavio sąveiką, visuotinai pripažįstamų (angl. common sense) žinių atvaizdavimą, natūralios kalbos apdorojimą ir kt. Pagal paskirtį ontologijos skirstomos: žinių vaizdavimo ontologijas; bendrąsias ontologijas, visuotinai naudojamų sąvokų ontologijas; aukščiausio lygio ontologijas, meta ontologijas; lingvistines ontologijas; nagrinėjimo sričių ontologijas; ir kt. Viena iš plačiausiai žinomų ir naudojamų lingvistinių ontologijų yra WordNet (www.wordnet.com). 15

WordNet 100.000 žodžių reikšmių sugrupuotų į 5 kategorijas: daiktavardžiai, veiksmažodžiai, būdvardžiai, prieveiksmini ir funkciniai žodžiai; jų reikšmės yra susietos įvairiais santykiais. Sinonimai - tokios pačios arba labai artimos prasmės žodžiai, kurie gali vienas kitą pakeisti. Sinonimijos santykis toks pat kaip santykis USE tradiciniuose kontroliuojamuose žodynuose; Koordinuoti terminai.juos galima laikyti broliais ir seserimis. Jie kilę iš to paties termino. Tai toks pat santykis kaip tradicinio kontroliuojamo žodyno susijęs terminas ar asociacija; Hipernimai -tai visų rūšinių elementų gimininiai terminai, pvz. terminas šeima yra hipernimas terminams,,kalbų šeima,,,kreivių šeima, globos namai. Hipernimai panašūs į tradicinio kontroliuojamo žodyno santykį,,platesnis/gimininis terminas ; Hiponimai žymi klasės narius, pvz.,,,kreivių šeima termino,,šeima hiponimas. Hiponimai panašūs į tradicinio kontroliuojamo žodyno santykį,,siauresnis/rūšinis terminas ); Holonimai - tai visumos, kurios dalis yra meronimas pavadinimas. Holonimas tai pavadinimas visumos, kuri turi dalis (pvz., šeima turi narius: vaikai, tėvai, seserys ir pan.). Holonimai taip pat panašūs į,,platesnio termino santykį; Meronimai - kažko sudedamosios dalys ar nariai, pvz.,,,sesuo tai,,šeimos meronimas. Meronimai taip pat panašūs į,,siauresnio termino santykį); Antonimai turi priešingą reikšmę. Pvz.,,,šaltas ir,,karštas yra antonimai. Tradiciniuose kontroliuojamuose žodynuose jie paprastai nėra fiksuojami. Kiekvienas žodis gali būti priskirtas 5 kategorijoms ir gali turėti daugelį skirtingų reikšmių. Pvz., romance. Key: "S:" = Show Synset (semantic) relations, "W:" = Show Word (lexical) relations Noun S: (n) love affair, romance (a relationship between two lovers) S: (n) romanticism, romance (an exciting and mysterious quality (as of a heroic time or adventure)) S: (n) Romance, Romance language, Latinian language (the group of languages derived from Latin) S: (n) love story, romance (a story dealing with love) S: (n) romance (a novel dealing with idealized events remote from everyday life) 16

Verb S: (v) woo, court, romance, solicit (make amorous advances towards) "John is courting Mary" S: (v) romance (have a love affair with) S: (v) chat up, flirt, dally, butterfly, coquet, coquette, romance, philander, mash (talk or behave amorously, without serious intentions) "The guys always try to chat up the new secretaries"; "My husband never flirts with other women" S: (v) romance (tell romantic or exaggerated lies) "This author romanced his trip to an exotic country" Adjective S: (adj) Romance, Latin (relating to languages derived from Latin) "Romance languages" Atliekant paiešką pagal reikšminius žodžius naudojant lingvistines ontologijas, pradžioje išduodami dokumentai, kurie tiksliai atitinka pateiktus terminus pvz., šeimos krizė. Jeigu rezultatas netenkina, sistema gali siūlyti kitus variantus, kaip antai:šeimynos krizė, namiškių krizė, namų krizė, giminės krizė, terminą,,krizė keisti terminu,,kritinė situacija, toliau galėtų eiti šeimos padėtis, šeimos situacija, santuokos krizė, poros krizė ir t.t. Tokiu būdu plati ontologija gali išplėsti pilnateksčių dokumentų paieškos pagal reikšminius žodžius galimybes. 17

2. Dalykinė teminė dokumentų analizė ir indeksavimo procesas Tvarkant ir organizuojant informaciją, yra atliekama informacijos vienetų(dokumentų) dalykinė teminė analizė, kurios pagrindu jie yra indeksuojami, t. y. parengiama dokumento paieškos charakteristika arba metaduomenys. Informacijos vieneto tvarkybos rezultatas gali būti klasifikacijos indeksas, dalykinė rubrika, deskriptorių sąrašas. Indeksavimo procesą reglamentuoja ISO -5963-1985 E standartas Documentation Methods for examining documents, determining their subjects and selecting indexing terms. Standarte nurodyta, kad indeksavimo procesą sudaro trys etapai, kurie praktikoje dažnai persidengia ir vyksta vienu metu: dokumento analizė ir jo dalyko/temos nustatymas; svarbiausių dalyką/temą apibūdinančių sąvokų išaiškinimas; šių sąvokų išreiškimas indeksavimo kalbos terminais (konkrečios IPK leksiniais vienetais). Šiame etape natūralios kalbos žodžiai išverčiami į naudojamą IPK. Dalykinę (teminę) analizę visų pirma sudaro konceptualioji informacijos vieneto (dokumento) analizė. Konceptualioji analizė tai nustatymas, apie ką yra objekto intelektualusis turinys, arba koks tas objektas yra. Analizuojant apie ką yra informacijos vienetas, reikėtų siekti išsiaiškinti tris pagrindinius klausimus: kas tai? kam tai reikalinga/skirta? apie ką tai? Atsakant į pirmą klausimą, reikėtų nurodyti kurią nors pagrindinių žinijos formų/kategorijų: istorija, filosofija, technika ir pan. Remiantis pirmuoju atsakymu, galima atsakyti į antrąjį: ar informacija skirta veterinarui, ar zoologui? Atsakant į trečią klausimą nurodoma tema. Kita vertus, dalykinėje analizėje reikia atsižvelgti į teksto pobūdį (struktūra ir laikmena) ir į dėstymo pobūdį (požiūris, rašymo stilius, auditorija, intelektinis lygis). Nustatyti apie ką yra informacijos vienetas nėra lengva. Ne visada ir ne kiekvienas informacijos vienetas turi aiškiai identifikuojamą,,apie-ybę (angl. aboutness).,,apie-ybė gali turėti daugybę aspektų ir atsakant į klausimą apie ką tai dažnai tenka išvardyti ne vieną. 18

Nors kai kurie informacijos vienetai atrodo turi lengvai įvardijamą dalyką, iš tikrųjų viskas nėra taip paprasta. Pvz. knyga,,sociologijos istorija skirta sociologijai, bet tiksliau kalbant tai knyga apie sociologiją istorijos požiūriu, tačiau tai nėra knyga apie istoriją. Gali būti, kad kitu metu ar kitoje vietoje, šios knygos dalyku galėtų būti laikoma istorija. Kartais teigiama, kad nemažai sunkumų kyla ir atsakant į klausimą Kam tai reikalinga/skirta?. Pvz., jau minėta knyga,,sociologijos istorija yra apie sociologiją, kuri pateikiama istorijos perspektyvoje.,,įvado į sociologiją tema taip pat yra sociologija, bet abu šie šaltiniai yra labai skirtingi. Vartotojas, ieškantis,,įvado į sociologiją nebus patenkintas gavęs,,sociologijos istoriją. Atsakydami į klausimą apie informacijos paskirtį, galime išvengti tokių nesusipratimų. Dar vienas svarbus aspektas nustatant dalyką yra kultūrinė aplinka ir išsilavinimas. Akivaizdu, kad Rytų ir Vakarų kultūrų atstovai daugelį dalykų mato ir vertina skirtingai. Konceptualiosios analizės rezultatas priklauso ir nuo taikomų metodų. Taikant tikslinį metodą siekiama nustatyti autoriaus tikslą ar sumanymą. Kai kurie autoriai nurodo savo kūrinių tikslinę paskirtį, tačiau dažnai tokios informacijos nėra, arba nurodomi net keli tikslai. Taikant pagrindinio dalyko metodą, bandoma nustatyti centrinį objektą, kuris iškyla virš likusios informacijos. Kita vertus, centrinio objekto išskyrimas priklauso nuo indeksuotojo ir kūrėjo požiūrio, asmeninės nuostatos ar suinteresuotumo. Net to paties asmens požiūris gali pasikeisti per kelias savaites. Objektyvumo metodas (beje dažniausiai naudojamas atliekant kompiuterinę konceptualiąją analizę) paremtas statistikos duomenimis apie dažniausiai naudojamus terminus. Deja, dažnai naudojamas terminas gali įvardinti foninius arba susijusius dalykus (pvz., knygoje apie Antrą pasaulinį karą bus nuolat minima Vokietija). Kita vertus, terminas tiksliai apibūdinantis, apie ką yra informacijos vienetas gali būti nė karto nepaminėtas. (pvz., knygoje apie kurio nors žinomo asmens politinę karjerą, toks žodis gali būti nepanaudotas). Taikant atrankos ir atmetimo vienybės metodą, ieškoma, kas jungia kūrinį į vieną visumą, suriša, kas buvo pasakyta (atranka) ir nepasakyta (atmetimas). Kita vertus, indeksuotojas turėtų būti objektyvus ir turėti pakankamai daug žinių apie objektą, kad pajėgtų nustatyti, kas buvo atmesta. Akivaizdu, kad vieno teisingo būdo nustatyti apie ką yra informacijos vienetas nėra. Galima naudoti vieną kurį ar visus minėtus metodus, tačiau pakeitus metodą gali pakisti ir rezultatas. Vienas ir tas pats asmuo gali gauti skirtingą rezultatą naudodamas skirtingus metodus, o keli asmenys naudojantys tą patį metodą taip pat gali gauti skirtingą rezultatą. 19

Dar daugiau keblumų kelia netekstinės informacijos vienetų,,apie-ybės nustatytas. Šiuo atveju galima taikyti kelis konceptualiosios analizės lygius: teminę aprėptį rodančių sąvokų ar jų grupių identifikavimas; bendras apibūdinimas ir pavaizduotų objektų ar scenų išvardijimas; su pavaizduotais objektais ar scenomis susijusios teminės ar ikonografinės reikšmės nustatymas ir interpretavimas. Tvarkant meno kūrinius lengviausia išvardinti objektus ir scenas. Be to, galima nustatyti dalykinę sąvoką (pvz., mūšio scenos pavaizdavimas) arba iš darbo antraštės nustatyti konkretų dalyką (pvz., Žalgirio mūšis). Daug sunkiau nustatyti muzikos kūrinių dalyką apibūdinančias sąvokas ar išvardinti, kas pavaizduota. Pakankamai paprasta nusakyti, kaip objektas atrodo, bet interpretavimo reikalingos teminės ar ikonografinės netekstinės informacijos vienetų identifikavimas reikalauja specialaus rengimo. ISO gairėse pažymima, kad atliekant dalykinę teminę informacijos vieneto analizę, nėra tikslingą skaityti visą dokumentą. Kita vertus, indeksuotojas turėtų užtikrinti, kad naudinga informacija nebus praleista. Todėl nurodomos pagrindinės dokumento dalys, kurioms reikia skirti ypatingą dėmesį: antraštė; santrauka; turinys; įvadas, pirmieji skyriai, paragrafai ir išvados; iliustracijos, diagramos, lentelės ir jų pavadinimai; pabraukti ir kt. išskirti žodžiai ir žodžių junginiai. Daugiausiai informacijos duoda antraštė ir santrauka, tačiau jos dažnai gali klaidinti, pvz., antraštė gali būti abstrakti, ji visada bus subjektyvi, o santraukos negalima laikyti pakankamu viso dokumento pakaitalu. Turinys padeda išaiškinti dalyką ar temą ir identifikuoti potėmes, aspektus. Turinys ypač svarbus tvarkant straipsnių rinkinius, konferencijų medžiagą ir pan. Įvade, pirmuose skyriuose ir išvadose autoriai ar sudarytojai pristato tikslus, paskirti, apibendrina pateiktą informaciją. Iliustracijos, lentelės, jų pavadinimai ypač svarbūs tokiose srityse kaip menas, nes padeda lengviau ir tiksliau nustatyti informacijos,,apie-ybę. Antrajame etape indeksuotojas nustato pagrindines išaiškinto dalyko sąvokas. Šiame etape dokumento dalykas formuluojamas natūralios kalbos žodžiais, frazėmis. Gairėse pabrėžiama, kad terminai, kuriuos pasirenka ar atmeta indeksuotojas priklauso nuo indeksavimo tikslo. Pasirenkant sąvokas būtina atsižvelgti į tai, ar jos gali būti naudingos potencialiems sistemos vartotojams. Kita vertus nereikia pamiršti, kad sistema gali naudotis ir kitų 20

grupių vartotojai, taigi dokumento dalyko arba temos nereikėtų interpretuoti pernelyg siaurai, todėl sąvokų skaičiaus riboti nereikia. Pasirenkamų sąvokų pobūdis ir jų kiekis priklauso nuo pasirinkto indeksavimo išsamumo. Išsamumas tai - analizės metu nustatomų dalykų ir aspektų skaičius. Išsamumas gali būti dviejų lygių: gilusis ir apibendrinantis. Giliuoju indeksavimu siekiama išgauti visas pagrindines dokumente aptariamas sąvokas, temas ir potėmes. Apibendrinant apsiribojama svarbiausiais, bendraisiais dalykais. Bibliotekose knygų ir serialinių leidinių indeksavimas tradiciškai yra apibendrinančio lygio, giliau indeksuojami straipsniai, knygų skyriai. Indeksavimo išsamumas įtakoja paieškos pilnumą ir tikslumą. Pilnumas a : (a + b) x 100 %, kur a - visi išduoti relevantūs dokumentai; b visi neišduoti relevantūs dokumentai; Tikslumas - a : (a + c) x 100 %, kur a - visi išduoti relevantūs dokumentai; c visi išduoti nerelevantūs dokumentai; Gilusis indeksavimas didina tikslumą, nes naudojami tikslesni ir specifiškesni terminai. Apibendrinimas paprastai didina pilnumą, nes paieškos terminai yra platesni. Apibendrinimas labai naudingas ir plačiai taikomas apčiuopiamų išteklių paieškai (knygų, CD, vaizdajuosčių, žurnalų ir pan.). Ieškant elektroninių išteklių (neapčiuopiamų), atsirandą naujų iššūkių. Ieškant tinkle, tam tikrą žodį turintis informacijos vienetas bus išduotas pagal analogišką paieškos žodį, net jeigu pastarasis neatspindi jo dalyko ar temos. Dėl tokio žodžių buvimu pagrįsto išdavimo kriterijaus ženkliai išauga pilnumas, bet sumažėja tikslumas. Kitas svarbus aspektas nustatant indeksavimo išsamumo lygį - ką laikyti analizės vienetu. Tradiciškai tai yra bibliotekos ar archyvo fonde saugomi ištekliai. Internete tokio analizės vieneto apibrėžimo nėra; tai gali būti elektroninis žurnalas, straipsnis, tinklalapis su visomis nuorodomis ir ryšiais, individualus tokio tinklalapio elementas. Neatsakius į šį klausimą, sudėtinga spręsti, koks indeksavimo išsamumo lygis gerintų paieškos rezultatus. Kitas antrojo indeksavimo etapo uždavinys: sąvokų identifikavimas arba atpažinimas 21

Informacijos vienetų dalykais gali būti įvairių rūšių sąvokos. Tai gali būti temos arba dalykai; pavadinimai (asmenvardžiai, kolektyvų pavadinimai, geografiniai pavadinimai, kiti pastatų, architektūrinių/archeologinių vietovių ir pan.); laikotarpiai, formos. Temos. Dauguma žmonių informacijos dalyko apibūdinimui pasirenka temą ar dalyką nusakantį terminą. Tema/dalykas gali būti konkreti ir abstrakti. Paprastai tai - pagrindinis dokumento dėmesio objektas, tai gali būti viso informacijos vieneto tema. Pavadinimai. Dokumento dalykas, ar kuris dalyko aspektas. Tai gali būti asmuo, kolektyvas ar institucija, teritorija, ar kita pavadinimą turinti esybė. Mes galime turėti dokumentą apie rašytoją, mokslininką, visuomenės veikėją; biblioteką, ministeriją, žvejybos įmonę. Dokumentas gali būti apie vietovę (Žemaitija), miestą (Vilnius). Ypatingą kategoriją sudaro konkrečių esybių pavadinimai (Rasų kapinės, Žaliasis tiltas, Paryžiaus panteonas). Laikotarpiai. Laikotarpiai tai - svarbus teminės dalykinės informacijos elementas. Laikotarpis konkretina ir (arba) susiaurina dalyko apimtį. Pvz., dokumente apie prieigą prie informacijos taikant kompiuterius 8 ame dešimtmetyje nebus informacijos apie internetą. Laikotarpiams žymėti dažnai naudojami jų pavadinimai Antrasis pasaulinis karas, Renesansas ir pan.. Forma. Galiausiai nustatoma informacijos vieneto ar jo dalies forma. Formos nustatymas nepakeičia dokumento temos arba dalyko, bet gali iš esmės pakeisti požiūrį į jį ar pristatymo būdą. Formą apibūdina tie terminai, kurie skirti konkrečių rūšių ar žanrų medžiagai apibūdinti. Nustatant informacijos vieneto formą, atsižvelgiama į: fizines charakteristikas (vaizdajuostės, nuotraukos, žemėlapiai ir pan.); konkretų juose esančių duomenų tipą (bibliografijos, klausimynai, statistika); informacijos pateikimo būdą (dienoraščiai, apžvalgos, rodyklės); stilių, paskirtį, tikslinę auditoriją (romanas, komiksas, vadovėlis). Formos ir dalyko atskyrimas šiuo metu ypač svarbus, nes vis daugiau tenka organizuoti netekstinės informacijos. Pvz., muzikoje formos identifikavimas visada buvo labai svarbus. Dabar vis daugiau yra ieškoma kitokių informacijos formų, pvz., piešinių, skaitmeninių žemėlapių, skulptūrų reprodukcijų. Atskiriant formą nuo turinio, lengviau kurti sistemas, leidžiančias ieškoti informacijos formų. Naujausios metaduomenų sistemos turi specialiai formai skirtas kategorijas, pvz.,,,išteklių tipas ir,,formatas Dublin Core metaduomenų formato standarte. 22

Trečiasis etapas - vertimas iš natūralios kalbos į konkrečią indeksavimo kalbą, t.y. konceptualiosios analizės rezultatų atvaizdavimas kataloguotojo, klasifikuotojo ar indeksuotojo naudojamos schemos (klasifikacijos, rubrikyno, tezauro) leksiniais vienetais. Tai reiškia, kad jeigu yra naudojama UDK, sąvoka turi patekti į tam tikrą dešimtainės hierarchinės struktūros vietą. Jeigu naudojamas rubrikynas ar tezauras, informacijos vieneto turinį reikia suformuluoti sakiniu, tada išskiriami svarbiausi šio sakinio terminai, kurių atitikmenys esantys kontroliuojamame žodyne naudojami sąvokoms išreikšti. Tuo būdu dalykinės analizės rezultatas gali būti klasifikacijos indeksas(ai), dalykinė(s) rubrika(os) ar deskriptorius(ių) sąrašas. Pvz. dokumento apie pašte dirbančių žmonių darbo užmokestį turinys gali būti išreikštas indeksu 656.8: 331.2 (UDK), deskriptoriais iš tezauro: Darbo užmokestis, paštas, darbuotojai arba DR iš LNB rubrikyno Paštas, tarnautojai, atlyginimas. Šiame etape svarbu atsižvelgti į tai, kad kontroliuojamame žodyne gali nebūti reikalingų leksinių vienetų. Tada indeksuotojas turėtų pasirinkti artimiausią pagal prasmę leksinį vienetą arba papildyti žodyną nauju terminu. Specialiai akcentuojama, kad konceptualiosios analizės neturėtų įtakoti žodynas. Pradžioje atliekama analizė, po to galvojama apie terminus. Negalima ignoruoti dalyko, aspekto, temos, nes manoma, kad nėra tinkamo termino jiems išreikšti. Konceptualiosios analizės objektas - idėjos (sąvokos), o ne terminai. Net jeigu indeksuotojo ir autoriaus terminai sutampa, gali skirtis jų prasmė. Čia praverčia klasifikavimo principų išmanymas, juk klasifikavimas prasideda nuo sąvokų nustatymo. Indeksuojant reikia atkreipti dėmesį į: specifinė indeksavimo problemą nuoseklumą. Idealiu atveju dokumentui priskirti terminai (indeksai), jų skaičius ir išsamumo lygis neturi priklausyti nuo indeksuotojo. Taigi du indeksuotojai turėtų išskirti tą pačią,,apie-ybę ir išreikšti ją vienodais terminais iš kontroliuojamo žodyno. Tačiau praktiškai nuoseklumas yra sunkiai pasiekiamas. Nuoseklaus,,apie-ybės nustatymo sunkumus įrodo nemažai specialių tyrimų. Vienas tokių tyrimų parodė, kad objektui ar sąvokai buvo priskirti vidutiniškai 25,6 teminiai pavadinimai. Toks rezultatas rodo žmonių nesugebėjimą nustatyti tą pačią dokumento,,apie-ybę arba pasirinkti vienodus natūralios kalbos žodžius nustatytai,,apie-ybei išreikšti. Kita vertus indeksavimo nuoseklumas, o tuo pačiu ir nuspėjamumas yra vienas iš informacijos sistemų kokybės faktorių ir rodiklių. Šioje vietoje akivaizdi kontroliuojamo žodyno reikšmė: naudojant vienodus kontroliuojamus žodynus ir jų taikymo taisykles konceptualiosios analizės rezultatas bus išreikštas nuosekliais indeksais, dalykinėmis rubrikomis ar deskriptoriais. 23

Nuoseklumui pasiekti indeksuotojas turi būti nešališkas, atsisakyti subjektyvumo nustatant sąvokas ir pasirenkant indeksavimo terminus, turėti indeksuojamų dokumentų srities žinių, palaikyti tiesioginį ryšį su vartotojais. Kadangi indeksavimo procesas yra susijęs su žmonių priimamais sprendimais, jis negali būti visiškai nešališkas ir indeksavimo nuoseklumo problema išlieka aktuali nepaisant visų standartizavimo pastangų. Indeksavimo kokybę įtakojantys faktoriai. ISO standarte nurodoma, kad indeksavimo kokybė priklauso nuo šių faktorių: indeksuotojo kvalifikacija (profesionalumas) ir patirtis; indeksavimo priemonių kokybė. Greta išskiriamas dar vienas kokybę įtakojantis faktorius. Tai - indeksavimo politika (išsamumas ir tikslumas). Indeksavimo politiką apibūdina iš anksto apibrėžtas indeksavimo išsamumas ir tikslumas. Terminų skaičius Dalykinių rubrikų ar deskriptorių priskiriamų vienam dokumentui skaičius priklauso nuo daugelio faktorių. Istoriškai šis skaičius kinta. Kortelių kataloguose dalykinių rubrikų skaičiaus didėjimas turėjo ekonominių pasekmių ir kėlė nepatogumų vartotojams (brangiau kataloguoti ir peržiūrėti, daugiau vietos laikyti katalogui, vartotojams labai dideliu katalogu sudėtingiau naudotis, ilgesnė paieška). Viena vertus, kuo daugiau dalykinių rubrikų tuo brangiau indeksuoti, kita vertus jeigu reikia priskirti 2, o ne 10, tenka ilgiau svarstyti, ką pasirinkti, kuri geriau atitinka turinį. Kitas aspektas kai daugiau terminų lengvinama prieiga prie visų išteklių, daugiau prieigos taškų, galima išskirti tam tikrus specifinius, netikėtus aspektus. Indeksavimo tikslumo matas neegzistuoja. Pagrindinis principas buvo suformuluotas dar XIX a pabaigoje, kai Ch. A. Cutteris sukūrė žodyninio katalogo rengimo taisykles. Šio principo esmė, kad reikia pasirinkti tiksliausią terminą, kuris apima visą dokumento dalyką, pvz., APELSINAI, o ne CITRUSINIAI VAISIAI ir ne VAISIAI arba artimiausią.. Indeksavimo nuoseklumas Nuoseklumą lemiantys faktoriai : rubrikų skaičius; žodyno dydis ir tikslumas; indeksuotojo asmenybė; turimos priemonės (žodynai, žinynai); 24

tvarkomo teksto dydis; indeksuojamo dokumento ir terminų ypatybės (konkretūs objektai - daiktai ir abstraktūs objektai -idėjos) Indeksavimas nėra savitikslis procesas. Jo kokybė apibudinama pragmatiškai: tai toks indeksavimas, kuris leidžia iš duomenų bazės gauti dokumentą, kuris atitinka užklausą ir negauti to, kuris užklausos neatitinka. Antra vertus, paieškos rezultatą įtakoja daugelis faktorių: vartotojas (kaip jis suvokia ir formuluoja savo poreikį užklausos turinys ir struktūra paieškos strategija duomenų bazės turinys - indeksavimo kokybė - žodyno kokybė. Vertindami indeksavimą galime kalbėti tik apie konceptualiosios analizės, sąvokų nustatymo ir vertimo kokybę. Galimos klaidos: nesugebėjimas atpažinti vartotoją dominančią temą; neteisingai suprastas dalykas/tema neteisingai nustatyta sąvoka; nesugebėjimas pasirinkti tiksliausią (siauriausią) rubriką/deskriptorių; neteisingos rubrikos/deskriptoriaus pasirinkimas (aplaidumas, neišmanymas). Gero indeksavimo matas - geri paieškos rezultatai: tinkamas pilnumas ir tikslumas. Absoliučia prasme vienintelės teisingos paieškos charakteristikos nėra. Blogai, jeigu indeksavimas: prieštarauja bendrai politikai (išsamumas); ne tiksliausias terminas; neteisingas terminas; terminas praleidžiamas. Indeksavimą įtakoja šie faktoriai: indeksuotojas žodynas dokumentas procesas aplinka Dalyko/temos tikslumas; dalykas; taisyklės ir temperatūra; išmanymas; dviprasmiški sudėtingumas; instrukcijos; apšvietimas; poreikių terminai (be kalba (rusų ar dalykinamų triukšmas žinojimas; pastabų); aiškumas); dok. skaičius; patirtis; struktūra apimtis; išsamumas; koncentracija; (nuorodos); dėstymas; teksto pagalbinės apibendrinimas skaitymas ir priemonės suvokimas 25

3. Kontroliuojami žodynai. Tezaurai, kaip leksikografinės kontrolės užtikrinimo priemonė Tezaurai, jų paskirtis ir funkcijos Tezauras tai kontroliuojamas žodynas, kuris užtikrina sistemoje naudojamų terminų leksikografinę kontrolę ir jų naudojimo nuoseklumą. Toks žodynas tai sisteminės struktūros žodžių ir žodžių junginių sąrašas, kurio tikslas vienareikšmiškai atspindėti dokumentų sistemoje esamų dokumentų ir joje atliekamų paieškų konceptualų turinį. Pagrindinis tezauro leksinis vienetas deskriptorius. Tezauras (arba deskriptorių žodyno) informacijos tvarkybos ir paieškos įrankis: tam tikroje sistemoje vartotinų žodžių ir pasakymų sąrašas drauge su jų ryšiais, variantais, sinonimais, tezauro naršymo priemonėmis. Tezauras yra ideografinis žodynas. Kita žodynų rūšis leksikografiniai. Ideografiniuose žodynuose leksiniai vienetai grupuojami pagal išraiškos (parašymo) panašumą. Tokiuose žodynuose einama nuo žodžio prie prasmės. Tai įvairių kalbų žodynai, pvz., lietuvių anglų kalbų žodynas. Ideografiniuose žodynuose leksiniai vienetai grupuojami pagal prasmės artimumą, t.y. einama nuo prasmės prie konkretaus žodžio. Ideografiniai žodynai sudaromi jau daugelį šimtmečių. Didžiausią poveikį ir postūmį kurti ideografinius žodynus padarė P. M. Roget o,,anglų kalbos žodžių ir pasakymų tezauras (angl. Thesaurus of English words and phrases, 1852). Tai klasikinis tradicinio tezauro arba sinonimų žodyno pavyzdys. Šiame žodyne einama nuo vieno termino prie kito sinonimiško. Šio žodyno paskirtis - rasti žodį, kuris geriausiai perteikia pranešimo prasmę. 26

Termino,,Smallness struktūra ir reikšmės iš Roget o tezauro. http://machaut.uchicago.edu/?action=search&resource=roget%27s&word=small&searchtype=head word XX a. antroje pusėje atsiranda naujo tipo informacijos paieškos tezaurai. Nors tezauras tai ideografinis žodynas, tačiau jis veikia priešingai, negu lingvistinis tezauras. Šiame žodyne daug sinonimų apjungiami vienu žodžiu ar žodžių junginiu. Ilgą laiką tokius tezaurus naudojo sistemų kūrėjai, IT specialistai, bibliotekininkai. Išplitus internetui, tezaurų, kaip kontroliuojamų žodynų reikšmė vėl ima augti. Tezaurų, kaip ir kitų kontroliuojamų žodynų reikšmė susijusi su natūralios kalbos ypatybėmis, t.y. jos trūkumais informacijos tvarkybos ir ieškos požiūriu. Svarbiausias jų tai, kad dokumentų arba informacijos vienetų autorių ir vartotojų, ieškančių šių dokumentų kalba, dažnai būna nevienoda. Tezaurų naudojimas ypač svarbus ir naudingas, kai kuriamos duomenų bazės jungiamos į informacines sistemas. Norint susikalbėti su partneriais, būti teisingai suprastiems ir tiksliai suprasti kitus, privalu naudoti tą patį žodyną. Tezaurus informacijos ir duomenų tvarkybai ir ieškai naudoja daugelis organizacijų. Kuriami universalūs, šakiniai ir specialūs mikro tezaurai. Tezaurai taip pat dažnai tampa paieškos ir yra navigacijos elektroninėse duomenų bazėse įrankiai. Jie yra nepakeičiami norint tiksliai įvardinti paieškos tikslą ir greitai surasti ieškomus duomenis. Atlikdamas paiešką vartotojas dažnai tezauro nemato arba net nežino, kad toks žodynas 27

yra naudojamas. Sistemoje vartotojo įvesti reikšminiai žodžiai gali būti automatiškai pakeičiami deskriptoriais. Be to, naudojant tezaurą vartotojo nurodomi terminai gali būti automatiškai susieti su platesniais, siauresniais ar asociaciniais terminais iš tezauro. Tezaurų funkcijos: Vertimas iš natūralios kalbos į deskriptorinę. Tezauras parodo, kurį terminą naudoti kiekvienai sąvokai apibrėžti; Informacijos/duomenų paieškai naudingų loginių ryšių ir santykių atspindėjimas; Atitinkamos srities terminijos standartizavimas ir norminimas. Tuo būdu tezaurų naudojimas užtikrina: Terminų naudojimo nuoseklumą terminai teikiami ir formuluojami pagal visiems žinomas taisykles; Ryšių tarp leksinių vienetų nustatymą ir fiksavimą - rodo terminų prasmės ryšius; Dokumentų paiešką - tezauras naudojamas kaip informacijos paieškos įrankis. Tezaurai gali būti universalūs (visų mokslo sričių) ir specializuoti (vienos ar kelių mokslo sričių). Rengiami vienos kalbos ir daugiakalbiai tezaurai. Tezaurų rengimą reglamentuoja Tarptautinės standartų organizacijos standartai: ISO 2788 1986 Guidelines for the establishment and development of monolingual thesauri (Vienakalbio tezauro nustatymo ir sudarymo gairės). ISO 5964 1985 Guidelines for the establishment and development of multilingual thesauri (Daugiakalbio tezauro nustatymo ir sudarymo gairės). Tezaurų struktūra ir fiksuojami santykiai Tezauras tai - abėcėlinis deskriptorių ir reikšminių žodžių sąrašas. Deskriptorius ir reikšminius žodžius (nedeskriptorius) tezaure jungia sinonimijos arba ekvivalentumo santykiai. Ekvivalentumas gali būti tikrasis (imanentinis, pvz.: defektas - yda, kiškis - zuikis, malūnsparnis -sraigtasparnis, Lietuvos Nacionalinė biblioteka - LNB ir artimas fakultatyvusis, pvz.: straipsnis -ataskaita, oras - atmosfera, katalogas kartoteka, vertybinių popierių rinka finansų rinka. Deskriptoriaus ir nedeskriptoriaus ekvivalentumo santykiai nurodomi tokiais sutrumpinimais: - UF (angl. Used for vartojamas vietoj). Ši santrumpa rodo deskriptoriaus ir nedeskriptoriaus, kuriam jis atstovauja, santykius. Pavyzdžiui: Malūnsparnis 28

UF helikopteris - USE (naudok) reiškia nedeskriptoriaus ir deskriptoriaus, kurį jis pakeičia santykius. Pavyzdžiui: helikopteris USE malūnsparnis. Pagrindiniai prasmės santykiai tarp deskriptorių: - giminė rūšis (bendra/plati ir specifinė/siaura sąvoka), pvz.: baldai stalai; gėlės ratiliai; sostinės Vilnius. Jie dar gali būti vadinami hierarchiniais arba pavaldumo santykiais. Šie santykiai paprastai žymimi santrumpomis BT (angl. Broader term - platesnis terminas) ir NT (narrower term - siauresnis terminas). - asociatyvūs santykiai. Jiems žymėti naudojama santrumpa RT ( angl. Related term susijęs terminas). Asociatyvūs santykiai būna įvairių rūšių: Objektas instrumentas (temperatūra - termostatas); Objektas vieta (ligonis - ligoninė); Objektas funkcija (biblioteka knygų išdavimas) Veiksmas objektas rezultatas (mezgimas siūlai - megztinis); Panašūs objektai/artimumas (arklys, asilas, mulas); Veikėjas veiksmas (vagis - vagystė); Disciplina objektas (ornitologija - paukštis); Priešingybės (judėjimas - ramybė); Gretimumas (žiema - sniegas); Visuma dalis (knyga viršelis). Asociatyvūs santykiai visada yra simetriški, pvz.: įsiskolinimas RT mokumas mokumas RT įsiskolinimas Apibrėžiantys žodžiai (angl. Qualifiers) Skliausteliuose nurodomi apibrėžiantys žodžiai homonimų dviprasmiškumui pašalinti ir terminų, kurių naudojimas konkrečiame kontekste gali įnešti painiavos, prasmei sukonkretinti. Apibrėžiantys žodžiai tampa deskriptoriaus dalimi ir turi būti įtraukiami indeksuojant ar atliekant paiešką. Pvz.: 29

gynyba (teisė) gynyba (karyba) Vartojimo pastabos (angl. Scope note) Vartojimo pastabos naudojamos, kai reikia paaiškinti specialaus termino reikšmę, paaiškinti, kaip toks terminas naudojamas arba apriboti termino naudojimo sritį. Kartais pastabos tikslas yra įspėti vartotoją, kad tikslingiau būtų naudoti kitą terminą. Pastabos žymimos santrumpa SN. Pavyzdžiui: Sovietų Sąjunga SN: naudojamas 1922-1991; panaikintas 1991. Hierarchinių santykių tarp deskriptorių fiksavimas užtikrina galimybę plėsti ir/arba siaurinti paiešką pasirenkant patį tiksliausią terminą. Tezaure naudojamos nuorodos į sinonimus leidžia rasti alternatyvius paieškos terminus, o asociatyvių terminų fiksavimas rodo sąvokų ryšius. Tezaurų rengimas ir vertinimas Paprastai išskiriami šie tezauro rengimo etapai: Terminų atranka ir jų įtraukimas į reikšminių žodžių sąrašą. Paprastai terminai yra atrenkami iš tam tikros mokslo krypties dokumentų, atliekant pirminį indeksavimą. Šiame etape tarp terminų ryšiai nėra nustatomi (dedukcinis metodas). Naudojant indukcinį metodą, nauji terminai įtraukiami į tezaurą iš karto nustatant termino priklausomybę vienai ar keletui kategorijų ir formuojant atitinkamus ryšius. Gali būti derinami abu terminų atrankos būdai. Terminų verifikavimas. Prieš įtraukiant terminą į reikšminių žodžių sąrašą ir (arba) tezaurą turi būti atliekamas jo patikrinimas. Tam naudojami žinynai ir enciklopedijos, jau egzistuojantys tezaurai, klasifikatoriai, techninių žurnalų rodyklės, referatinių leidinių rodyklės, naujausi žinynai, galima konsultuotis su specialistais. Reikšminių žodžių deskriptorizavimas. Šiame etape vyksta atrinktų terminų norminimas ir sąlyginio ekvivalentumo klasių formavimas, kai iš sinonimiškų ar sąlygiškai sinonimiškų terminų atrenkami plačiausiai naudojami, stilistiškai neutralūs tokias klases atstovaujantys žodžiai. Deskriptorių klasių formavimas ir užrašymas. Tezauro apiforminimas. Kiekvienas tezauro leksinis vienetas pateikiamas tam tikra griežtai nustatyta tvarka. Prie jo nurodomi: sinonimai ir kiti atitiktiniai terminai, naudojimo pastabos, platesni, siauresni ir susiję terminai. Prie termino gali būti pateikiamas jo apibrėžimas ar kiti reikalingi paaiškinimai. Specialios tezaurų kūrimų 30

programos labai palengvina termino įrašymo darbus automatiškai sukurdamos atvirkštinius ryšius ir neleisdamos skirtingų sąvokų reikšti taip pačiais terminais, atitiktinių terminų naudoti ten kur turi būti rašomi tik patvirtinti terminai ir t.t. Tezauro kūrimas yra tęstinis procesas, kadangi kiekvienoje mokslo srityje ar kryptyje vyksta pokyčiai: atsiranda nauji terminai ar kinta jai reiškiamų sąvokų ribos. Į tezaurą nuolat turi būti įtraukiami nauji terminai (paprastai taikant indukcinį metodą), pašalinami seni, neteiktini terminai. Vertinant parengtus tezaurus siūloma atsižvelgti į tokius kriterijus: Terminologija: ar atitinka mokslo sritį, nuolat atnaujinama ir tiksli? Apimtis: ar tinkamai apibūdina mokslo sritį, nėra per plati ar per siaura? Suskirstymas: ar prasmingas suskirstymas į temas? Apibrėžimai ir pastabos: ar pakankamai išsamiai ir aiškiai apibūdina terminus? Nuorodos: ar pakankamos pagal skaičių ir formą? Formatas: ar aiškus pateikimas? Klasifikacija: ar suderintas su kuria nors klasifikacijos schema? 31

4. Svarbiausi humanitarinių ir socialinio mokslų srities tezaurai Tezaurus informacijos ir duomenų tvarkybai ir ieškai naudoja daugelis organizacijų. Kuriami universalūs, šakiniai ir specialūs mikro tezaurai. Sudaromi specialūs elektroninių tezaurų sąrašai 1. Rengiami įvairios apimties, paplitimo ir kokybės HSM srities tezaurai. Šioje srityje galima išskirti ERIC, UNESCO tezaurą, ELSST, Sociologinių terminų tezaurą ir kitus. ERIC Informacijos apie švietimo išteklius centras (angl. Education Resources Information Center) JAV yra virtuali švietimo išteklių ir informacijos biblioteka.http://www.eric.ed.gov/ericwebportal/home.portal?_nfpb=true&_pagelabel=thesauru s&_nfls=false. Informacijai tvarkyti ir paieškai atlikti taikomas ERIC tezauras. Terminai išdėstyti abėcėlės seka. Tezaure galima pasirinkti terminą iš abėcėlinio sąrašo arba pagal temą. Pvz., pasirinkus temą socialinės problemos social problems, gaunamas sąrašas deskriptorių ir nedeskriptorių, iš kurių pasirinkus norimą, pvz., sexual abuse, pristatoma hierarchinė deskriptoriaus struktūra iš kurios galima pasirinkti paieškos terminą. Pasirinkus paiekos terminą, gaunamas dokumentų, atitinkančių šį dalyką, sąrašas. 1 Koch T., Controlled vocabularies, thesauri and classification systems available in the WWW. [interaktyvus]. [žiūrėta 2006 m. lapkričio 20 d.]. Prieiga per internetą http://www.ub2.lu.se/metadata/subject-help.html; Web Thesaurus compendium[interaktyvus]. [žiūrėta 2006 m. lapkričio 20 d.]. Prieiga per internetą: http://www.ipsi.fraunhofer.de/~lutes/thesoecd.html 32

UNESCO Tezauras (angl. UNESCO Thesaurus) tai trikalbis kontroliuojamas šios organizacijos žodynas, kuris apima šių sričių terminus: švietimo, mokslo, kultūros, humanitarinių ir socialinių mokslų, informacijos ir komunikacijos, politikos, teisės ir ekonomikos. Be to, į tezaurą įtraukti valstybių ir įvairių valstybinių grupuočių ar sąjungų (politinių, ekonominių, geografinių, etninių, religinių ir pan.) pavadinimai. Visų kalbų versijose yra 87 mikrotezauro terminai, 4261 deskriptorius, 4049 atvirkštiniai hierarchiniai ryšiai (BT/NT), 5771 asociatyvūs ryšiai (RT). Versijoje anglų kalba yra per 2340 atitiktinių terminų ir 600 terminų apibūdinimų. Tezauro paskirtis lengvinti indeksavimą bibliotekose, archyvuose ir panašiose institucijose. Tezauras pristatomas dvejopai: kaip abėcėlinė ir hierarchinė struktūra. Pasirinkus reikiamą terminą pagal abėcėlę ar iš teminio mikrotezauro, formuluojama užklausa. UNESCO tezauras naudojamas ir kaip bazinis tezauras kurti panašios tematikos kontroliuojamus žodynus. Tezauro naudojimo principai ir sąlygos http://www2.ulcc.ac.uk/unesco/#purc. 33

Europos kalbų socialinių mokslų tezauras (angl. European Language Social Science Thesaurus -ELSST). Jis yra rengiamas remiantis ISO 2788:1986 ir ISO 5964:1985 standartų reikalavimais. Jo pagrindą sudaro HASSET (Humanities and Social Science Electronic Thesaurus) tezauras anglų kalba. Detalus HASSET tezauras buvo sustambintas, nes ELSST tikslas yra sukurti bendrą ontologiją, kuri konkrečių institucijų poreikiams galėtų būti praplėsta terminais, susijusiais su kultūriniais ir instituciniais ypatumais. Atlikus dažniausiai UKDA kataloge naudojamų terminų analizę buvo atrinkti plačiausi terminai: ekonomika, darbas ir įsidarbinimas, politika, politinės sistemos, socialinės problemos, diskriminacija, požiūriai, probleminės grupės, politinės institucijos, etninės grupės, gyvenimo sąlygos, socialinė struktūra, duomenys, amžiaus grupės, demografija, sociologija, socialinis gerbūvis, aplinkosaugos mokslai, edukologija, identitetas, tautiškumas, šeima, religija, analizė, metodologija, šeimos aplinka. Vėliau, derinant su CESSDA (Council of European Social Science Data Archives) poreikiais tezauras buvo papildytas kitais plačiais terminais. Šiuo metu tezaure pakeikta daugiau kaip 3000 terminų vokiečių, danų, graikų, anglų, ispanų, suomių, prancūzų, norvegų ir švedų kalbomis. Sociologinių terminų tezauras (angl. Sociological abstracts Thesaurus) http://www.csa.com/factsheets/supplements/sociothes.php Atliekant paiešką CSA duomenų bazėse vartotojas turi galimybę pasirinkti sritį, pvz., humanitariniai mokslai, menai, socialiniai mokslai ir atitinkamos srities tezaurą norima kalba, pavyzdžiui, Sociologinių terminų tezaurą ar Politinių mokslų tezaurą anglų kalba. Be to, Tezaurai pateikiami kaip hierarchinė struktūra, kai abėcėlinis deskriptorių ir nedeskriptorių sąrašas ir kaip permutacinė rodyklė. 34

Pasirinkus Sociologinių terminų tezauro terminą,,addiction, gaunamas sąrašas dokumentų, kuriame šis terminas buvo naudotas indeksuojant. 35

CSA duomenų bazės yra komercinės, todėl neįsigijus prieigos teisių galima tik bandomoji paieška. Europos švietimo terminų tezauras (angl. Thesaurus for Education Systems in Europe- TESE) yra daugiakalbis edukologijos terminų žodynas, sukurtas bendromis Europos komisijos ir Europos tarybos pastangomis. http://www.eurydice.org/portal/page/portal/eurydice TESE pateikia edukologijos mokslo krypties terminus: švietimo principai ir sistemos, švietimo politika, švietimo institucijos, mokytojai, mokiniai, pastatai ir mokymo įranga, mokymo programa ir mokymo dalykai, edukaciniai tyrimai, ugdymo psichologija, sociologija ir ekonomika ir kt. Daugiakalbis edukologijos terminų tezauras parengtas pagal ISO 5964 1985 standartą. TESE pateikiami terminai 9 kalbomis. 36

Pasirinkus iš TESE tezauro terminą,,migracija angl. migration, matome deskriptoriaus struktūrą, termino atitikmenis devyniomis kalbomis bei informaciją, kad siauresnis deskriptoriaus,,migration terminas,,country of origin buvo panaudotas indeksuojant vieną šioje duomenų bazėje esantį dokumentą. EUROVOC. http://www3.lrs.lt/pls/ev/ev.main. Europos žodynas (tezauras) EUROVOC - tai sisteminis žodžių ir žodžių junginių sąrašas. Jo paskirtis tiksliai atspindėti dokumentų sistemoje esančių dokumentų ir joje atliekamų paieškų konceptualų turinį. Tai daugiakalbis tezauras lietuvių, anglų, vokiečių ir prancūzų kalbomis sudarytas Europos Bendrijos institucijų dokumentų informacijai apdoroti. Tezauras apima 21 sritį, jį sudaro 127 teminiai mikrotezaurai Jis skirtas Europos institucijų bibliotekoms, dokumentų tarnyboms ir dokumentų duomenų bazėms bei jų paslaugų vartotojams. Nors žodyne svarbiausia Europos Sąjunga, vis dėlto tai yra platus daugiašakis tezauras. 37

Deskriptoriaus,,pilietinės teisės iš EUROVOC tezauro hierarchinė struktūra. Informacijos tvarkymui ir paieškai duomenų archyvuose naudojami HSM srities tezaurai HASSET tezauras Jungtinės Karalystės duomenų archyvo (United Kingdom Data Archive, toliau UKDA) Humanitarinių ir socialinių mokslų elektroninis tezauro (Humanities and Social Science Electronic Thesaurus, toliau HASSET 2 ) pirminis variantas paremtas plačiai žinomu UNESCO tezauru, kurį parengė Jean Aitchison (Paris: UNESCO, 1977) (ISBN: 92-3-101469-2). Vėliau jis buvo tobulinamas ir dabar naudojamas UKDA online paieškos sistemoje. HASSET yra daugiadalykis tezauras. Jį parengė UKDA savo paties tikslams, todėl šio žodyno turinys ir aprėptis atspindi UKDA poreikius ir išteklius. Plačiausiai ir išsamiausiai pristatytos pagrindinės socialinių mokslų sritys: politika, sociologija, ekonomika, švietimas, teisė, nusikalstamumas, demografija, sveikata, užimtumas, ir vis didesnis dėmesys skiriamas technologijai. Tezaure mažai naudojami tikriniai daiktavardžiai. Geografiniai pavadinimai naudojami tiek, kiek jie reikalingi indeksavimui. 2 HASSET thesaurus. In: UK Data Archive. [interaktyvus]. [žiūrėta 2007 m. 2007 m. rugpjūčio 11 d. Prieiga per internetą http://www.data-archive.ac.uk/search/hassetsearch.asp 38

HASSET sandara ir struktūra atitinka Didžiosios Britanijos standarto (British Standard 5723:1987) ir ISO 2788-1986 - Establishment and development of monolingual thesauri reikalavimus. Tezaure fiksuojami įprastiniai santykiai tarp leksinių vienetų (teiktini ir neteiktini terminai, žymima USE/UF), hierarchiniai santykiai (platesni ir siauresni terminai, žymima BT/NT) ir asociaciniai santykiai (žymima RT). Apibrėžiančių žodžių ir pastabų naudojimas HASSET atitinka aukščiau nurodytus principus. UKDA skatina nekomercinį HASSET taikymą su sąlyga, kad visais tezauro reprodukavimo ar adaptavimo atvejais bus nurodyta UKDA autorystė. HASSET termino,,crime struktūra Pasirinkus susijusį terminą punishment (CRIME RT PUNISHMENT), gaunamas šiai temai skirtų dokumentų sąrašas. 39

ICPSR Subject Thesaurus 3 JAV politinių ir socialinių tyrimų universitetų konsorciumo (Inter-university consortium for political and social research) dalykinis tezauras (toliau ICPSR tezauras) buvo parengtas vadovaujantis Guidelines for the Construction, Format, and Management of Monolingual Thesauri, Z39.19-1993 (NISO 1993) nuostatomis. ICPSR tezauras yra daugiadalykis. Jis apima visas ICPSR archyvo sritis: politikos mokslai, sociologija, istorija, ekonomika, švietimas, teisingumas, gerontologija, demografija, sveikata apsauga, teisė ir tarptautiniai santykiai. Asmenvardžiai ir geografiniai pavadinimai nėra tezauro leksiniai vienetai. Šie terminai įtraukti į specialiai šiam tikslui sudarytus kontroliuojamus sąrašus. ICPSR tezauro įvade pristatomos pagrindiniai šio žodyno sudarymo principai: daugiskaitos ir vienaskaitos, žodžių junginių, santrumpų ir akronimų, tikrinių daiktavardžių ir pavadinimų naudojimas. Tezaure fiksuojami įprastiniai santykiai tarp leksinių vienetų (teiktini ir neteiktini terminai, žymima USE/UF), hierarchiniai santykiai, kurie atspindi santykius giminė - rūšis, visuma - dalis, klasė - poklasė. Jie žymimi santrumpa BT/NT. Nehierarchiniai santykiai rodo artimus prasminius, 3 ICPSR Subject Thesaurus. In: Inter university consortium for political and social studies. [interaktyvus]. [žiūrėta 2006 m. lapkričio 20 d.]. Prieiga per internetą http://www.icpsr.umich.edu/thesaurus/index.html 40

ne sinonimiškumo, santykius (žymima RT). Apibrėžiančių žodžių ir vartojimo pastabų naudojimas ICPSRST atitinka aukščiau nurodytus principus. Paieška ICPSR bazėje tezaure pasirinkus terminą occupational categories RT employment qualifications RT job skills LiDA tezauras LiDA tezauro rengimo metodika Rengiant LiDA tezaurą ir pasirenkant jo sudarymo metodiką buvo vadovautasi nuostatomis, kad LiDA dokumentų tvarkybai ir ieškai reikalingas specialus HSM terminų tezauras lietuvių kalba, kuris turi tapti LiDA informacinės sistemos lingvistinio aprūpinimo sudėtine dalimi, užtikrinančia duomenų archyve saugomų dokumentų apdorojimo nuoseklumą ir aukštą paieškos kokybę. Atlikus kontroliuojamų žodynų rengimo praktikos Lietuvoje analizę 4, buvo nuspręsta, kad LiDA terminų tezauro sudarymui geriausia pasinaudoti esamais šios srities tezaurais anglų kalbą ir pasirinkus tinkamiausią bei plačiausiai HSM srityje naudojamą išversti jį į lietuvių kalbą. 4 Lietuvoje iš esmės nėra originalių tezaurų rengimo patirties. Pirmas ir kol kas vienintelis tezauras lietuvių kalba EUROVOC tezauras, skirtas Europos Bendrijos institucijų dokumentų informacijai tvarkyti. Lietuviškasis šio tezauro variantas yra trečiojo 3.1 Europos Bendrijos oficialių publikacijų biuro parengto tezauro vertimas. Šis tezauras yra daugiakalbis, greta terminų lietuvių kalba pateikiami terminai anglų, vokiečių ir prancūzų kalbomis. Tezauras naudojamas LR Seimo informacijos sistemos dokumentų, visų pirma LR teisės aktų tvarkymui ir paieškai. Kita vertus, 41

Atsižvelgus į pirmoje projekto vykdymo stadijoje tezauro rengėjų atliktos HSM srities kontroliuojamų žodynų analizės rezultatus, kai buvo analizuojama įvairių šios srities tezaurų apimtis paplitimas, atitikimas ISO standartams, buvo padaryta išvada, kad tinkamiausias LiDA tikslams yra HASSET tezauras. Jis sudaro lietuviškojo HSM srities tezauro pagrindą. Antra vertus, konkretūs LiDA poreikiai, kaupiamų dokumentų specifika, akademinės bendruomenės lūkesčiai, lietuvių kalbos ypatybės reikalauja, kad HASSET tezauro leksika būtų atitinkamai adaptuota. Todėl rengiant LiDA tezaurą buvo naudotasi įvairiomis lingvistinėmis priemonėmis lietuvių kalba: Lietuvos nacionalinės Martyno Mažvydo bibliotekos rubrikynu, EUROVOC tezauru, terminų žodynais ir kt. Renkantis tinkamiausią LiDA tezauro rengimo modelį buvo nuspręsta, kad atsižvelgiant į Europos ir pasaulio HSM archyvų šiuolaikinę praktiką, reikėtų rengti ne vienos kalbos, o dvikalbį anglų lietuvių kalbų tezaurą. Tezaurų rengimo verčiant ir adaptuojant esamus kitų kalbų tezaurus galimybes, metodus, jų privalumus ir trūkumus apibūdina ISO 5964 standartas. Šiame dokumente pristatomi trys daugiakalbio tezauro kūrimo metodai: Ab initio kūrimas: t.y. naujo žodyno kūrimas, nesiremiant jau egzistuojančio tezauro terminais. Jau egzistuojančio vienakalbio tezauro vertimas. Dviem ar keliomis kalbom jau egzistuojančių tezaurų derinimas ir jungimas. Pirmojo metodo privalumas lengva užtikrinti kalbos neutralumą, t.y. išvengiama konkrečios kalbos įtakos. Tokio tezauro kūrimo išlaidos yra didelės, kadangi reikia sukurti tezauro struktūrą, pateikti sąvokų apibrėžimus ir nustatyti atitikmenis įvairiomis kalbomis. Antrojo metodo didelis privalumas tas, kad nereikia kurti reikšminių žodžių masyvo, formuoti tezauro struktūros. Didžiausias šio metodo sunkumas tai, kad verčiant ne visada sutampa terminais reiškiamų sąvokų ribos ir vieną terminą tenka versti keliais kitos kalbos terminais, gali kadangi tezauras yra daugiadalykis juo gali naudotis ir kitos institucijos, visų pirma Europos institucijų bibliotekos, dokumentų tarnybos ir dokumentų duomenų bazės bei jų paslaugų vartotojai. Nors žodyne svarbiausia Europos Sąjunga, vis dėlto tai yra platus daugiašakis tezauras. Šiuo metu yra rengiamas Archeologijos terminų tezauras. Lietuvos bibliotekos rengdamos atitinkamus kontroliuojamus žodynus dokumentų tvarkybai ir ieškai, kaip antai rubrikynus ar hierarchinės struktūros dokumentų klasifikacijas, taip pat naudojasi kitų nacionalinių ar tarptautinių institucijų parengtais žodynais. Taigi kontroliuojamų žodynų rengimo Lietuvoje patirtis rodo, kad dažniausiai pasirenkamas atitinkamų tarptautinių žodynų vertimo į lietuvių kalbą ir adaptavimo būdas. 42

skirtis jų loginiai santykiai, hierarchijos lygis ir pan. Kartais visai nėra kitakalbio atitikmens, terminų kiekis, jų apimtis gali neatitikti konkrečių atitinkamos sistemos poreikių. Taikant trečiąjį metodą problemos kyla dėl tezaurų skirtingos hierarchinės struktūros, taip pat dėl svarbių terminų semantikos skirtumų. Todėl tezauro versijos skirtingomis kalbomis gali turėti skirtingas hierarchines struktūras. Nepaisant aukščiau minėtų trūkumų buvo pasirinktas daugiakalbio tezauro rengimo būdas, t.y. jau egzistuojančio vienakalbio žodyno vertimas į lietuvių kalbą ir jo pildymas bei adaptavimas. LiDA tezauro naudojimas LiDA tezauras tai - dviejų kalbų elektroninis kontroliuojamas žodynas. Žodyne visi terminai yra anglų ir lietuvių kalbomis. Vartotojai naudodami lietuviškus terminus gali atlikti angliškų tekstų paiešką ir atvirkščiai. Tezauras apima daugelį HSM ir kitų mokslo bei praktinės veiklos sričių. Pagrindinės tezauro sritys: 1. aplinkos apsauga, 2. ekonomika, 3. energetika, 4. darbas ir užimtumas, 5. darbo santykiai, 6. demografija, 7. finansai, 8. gamyba ir technologija, 9. geografija, 10. karyba, 11. komunikacijos, 12. laisvalaikis, sportas ir kultūra, 13. lygios galimybės, 14. medicina, 15. mokslas, 16. politika, 17. pramonė, 18. prekyba, 19. religija, 43

20. socialinė apsauga, 21. socialinė rūpyba, 22. socialiniai klausimai, 23. sociologija, 24. statistika, 25. sveikatos apsauga, 26. šeima ir šeimos ūkis, 27. švietimas ir ugdymas, 28. teisė, 29. transportas, 30. vaikų teisės, 31. verslas, 32. žemės ūkis ir miškininkystė, 33. žemės ūkio ir maisto produktai, 34. žiniasklaida, 35. žmogaus teisės 36. žmonės su negalia Kai kurios sritys yra pristatytos detaliau, kitos fragmentiškai. Detalumas daugiausiai priklauso nuo atliekamų HSM srities tyrimų tematikos ir atitinkamos terminologijos poreikių. Rengiant LiDA tezaurą, buvo atsisakyta daugelio Jungtinės Karalystė teritorijų, miestų, kitų geografinių pavadinimų, taip pat kai kurių Jungtinei Karalystei būdingų daiktų, reiškinių, procesų pavadinimų. Kai kuriose vietose prie lietuviško termino vartotojas gali rasti pastabą (Jungtinė Karalystė), kuri rodo, kad lietuvių kalba tokio atitikmens nėra, todėl pateikta tik bendroji sąvoka ar paaiškinimas. Pvz., POOR LAWS - Paramos vargšams įstatymai (Jungtinė Karalystė) Kita vertus, dėl būtinumo papildyti LiDA tezaurą lietuviškais terminais, pavadinimais ir pan., kurie turi turėti atitikmenį anglų kalba, šie vertiniai gali būti ne visai tikslūs. Pvz., Avarinis gyvenamasis fondas EMERGENCY DWELLING FUND. Visais atvejais LiDA tezaure palikta HASSET tezauro deskriptorių straipsnių struktūra ir užfiksuoti tokie santykiai tarp leksinių vienetų, kurie buvo originale. Taigi LiDA tezaure fiksuojami sinonimijos, gimininiai rūšiniai ir asociaciniai santykiai. 44

Deskriptoriaus ir nedeskriptoriaus sinonimijos santykiai žymimi santrumpomis UF (Used for vartojamas vietoj) ir USE (naudok). Santrumpa UF rodo deskriptoriaus ir nedeskriptoriaus, kuriam jis atstovauja, santykius. Pvz.: COMPLEMENTARY THERAPIES Netradicinis gydymas UF COMPLEMENTARY MEDICINE Netradicinė medicina UF COMPLEMENTARY HEALTH CARE Netradicinė sveikatos priežiūra UF ALTERNATIVE MEDICINE Alternatyvi medicina UF ALTERNATIVE THERAPIES Alternatyvus gydymas Santrumpa USE (naudok) reiškia nedeskriptoriaus ir deskriptoriaus, kurį jis pakeičia santykius. Pvz: COMPLEMENTARY MEDICINE USE COMPLEMENTARY THERAPIES Netradicinė medicina Netradicinis gydymas COMPLEMENTARY HEALTH CARE USE COMPLEMENTARY THERAPIES Netradicinė sveikatos priežiūra Netradicinis gydymas ALTERNATIVE MEDICINE USE COMPLEMENTARY THERAPIES Alternatyvi medicina Netradicinis gydymas ALTERNATIVE THERAPIES USE COMPLEMENTARY THERAPIES Alternatyvus gydymas Netradicinis gydymas Ieškant informacijos apie dalyką, kuris gali būti pavadintas alternatyvus gydymas, alternatyvi medicina, netradicinė sveikatos priežiūra ar netradicinė medicina, reikia vartoti deskriptorių Netradicinis gydymas. T. y. sinonimijos arba ekvivalentiškumo santykiai parodo indeksuotojui arba vartotojui, kokį deskriptorių reikia naudoti vietoje pasirinkto nedeskriptoriaus. Hierarchiniai gimininiai ir rūšiniai santykiai žymimi santrumpomis BT (platesnis terminas), kai reikia parodyti santykį tarp specifinio ir bendresnio deskriptoriaus ir NT (siauresnis terminas), kai siekiama parodyti santykius tarp bendro ir siauresnės ar konkretesnės prasmės deskriptoriaus. Skaitmuo prie santrumpos BT (6) arba (7) rodo skirtingą jų hierarchijos lygį. Pavyzdžiui, COMPLEMENTARY THERAPIES Netradicinis gydymas 45

UF COMPLEMENTARY MEDICINE UF COMPLEMENTARY HEALTH CARE UF ALTERNATIVE MEDICINE UF ALTERNATIVE THERAPIES NT(5) ACUPUNCTURE NT(5) CHIROPRACTIC NT(5) FOLK MEDICINE NT(5) HOMEOPATHY BT(6) MEDICAL TREATMENT METHODS BT(7) MEDICAL SCIENCES Netradicinė medicina Netradicinė sveikatos priežiūra Alternatyvi medicina Alternatyvus gydymas Akupunktūra Chiropraktika Liaudies medicina Homeopatija Gydymo metodai Medicinos mokslai Asociatyvius deskriptorių santykius rodo santrumpa RT (8) (related term asociatyvus terminas). Pavyzdžiui: MARKET ECONOMY Rinkos ekonomika BT(6) ECONOMIC SYSTEMS Ekonominės sistemos BT(7)ECONOMICS Ekonomika RT(8)CAPITALISM Kapitalizmas RT(8) ECONOMIC COMPETITION Ekonominė konkurencija RT(8)PRIVATIZATION Privatizavimas Indeksuotojui ir vartotojui, kuris ketina naudoti tam tikrą deskriptorių asociatyvūs santykiai rodo, kad vietoje deskriptoriaus Rinkos ekonomika jis galėtų naudoti terminus Ekonominė konkurencija, Privatizavimas ar Kapitalizmas, kurie taip pat tinka konkrečios informacijos tvarkymui ar paieškai, o kartais gali net tiksliau išreikšti reikiamą sąvoką. Esant reikalui deskriptoriaus reikšmė gali būti siaurinama arba paaiškinama. Pavyzdžiui: MONEY SUPPLY Pinigų pasiūla (pinigų, cirkuliuojančių šalies ekonomikoje, kiekis) INCONTINENCE Nelaikymas (medicina) Tezauro kūrimas yra tęstinis procesas, kadangi kiekvienoje mokslo srityje ar kryptyje vyksta pokyčiai: atsiranda nauji terminai ar kinta jais reiškiamų sąvokų ribos. Į tezaurą nuolat turi būti įtraukiami nauji terminai, pašalinami seni, neteiktini terminai. Akivaizdu, kad kaupiant ir tvarkant Lietuvos HSM duomenų archyvą atsiras naujų lietuviškų terminų, kurie būtini indeksavimui ir paieškai. Kita vertus, gavus HASSET tezauro papildymus ir pakeitimus atitinkamai turės būti modifikuojama angliškoji ir lietuviškoji tezauro leksikos dalis. 46

Tezauro duomenys yra prieinami LiDA svetainėje: http://www.lidata.eu. pasirinkti kalbą įvesti pirmą raidę arba termino pradžią atlikti paiešką spragtelėti +, jeigu domina susiję terminai spragtelėti ant susijusio termino, jeigu domina tolimesnės sąsajos. Vadovaujantis minėtomis taisyklėmis pasirenkame lietuvių kalbą, įvedame termino pradžią (žm. ieškome termino,,žmogaus teisės ) ir atliekame paiešką. Radus terminą, nuspaudžiame,,+ ir gauname susijusių terminų sąrašą. Jeigu vartotoją domina tolimesnės sąsajos, reikia spragtelėti ant norimo termino, pvz., Kultūrinės teisės. 47

5. Metaduomenys. Metaduomenų schemos ir elementų rinkiniai. Empirinių duomenų aprašymo standartas ir jo taikymas archyvo reikmėms. Duomenų archyve LiDA yra kaupiami įvairūs empiriniai (gyventojų surašymų, namų valdų, rinkimų, vyriausybės ir savivaldybių, visuomenės nuomonės apklausų ir tyrimų, statistikos ir kt.) duomenys, kuriuos sukaupia tyrėjai. Taip pat čia saugomi ir prieinami publikuoti informacinio pobūdžio leidiniai (knygos, žurnalai), nepublikuota informacija (mokslinių tyrimų ataskaitos, disertacijos) ir mokslinių tyrimų apžvalgos. Visi šie duomenys ir informacija saugoma šiais formatais: DDI Document (*.xml); SPSS System (*.sav); SPSS Portable (*.por); SPSS Syntax (*.sps); SAS (*.sp1); Stata 7 ir Stata 8 (*.dta); Statistica (*.sta); NSDstat (*.nsf); dbase (*.dbf); DIF (*.dif); Delimited Text (*.txt, *.cvs). LiDA ir lingvistinis aprūpinimas 48

HSM duomenų archyvo sukūrimui ir egzistavimui yra būtinas lingvistinis aprūpinimas kitaip tariant archyve talpinamų duomenų bei informacijos aprašymo taisyklių sukūrimas tų duomenų pateikimo į archyvą, saugojimo, prieigai užtikrinti. LiDA lingvistinio aprūpinimo funkcinei struktūrai turėjo įtakos jau egzistuojantys šalyje ir užsienyje atvirieji elektroninių išteklių archyvai. Pirmiausia buvo remiamasi Atvirų archyvų iniciatyvos metodologija, kuri pateikta ISO standarte ISO 14721:2003 Space Data and Information Transfer System - Open Archival Information System - Reference Model. Šiame standarte pakankamai aiškiai išdėstyti pagrindiniai reikalavimai, keliami tokio pobūdžio archyvams. Pagal šį modelį sudarytas LiDA lingvistinis aprūpinimas užtikrina šių funkcijų vykdymą: komplektavimą, apima visus veiksmus susijusius su elektroninės informacijos ir duomenų surinkimu iš tyrėjų ir patalpinimu į bendrą serverį. Šis procesas reikalauja pasikeisti bibliografine ir administracine informacija su tyrėjais; registravimą: naujai gauta elektroninė informacija ar duomenys yra užregistruojami archyve ir bibliografinė informacija pateikiama į elektroninius katalogus; patikrinimą: tai procesas, kurio metu atliekamas failų formato bei elektroninės informacijos ar duomenų loginio integralumo patikrinimas; katalogavimą: tai elektroninės informacijos ar duomenų metaduomenų įrašo sudarymo procedūros, užtikrinančios, kad informacija ar duomenys būtų surastos kataloguose bei pasaulio mokslinių tyrimų archyvuose; saugojimo tvarkymą: čia atliekamos tokios procedūros kaip išsaugojimas skaitmeninėse laikmenose, pastovus atsarginių kopijų darymas bei kopijavimas įvairiems tikslams. Čia ypatingas vaidmuo tenka techniniams metaduomenims, fiksuojantiems informaciją apie skaitmeninio objekto migravimą archyve; pakavimą ir pateikimą: užtikrina skaitmeninio objekto prieinamumą, tarnauja statistikai, monitoringui ir kitiems tikslams. Jo paskirtis yra skaitmeninio objekto paieška, reikalingos skaitmeninio objekto kopijos paieška ir perdavimas į kreipties modulį. Šis procesas gali apimti tokias procedūras kaip reikalingos skaitmeninio objekto dalies radimas, kopijavimas arba viso teksto pridėjimas, tam tikras skaitmeninio objekto dalies reformatavimas peržiūrai, atspausdinimas; kreiptį: užtikrina prieigą prie Archyvo skaitmeninių objektų. Šis procesas apima suradimo galimybių suformavimą, vartotojo identifikavimą, vartotojo teisių bei profilio nustatymą ir kt.; 49

integravimą: į bendrą Lietuvos ir Europos mokslinių tyrimų elektroninio turinio erdvę. Truputį istorijos. Pagal Bendrojo programavimo dokumentą 2007-2013 metams, iš 2007-2013 metams 800 milijonų Lt skiriamų Informacinės visuomenės plėtrai, elektroninio turinio plėtrai bus skirta 70%, o infrastruktūros plėtrai, t.y., technikai 30%. Tai yra atvirkštinis santykis, lyginant su prieš tai buvusiu santykiu. Į informacinės visuomenės programą buvo įrašyta mokslinių duomenų archyvavimo finansavimas, kurio ankstesniame BPD dokumente nebuvo. Taigi, su naujojo BPD 2007-2013 m. patvirtinimu atsivėrė naujos perspektyvos gauti finansavimą mokslinių duomenų archyvų kūrimui. HSM LiDA archyvas yra pirmasis visateksčių mokslinių duomenų archyvas, pradėtas kurti 2007 m. Tačiau, ar jis buvo kuriamas tuščioje vietoje? Suprantama, kad ne. Pirmiausia buvo pasinaudota Slovėnijos bei Vokietijos patirtimi, bei pasisemta patirties iš LNB kartu su partneriais vykdomo projekto Integralios virtualios bibliotekų informacinės sistemos sukūrimas (projekto svetainė internete http://www.epaveldas.lt). 50

LNB projektą verta paminėti, nes metodologine prasme jis buvo naudingas, formuojant LiDA lingvistinį aprūpinimą. Svarbiausia šio projekto ypatybė tai, kad jame dalyvauja trys skirtingos atminties institucijos: archyvai, muziejai ir bibliotekos. Todėl teko ne tik derinti skirtingus standartus, bet ir surasti sąlyčio taškus, parengti vieningą metaduomenų parengimo metodologiją, kuri galėtų būti atspindėta štai tokia schema: Iš schemos mes matome didžiulę įvairovę standartų, naudojamų dokumentų arba skaitmeninių objektų aprašymui. Pavyzdžiui, aprašo parengimui: archyvuose ISAD, bibliotekose ISBD, muziejuose RIS. Sukurto lingvistinio aprūpinimo esmę sudaro tai, kad jis užtikrino galimybę dalyvaujančioms institucijoms rengti savo metaduomenis taip, kaip yra įpratusios pagal savo taisykles ir savo srities standartus, o portale pateikiami tik labai lakoniški metaduomenys DC formatu. Štai iš čia matomo portalo http://www.epaveldas.lt per nuorodą į pirminę sistemą einama toliau į LNB, arba į Dailės muziejų ir susipažįstama su išsamiu aprašu. 51

Ši idėja pasirodė priimtina ir projektuojant LiDA, todėl suformuotas LIDA lingvistinis aprūpinimas iš esmės yra grindžiamas čia pateiktu pavyzdžiu. LiDA lingvistinis aprūpinimas buvo suformuotas remiantis Lietuvos ir pasaulio šalių elektroninių archyvų, katalogų bei juos apibūdinančių dokumentų analize, siekiant nustatyti ir pasiūlyti optimaliausią LiDA metaduomenų turinį ir formą, kuo labiau atitinkančius šiuolaikinius reikalavimus, keliamus Europos elektroninio turinio prieigai bei siekiant suderinti su Lietuvos skaitmeniniu turiniu. Suformuotas lingvistinis aprūpinimas leido pasiūlyti HSM duomenų archyvo architektūrą, padedančią užtikrinti: spartų duomenų perdavimą, vykdant atskiras užklausas bei operuojant dideliais duomenų kiekiais; galimybę palaikyti daugialypės terpės dokumentus, sudarytus iš teksto ir atvaizdų; paskirstyto pradinio duomenų apdorojimo galimybę, kuriai esant projekto partneriai gali patys parengti skaitmeninius fondus ir talpinti juos į bendrąją duomenų bazę; archyve saugomiems formaliems dokumentams suteikti nuolatinius vardus. Lingvistinis aprūpinimas taip pat užtikrina virtualios sistemos archyvavimą ir objektų erdvės tvarkymą: integruojant skaitmeninius objektus įvairiais formatais; formuojant skaitmeninių objektų erdvę taip, kad ją galima kuo efektyviau pateikti paieškai ir skaitmeninių objektų pateikimui; užtikrinant skirtingų metaduomenų ir formatų suderinamumą, parengus metaduomenų kodavimo sistemų sankirtas. HSM duomenų archyvo Lingvistinis aprūpinimas užtikrina monitoringo realizavimą. HSM duomenų archyvo Lingvistinis aprūpinimas užtikrins skaitmeninių objektų prieigos ir sklaidos realizavimą bei suderinamą su Lietuvos ir Europos skaitmeniniu turiniu: sparčią prieigą prie skaitmeninių objektų saugomų KTU pagrindiniame skaitmeninės informacijos Archyve bei išsamių archyvinių aprašų projekto partnerių sistemose; informacijos pateikimą internete per interneto sąsają; patogią prieigą prie dokumentų pagal įvairius jų požymius; paieškos rezultatų išdavimą pagal sąrašą, kuriame turi būti nurodomi užklausą atitinkantys dokumentai ar jų dalys. 52

LiDA archyvas Prieš pradedant LiDA kūrimą, reikėjo atsakyti į esminius klausimus, ar tai bus archyvas, atitinkantis archyvų srities ideologiją, standartus ir, ar tai bus visateksčių duomenų bazė. Atsižvelgiant į tai, kad į LiDA numatoma talpinti empirinius duomenis: gyventojų surašymų, namų valdų, rinkimų, visuomenės nuomonių apklausų ir tyrimų duomenys, akivaizdu, kad turi būti kuriamas archyvas, atitinkantis visus reikalavimus, keliamus archyvams. LiDA tai HSM duomenų archyvas. Prieš pristatant mokslinių duomenų archyvavimo koncepciją, turime pateikti archyvo sąvoką, kurią mes suprantame kaip skaitmeninių objektų saugyklą, atliekančią tradicines kaupimo, saugojimo ir prieigos prie informacijos funkcijas bei paskirstytą sistema, platinančią turimą skaitmeninę informaciją bei aktyviai skatinančią bei palaikančią šios informacijos kūrimo procesą. Jeigu LiDA yra archyvas, tuomet teko susipažinti, pirmiausia, su archyvuose naudojama terminologija bei naudojamais standartais. Pagal kokius dokumentus ir standartus archyvuose kuriami metaduomenys? Pradžioje panagrinėkime fizinių objektų ir skaitmeninių objektų panašumus bei atitinkamus jų aprašymus (metaduomenis). Tradiciniai archyviniai fondai ir jų sudėtinės dalys atspindimi archyviniuose aprašuose, kurie padeda atitinkamai identifikuoti kiekvieną objektą, suteikia informacijos apie jo turinį, struktūrą, sukūrimo kontekstą bei leidžia vartotojui įvertinti, ar objektas gali būti jam naudingas. Siekiant pateikti rekomendacijas dėl archyvinio aprašo sudarymo, palyginome ISAD (G) (Pagrindinis Tarptautinis standartinis arhyvinis aprašymas, angl. General International Standard Archival Description 5 ) terminologiją su metaduomenų apibrėžimais: ISAD (G) nurodo, jog tai yra bendrosios archyviniams aprašams, nepriklausomai nuo aprašomo vieneto ir pobūdžio bei apimties, taisyklės. Jose nurodoma, kaip formuluoti informaciją kiekvienam iš 26 elementų, kurie išdėstyti 6 pagrindinėse srityse (identifikavimo, konteksto, turinio ir sandaros, prieigos ir naudojimo sąlygų, sietinės medžiagos, pastabų), kurios leidžia sudaryti išsamų aprašomo objekto vaizdą. ISAD (G) garantuoja išsamių, tinkamų ir aiškių aprašų sudarymą, palengvina informacijos apie archyvinę medžiagą sudarymą, palengvina informacijos apie archyvinę medžiagą mainus ir paiešką, sudaro galimybę keistis autoritetiniais duomenimis, leidžia sujungti aprašus iš įvairių 5 http://www.ica.org/en/node/30000 53

saugyklų į vieningą informacijos sistemą. Todėl galima tvirtinti, kad archyvinis aprašas yra archyvinių objektų metaduomenys, kaip kad katalogų įrašai yra bibliotekų metaduomenys. Tuo atveju, kai fizinis archyvo objektas yra suskaitmenintas, būtina parengti prieigą prie jo turinio. Todėl iškyla būtinybė aprašyti skaitmeninio objekto vaizdą arba jo turinį. Jei objektas yra fondas, reikia sudaryti viso fondo archyvinį aprašą su jo hierarchine struktūra, atskleidžiančia jo struktūrines dalis. Šis procesas yra vadinamas "aprašomųjų metaduomenų" sudarymu. Jeigu archyvinis aprašas gali būti traktuojamas kaip archyviniai metaduomenys ir jeigu archyvinis fizinių objektų aprašas ir archyvų skaitmeninių fondų metaduomenys yra, galima daryti išvadą, kad skaitmeniniai objektai yra aprašomi taip pat, kaip ir fiziniai objektai. Tai yra labai svarbi išvada, kuri gali būti pateikta schematiškai: Pagrindinės archyvinio aprašo charakteristikos yra aiškiai suformuluotos ISAD (G). Svarbiausia šio standartinio aprašo ypatybė yra ta, kad jis sudaro galimybę atspindėti archyvinį fondą taip, kaip jis egzistuoja. Tai reiškia, kad archyvinis aprašas pradedamas rengti nuo pagrindinio, aprašant specifinius entitetus, nuo fondo prie bylos (fizinės) ir atskirų jos vienetų. Todėl kuriant LiDA buvo nutarta laikytis tos pačios logikos, kurią diktuoja ISAD (G) kurti hierarchinę archyvo struktūrą, išreiškiamą taip, kaip parodyta paveikslėlyje: 54

Svarbu pastebėti, kad ISAD (G) tinka ir tradicinės formos objektų aprašui ir kompiuterinio archyvo objektų aprašui. Jeigu aprašomieji metaduomenys yra naudojami prieigai prie skaitmeninio fondo, hierarchinė metaduomenų struktūra turi užtikrinti prieigą prie kiekvieno atskiro fondo vieneto, saugomo archyve. Tuo pačiu metu, elektroninėje aplinkoje metaduomenys privalo atkurti loginį, o ne fizinį archyve saugomų objektų ryšį. Siekiant patenkinti šiuos reikalavimus, aprašomieji metaduomenys privalo turėti tokią pačią hierarchinę struktūrą kaip ir tradiciniai. Tai reiškia, kad jie turi būti suderinti su tarptautiniu archyviniu aprašu ISAD (G), kuris sudaro galimybę parengti archyvinio aprašo hierarchinę struktūrą. Kitaip tariant, pilnesnį ir patogesnį archyvų objektų bei duomenų bazių turinio aprašymą elektroninėje aplinkoje. Nors ISAD (G) tinka ir skaitmeniniams objektams aprašyti, vis dėl to skaitmeninių objektų aprašymui buvo sukurta keletas metaduomenų modelių, pavyzdžiui, Dublin Core, kuris yra šiuo metu vienas populiariausių ir Lietuvoje pripažintas šalies standartu (LST ISO 15836:2007: Informacija ir dokumentai. Dublin Core metaduomenų elementų grupė (tapatus ISO 15836:2003). Dublin Core schema susideda iš elementų. Ji gali palaikyti paprastą ryšį tarp dviejų skaitmeninių objektų, kadangi "ryšio" elementas, apibūdinamas kaip "nuoroda į susijusį išteklių" turi šiuos "kvalifikatorius": "dalis", "turi dalį". Tuo pačiu Dublin Core (DC), kaip ir kiti metaduomenys sukurti skaitmeniniams ištekliams, negali pilnai būti pritaikyti siekiant pilnai aprašyti archyvinį skaitmeninį išteklių. Be to, kai kurie DC elementai gali sukelti netgi tam tikrą sumaištį, pavyzdžiui, "informacija apie kūrėją". Archyvuose kiekvieno archyvinio vieneto aprašas yra reikšmingas tik kai yra aiškiai aprašytas 55

fondo, kuriam jis priklauso, kūrėjas (angl. Creator). Tik tai kūrėjo istorija ir struktūra gali padėti vartotojui suprasti sąlygas, kuriomis dokumentas buvo sukurtas arba surinktas, kritiškai įvertinti dokumentų turinį. Šio tipo duomenys yra labai svarbūs aprašui. Būtent tokių duomenų ir trūksta Dublin Core. DC elementas vadinamas "kūrėju" yra apibūdinamas kaip už entitetų turinį pirminės atsakomybės sritis. Archyvams toks apibūdinimas nėra tinkamas. ISAD (G) kūrėją apibūdina kaip "Kolektyvas, šeima arba asmuo sukūręs, surinkęs arba turintis dokumentus savo personalinės arba kolektyvinės veiklos metu". Žmonės, atsakingi už dokumentų patalpinimą į fondus, dažniausiai skiriasi nuo kūrėjo. Taigi, atsižvelgiant į "kūrėjo" apibūdinimą, pateikiamą DC, yra tam tikras prieštaravimas. Jeigu naudojamas DC apibrėžimas, neįmanoma pažymėti arba nurodyti, kas surinko ir yra šio dokumento (archyvo) savininkas. Vėliau kalbėdami apie DDI kodifikatorių pastebime, jog tyrimo vykdytojas ir skaitmeninio dokumento kūrėjas yra atskirti. DC metaduomenų schemos sukūrimu buvo siekiama iki minimo sumažinti elementų skaičių, siekiant aprašyti skaitmeninius išteklius. Beje, DC yra tik bibliografinis modelis, kuris negali būti pakankamai efektyviai pritaikytas, aprašant archyvinius objektus. Todėl praktika rodo, jog be galo sunku parengti korektiškus archyvinius aprašus, panaudojant šią metaduomenų schemą. O tai savo ruožtu apsunkins ir skaitmeninių objektų paiešką. Vėlesnės DC versijos buvo praturtintos semantinėmis priemonėmis. "Kvalifikatorių" dėka buvo sudaryta galimybė tiksliau aprašyti kūrėją, pavyzdžiui <creator.archives.creator> Rengiant Lietuvos HSM duomenų archyvinio aprašo sudarymo taisykles bei kuriant HSM duomenų archyvą pirmiausia reikėjo apsispręsti dėl skaitmeninių objektų aprašo išsamumo. Reikėjo atsakyti į klausimą, ar skaitmeninio aprašymui pakaks Dubline Core laukų, kuris yra skiriamas išteklių pateikimui internete, ar reikės naudoti kitą metaduomenų standartą. Siekiant išlaikyti tradiciniuose archyvuose tvarką ir logiką, kuri yra išreiškiama tokia schema, buvo pasirinkta, jog privalom sukurti hierarchinę LiDA struktūrą, kuri leistų aprašyti fondą taip: pirmiausia parengti failų apyrašą, kuris archyvų standartuose ISAD (G) vadinamas serija, po to atskirą failą, ir jam atskirus esančius dokumentus. Apsisprendus dėl tokios LiDA hierarchinės struktūros, tapo akivaizdu, kad DC, nors ir yra skaitmeninių išteklių standartas neužtikrinus tokio detalaus duomenų aprašymo. Reikėjo ieškoti schemos, leidžiančios parengti tokio pobūdžio metaduomenis ir labiausiai atitinkančius socialinę-humanitarinę mokslų specifiką. LiDA archyvinio saugojimo metaduomenų sudarymui buvo pasiūlyta naudoti DDI kodifikatorių, leidžiantį apibūdinti bet kokio struktūrinio lygmens išteklius: fondą, atskirą išteklių, ištekliaus sudėtinę dalį. 56

Metaduomenys Labai svarbus LiDA lingvistinio aprūpinimo elementas yra metaduomenys. Metaduomenys yra struktūriškai apibrėžta informacija, kuri apibūdina, paaiškina dokumentą ar informacinį išteklių, nurodo jo buvimo vietą arba kitokiu būdu palengvina jo suradimą, naudojimą arba valdymą. Metaduomenys yra informacija apie bet kokio tipo ar rūšies informacijos išteklių. Šie duomenys apibūdina tokius informacijos išteklių aspektus: Turinio informacija vidinė charakteristika, apibūdinanti intelektualiąją informaciją, teikiamą informacijos išteklių (pavyzdžiui, tematika, žanras); Konteksto informacija išorinė charakteristika, apibūdinanti duomenis, susijusius su veiksmais informacijos išteklių atžvilgiu (kas, kada, kur, kaip sukūrė/pakeitė/atnaujino arba atliko kitus veiksmus su konkrečiu dokumentu); 57

Struktūros informacija vidinė ar išorinė charakteristika, apibrėžianti formalius ryšius išteklių viduje ar tarpusavyje. Pavyzdžiui, kai aprašomos dokumento dalys (skyriai, tomai, straipsniai), nurodomas jų ryšys su visu dokumentu (vidiniai ryšiai), o kai informacija apie tą patį įvykį pateikta skirtinguose informacijos ištekliuose, metaduomenys nurodo į išorinius ryšius. Lygiai kaip, pavyzdžiui, kataloguotojai nusprendžia, ar katalogo įrašas bus kuriamas visam rinkiniui, ar atskirai kiekvienam tomui, taip ir metaduomenų kūrėjas priima panašius sprendimus. Metaduomenys taip pat gali būti naudojami bet kuriame informacinio modelio, kurio pagrindu sukurti IFLA Funkciniai reikalavimai bibliografiniams įrašams, lygmenyje (kūrinys, išraiška, apraiška, dokumentas). Pavyzdžiui, metaduomenų įrašas gali apibūdinti pranešimą, konkrečią pranešimo laidą arba atskirą tos pranešimo laidos kopiją. Metaduomenys gali būti įterpti į skaitmeninį objektą arba gali būti saugomi atskirai nuo jo. Jie dažnai įterpiami į HTML dokumentus ir atvaizdo failų antraštes. Metaduomenų saugojimas kartu su jų apibūdinamu objektu užtikrina, kad jie nebus prarandami, panaikina duomenų ir metaduomenų susiejimo problemas bei garantuoja, kad kartu su objektu bus atnaujinami ir metaduomenys. Metaduomenų rūšys Pagrindinės metaduomenų funkcijos yra palengvinti skaitmeninių informacijos išteklių identifikavimą, vietos nustatymą, išrinkimą, valdymą, naudojimą ir saugojimą tinklinėje aplinkoje. Pagal šias funkcijas skiriamos tokios metaduomenų rūšys: 1. Aprašomieji metaduomenys tai duomenys, kurie identifikuoja ir apibūdina patį informacijos išteklių. Pateikiami pagrindiniai dokumento atributai kūrėjas (autorius, sudarytojas ir pan.), antraštė, dalykas, anotacija ir pan. Tokių metaduomenų pavyzdys katalogo įrašai, pagalbinės rodyklės. 2. Administravimo metaduomenys yra susiję su atliekamų procesų valdymu. Jie apima įvairius technologinius procesus: komplektavimas, skaitmeninimas, autorių teisių apsauga, dokumentų priežiūros veiksmai (konservavimas, restauravimas, skaitmeninimas). Administravimo metaduomenys paprastai skirstomi į: Autorių teisių valdymo apibrėžia intelektinės nuosavybės teises ir su jomis susijusias naudojimo taisykles bei apribojimus. 58

Išsaugojimo dokumentuoja visus veiksmus, nukreiptus į informacijos išteklių išsaugojimą. Tai yra informacija apie fizinę dokumento būklę, atliktus restauravimo, konservavimo, skaitmeninimo veiksmus, skaitmenintų ar skaitmeninių dokumentų formatų atnaujinimą ir pan. Techninius ši metaduomenų rūšis siejasi su skaitmeninių ir skaitmenintų išteklių valdymu. Skaitmeninėje aplinkoje informacijos išteklių prieinamumas ir išsaugojimas priklauso nuo įvairių techninių parametrų programinės ir techninės įrangos, kuria naudojantis buvo sukurti dokumentai, bylų formatų ir suspaudimo metodų ir pan. Naudojimo metaduomenys, fiksuojantys informacijos išteklių naudojimo pobūdį. (Kaip įvairių formatų išteklius galima panaudoti įvairiems tikslams, pavyzdžiui, parodoms.) Naudojimo metaduomenys fiksuoja ir pačią vartotojo ir ištekliaus sąveiką (pavyzdžiui, gali teikti informaciją apie vartotojo statusą ir jam leidžiamus atlikti veiksmus). Metaduomenys paaiškina bet kokio lygio informacijos rinkinius gali aprašyti kolekcijas, atskirą išteklių ar didelio ištekliaus sudedamąją dalį (pavyzdžiui, fotografiją straipsnyje). Metaduomenys taip pat gali būti naudojami aprašyti bet kokio lygio informacijos modeliams, išvardintiems IFLA (Tarptautinė bibliotekų asociacijų ir jų įstaigų federacija, angl. The International Federation of Library Associations and Institutions 6 ) Funkciniuose bibliografinių įrašų reikalavimuose (angl. Functional Requirements for Bibliographic Records): darbams, posakiams, įrodymams ar užrašams. Pavyzdžiui, metaduomenų įrašas gali aprašyti konferencijos pranešimą arba šio pranešimo specialią kopiją. Metaduomenų įrašo struktūra Metaduomenų įrašas susideda iš tam tikro skaičiaus iš anksto apibrėžtų elementų, reprezentuojančių informacijos ištekliaus savybes. Tokių elementų ir jų naudojimo taisyklių rinkinys vadinamas metaduomenų schema, nurodanti, kaip ir kokius duomenis apie išteklių būtina pateikti. Kiekviena metaduomenų schema paprastai turi ribotą skaičių elementų, kiekvienas elementas turi vardą ir atskirą reikšmę. Pačių elementų apibrėžimas ar reikšmė yra žinoma kaip schemos semantika. Reikšmės, duotos metaduomenų elementams, yra turinys. Metaduomenų schemos paprastai tiksliai apibrėžia elementų vardus ir jų semantiką. Dar schemos gali nusakyti turinio taisykles, kaip turinys turi būti formuluojamas (pavyzdžiui, kaip identifikuoti pagrindinį 6 http://www.ifla.org/ 59

pavadinimą), turinio atvaizdavimo taisykles (pavyzdžiui, rašybos didžiosiomis raidėmis taisyklės), leidžiamas turinio reikšmes (pavyzdžiui, terminai turi būti naudojami iš specialaus kontrolinio žodyno). Taip pat metaduomenų schema gali pasižymėti specifine sintakse (gali būti metaduomenų schema nepriklausoma nuo sintaksės, tai yra be sintaksę nurodančių taisyklių). Sintaksė reglamentuoja metaduomenų elementų ir jų turinio kodavimą bei pateikimą elektroninėje terpėje. Kodavimui naudojamos vadinamosios žymių kalbos (angl. markup languages) formalių taisyklių ir įrankių rinkinys, kuris leidžia pateikti ir interpretuoti (pavyzdžiui, formatuoti, keistis duomenimis tarp įvairių sistemų ir pan.) duomenis skaitmeninėje aplinkoje. Dauguma dabartinių metaduomenų schemų naudoja SGML (angl. Standard Generalized Mark-up Language) arba XML (angl. Extensible Mark-up Language). SGML labai sudėtinga, todėl dažnai naudojamasi jos poaibiais. Ilgainiui paplito SGML poaibis XML kalba, kuri leidžia aprašyti ir formaliąsias dokumento savybes, ir informacijos išteklių turinį, atspindėti metaduomenų elementus ir jų tarpusavio ryšius. Dublin Core metaduomenų iniciatyva Dublin Core metaduomenų iniciatyvos (angl. Dublin Core, toliau DC) elementų rinkinio atsiradimas siejamas su seminaru, vykusiu 1995 Dubline (JAV, Ohio valstija). Šio standarto sukūrimą paskatino didėjančių internete prieinamos informacijos masyvų valdymo problemos, nes tapo aišku, kad bibliotekininkai nepajėgs vieni registruoti interaktyvius dokumentus. Šio standarto esmė sukurti paprastą metaduomenų schemą, kuri leistų ne profesionalams (pavyzdžiui, leidėjams, autoriams) patiems aprašyti elektroninius informacijos išteklius. Lietuvoje skaitmeninės interneto informacijos aprašymui buvo patvirtintas LST ISO 1586:2007. Standartą sudaro 15 elementų: Antraštė (angl. Title) dokumento pavadinimas; Kūrėjas (angl. Creator) dokumento autorius (pavyzdžiui, asmuo, organizacija, atsakingi už dokumento turinį); Tema (angl. Subject and Keywords) dokumento tematika. Nustatant dalyką ir reikšminius žodžius rekomenduojama remtis kontroliuojamais žodynais ar klasifikacijos schemomis. Aprašas (angl. Description) dokumento turinio santrauka (pavyzdžiui, turinys, laisvos formos trumpas turinio aprašymas); 60

Leidėjas (angl. Publisher) įstaiga, asmuo ir pan., išleidę dokumentą; Teikėjas (angl. Contributor) asmuo, organizacija, atsakinga už informacijos ištekliaus turinio teikinius; Data (angl. Date) reikšmingos dokumento gyvavimo datos (pavyzdžiui, kūrimo, atnaujinimo ir kt.). Nurodant datą rekomenduojama vadovautis ISO 8601 standartu; Rūšis (angl. Resource Type) ištekliaus žanras, paskirtis ir pan. Nustatant ištekliaus rūšį patartina naudotis kontroliuojamais žodynais; Formatas (angl. Format) fizinio ar skaitmeninio ištekliaus parametrai (pavyzdžiui, laikmena, dydis, techninė ir programinė įranga). Formatui nustatyti rekomenduojama pasitelkti kontroliuojamus žodynus; Identifikatorius (angl. Resource Identifier) adresas ar skaitmenų eilutė, identifikuojantį išteklių, pavyzdžiui, ISBN, Uniform Resource Locator (Unifikuotas ištekliaus adresas), Digital Object Identifier (Skaitmeninio objekto identifikatorius); Šaltinis (angl. Source) dokumentas, kuriam priklauso aprašomas išteklius (pavyzdžiui, rinkinys, kuriame yra skyrius ar straipsnis); Kalba (angl. Language) kalba, kuria parašytas dokumentas. Kalbos santrumpų pateikimui rekomenduojama naudotis RFC3066 ir ISO639 standartais; Sąsaja (angl. Relation) nuoroda į susijusius išteklius; Aprėptis (angl. Coverage) dokumento turinio geografinės (vietovės pavadinimas), laiko (datos), institucinės priklausomybės charakteristikos. Rekomenduojama naudotis kontroliuojamais žodynais; Teisės (angl. Rights management) intelektinės nuosavybės teisių informacija. Visi DC elementai yra neprivalomi ir visi kartojami. Elementai gali būti atvaizduojami bet kokia tvarka. Atvaizdavimo tvarką gali reglamentuoti žymių kalba. DC metaduomenų schema yra nepriklausoma nuo sintaksės. Ir paprastam ir išplėstam DC metaduomenų elementų rinkiniui išreikšti gali būti naudojamos įvairios žymių kalbos. Populiarus DC metaduomenų schemos naudojimo modelis pritaikymas savo reikmėms. Kadangi schemos naudojimo taisyklės leidžia ją papildyti, dažniausiai pagrindinių elementų skaičius papildomas trūkstamais ir reikiamais specifinės srities elementais. Teoretikai tai vertina ir kaip privalumą, nes standartas pritaikomas įvairiausiems projektams, ir kaip trūkumą, kadangi taip kuriamos visiškai naujos metaduomenų schemos. Dauguma projektų, naudojančių šį metaduomenų 61

standartą, suprato, jog reikia kurti papildomus elementus ir taisykles o tai daug pastangų ir laiko reikalaujantis darbas. Dublin Core ir LiDA Archyvuose informacija saugoma keliais lygiais. Tai iliustruoja paveikslėlis: Fondas tai archyve saugoma atskira talpykla. Toje talpykloje gali būti keli vienos grupės failai (bylos). Tuose failuose gali būti keli dokumentai. Tai hierarchinė struktūra. Archyvuose saugant informaciją yra labai svarbu turėti metaduomenis apie kiekvieną iš šių lygių. Taigi metaduomenys turi būti hierarchinės struktūros. Dublin Core branduolio metaduomenų schema gali būti pritaikoma LiDA archyvui kelis kartus kartojant tuos pačius elementus. Tačiau tai nėra efektyvu. Todėl buvo nuspręsta ieškoti empiriniams duomenims tinkamesnio metaduomenų standarto. DDI Politinių ir socialinių mokslų tyrimų tarpuniversitetinio konsorciumo (angl. Inter-University Consortium for Political and Social Research - ICPSR) projektas Duomenų aprašymo iniciatyva (angl. Data Documentation Initiative, toliau DDI) buvo pradėtas 1994 m. Jo tikslas sukurti tarptautinį XML pagrįstą standartą socialinių ir humanitarinių mokslų srities mokslinių tyrimų duomenų turiniui ir struktūrai aprašyti, sudarytam aprašui (metaduomenims) atvaizduoti, išsaugoti ir keistis. DDI paskirtis ir struktūra Socialiniuose moksluose metaduomenys apie duomenų rinkinius dažnai vadinami kodifikatoriais (angl. codebooks). DDI kodifikatoriai kuriami unifikuotu, griežtai struktūriškai sutvarkytu formatu, kuris yra lengvai ir tiksliai paieškomas internete, gali būti tuo pačiu metu naudojamas daugialypių duomenų rinkinių, taip pat gali žymiai pagerinti metaduomenų turinį ir naudojimą. DDI leidžia hierarchiškai aprašyti: 1) socialinių ir humanitarinių mokslų tyrimus; 2) duomenų failus, sukurtas pagal tuos tyrimus; 3) kintamuosius, naudotus tuose duomenų failuose. DDI kodifikatorius yra XML dokumento tipo apibrėžtis (DTD), nurodanti elementus, iš kurių dokumentas yra sudarytas, tų elementų ypatybes ir loginius ryšius su kitais elementais. DDI sudaro per 300 metaduomenų elementų ir atributų, dauguma kurių yra neprivalomi naudoti. Visų šių 62

elementų vaidmuo ir naudojimas apibrėžtas Žymių bibliotekoje (angl. Tag Library). Elementai kodifikatoriuje yra išdėstyti hierarchiškai. DDI kodifikatorius susideda iš 5 elementų blokų: 1. Dokumento aprašymas (angl. Document Description), kurį sudaro bibliografinė informacija, paaiškinanti patį kodifikatorių (metaduomenų dokumentą) ir šaltinius, kurie buvo panaudoti kodifikatoriui sukurti. 2. Mokslinio tyrimo aprašymas (angl. Study Description) elementai, aprašantys atliktą mokslinį tyrimą (tyrimo pavadinimas, tyrimo atlikimo metodologija, duomenų turinio aprėptis, duomenų prieiga ir pan.). 3. Duomenų failų aprašymas (angl. Data Files Description) pateikiama informacija apie kiekvieną atskirą failą, kuriame saugomi mokslinio tyrimo duomenys. Tai duomenys apie duomenų failo formatą, apimtį, struktūrą, nurodoma failo paleidimo informacija ir pan. 4. Kintamųjų aprašymas (angl. Variables Description) elementai, paaiškinantys kintamuosius duomenų rinkinyje (formatą, kintamųjų ir reikšmių žymėjimą, apibrėžimus ir pan.). Trečias blokas pateikia fizinį mokslinio tyrimo duomenų rinkinio aprašymą, o šis blokas loginį. 5. Kita su tyrimu susijusi medžiaga (angl. Other Related Materials) kiti su moksliniu tyrimu susiję dokumentai ar elektroniniai failai (bibliografija, atskiras apklausos elektroninis dokumentas, ataskaitos ir pan.). Pagrindinis DDI tikslas buvo apibrėžti rinkinį visų galimų elementų ir atributų, naudojamų socialinių ir humanitarinių mokslų tyrimų duomenų rinkiniams aprašyti. Todėl rezultate gauta labai didelės apimties specifikacija. Į ją galima sudėti bet kokią informaciją, kokia duomenų kūrėjui ar naudotojui pasirodys esanti susijusi su duomenų rinkiniu. DDI komitetas sunkiai priėjo sprendimo nustatant, kokie elementai yra privalomi, o kokie rekomenduojami. DDI komitetas nustatė griežtai rekomenduojamų elementų sąrašą, kurį sudaro 14 elementų, atitinkančių Dublino branduolio (angl. Dublin Core) standartą, bei kiti 30 elementų. Taip pat atskiros bendruomenės ir organizacijos pradėjo apsibrėžti savus privalomų DDI elementų sąrašus. Tokiu pavyzdžiu gali būti CESSDA (angl. Council of European Social Science Data Archives 7 ) DDI projekto grupė, kuri nustatė DDI naudojimo taisykles Europos socialinių mokslų duomenų archyvams. Remiantis šiomis rekomendacijomis buvo sudarytas šis LiDA kodifikatorius. LiDA metaduomenų sąsaja su bibliotekų katalogų įrašais 7 http://www.nsd.uib.no/cessda/home.html 63

Siekiant platesnės humanitarinių ir socialinių mokslinių duomenų sklaidos bei kuriamo archyvo suderinanmumo su kitomis Lietuvos mokslo įstaigomis, akademinėmis bei mokslinėmis bibliotekomis, turi būti galimybė konvertuoti LiDA patalpintų skaitmeninių tyrimų/studijų metaduomenis į MARC21 formatą, kuris naudojamas mūsų šalies ir užsienio šalių bibliotekų katalogams sudaryti. Šiam tikslui žemiau pateikiama konvertavimo lentelė, leidžianti LiDA archyvo metaduomenis konvertuoti į MARC21 formatą. Perspektyvoje reikėtų parengti ir konvertorių į UNIMARC formatą, kurį naudoja daugelis Lietuvos ir užsienio šalių bibliotekų. DDI, Dublin Core, MARC21 elementų sankirtos Sudaryta pagal Mapping to Dublin Core 8 ir Field Mapping Table 9. DDI elemento žyma DDI elemento pavadinimas DC elementas MARC21 elemento žyma <titl> 2.1.1.1 Tyrimo ar duomenų rinkinio antraštė Antraštė 245 0?$a 245 0?$b <AuthEnty> 2.1.2.1 Tyrimo ar duomenų rinkinio pirminė 245 0?$c Kūrėjas atsakomybė 700 1#$a <keyword> 2.2.1.1 Reikšminiai žodžiai 650 #7$a Tema <topcclas> 2.2.1.2 Temų klasifikatorius 653 0#$a <abstract> 2.2.2 Santrauka Aprašas 520 3#$a <producer> 2.1.3.1 Tyrimo ar duomenų rinkinio leidėjas Leidėjas 260 ##$b <fundag> 2.1.3.6 Tyrimo ar duomenų rinkinio finansavimo šaltinis 536 ##$a <othid> 2.1.2.2 Kiti tyrimo ar duomenų rinkinio autoriai Teikėjas 700 1#$a 710 2#$a <proddate> 2.1.3.3 Tyrimo ar duomenų rinkinio išleidimo 260 ##$c Data data 260 ##$d <distdate> 2.1.4.5 Tyrimo ar duomenų rinkinio platinimo 008 data 260 ##$c <datakind> 2.2.3.10 Duomenų rūšis Rūšis <filetype> 3.1.5 Failo tipas Formatas 8 http://www.ddialliance.org/related/dc.html 31 psl. yra parašyta kada pažiūrėta ir pavadinimas puslapio. Suvienodinti reikia su 2-3 išnaša? 9 http://www.icpsr.umich.edu/icpsr/or/metadata/table.html 64

001 <IDNo> 2.1.1.5 Tyrimo ar duomenų rinkinio 035 ##$a Identifikatorius identifikacinis numeris 490 1#$v 830 #0$v <sources> 2.3.1.8 786 1#$a Tyrimo ar duomenų rinkinio šaltinių Šaltinis 786 1#$t duomenys 786 1#$d 041 0#$a -- -- Kalba 10 041 0#$9 <othrstdymat> 2.5 787 1#$a Kita su tyrimu ar duomenų rinkiniu Sąsaja 787 1#$t susijusi medžiaga 787 1#$d <timeprd> 2.2.3.1 Tyrimo ar duomenų rinkinio laiko aprėptis 518 ##$a <colldate> 2.2.3.2 Duomenų surinkimo data <nation> 2.2.3.3 Šalis Aprėptis <geogcover> 2.2.3.4 Tyrimo ar duomenų rinkinio geografinė aprėptis 522 ##$a 506 ##$a <copyright> 2.1.3.2 506 ##$e Autorinės teisės į tyrimą ar duomenų Teisės 506 ##$g rinkinį 590 ##$a 590 ##$9 <sername> 2.1.5.1 Tyrimo ar duomenų rinkinio serijos 490 1#$a antraštė 830 #0$a <version> 2.1.6.1 Tyrimo versija 250 ##$a <universe> 2.2.3.9 Populiacija 567 ##$a <sampproc> 2.3.1.4 Duomenų atrankos procedūra 567 ##$a <collmode> 2.3.1.6 Duomenų rinkimo metodas 567 ##$a <collsize> 2.4.1.4 Duomenų rinkinio dydis 516 ##$a <condition> 2.4.2.7 Prieigos prie tyrimo duomenų rinkinio sąlygos 506 ##$a <filename> 3.1.1 Duomenų failo antraštė 505 0#$a 10 DDI schemoje kiekvienas elementas turi atributą xml:lang 65

Empirinių duomenų aprašymo standartas ir jo taikymas archyvo reikmėms Toliau pateikiamas LiDA archyve talpinamiems duomenų rinkiniams atprašyti surarytas standartas. DDI skyrius Tyrimo kodifikatoriaus aprašas Tyrimo aprašymas DDI Nr. DDI žyma su nuoroda į aprašymą (angl.) Lauko žymos pavadinimas (ang.) Lauko žymos pavadinimas Lauko žymos turinys (aprašymas) 1.1.1.1 titl Title Dokumento antraštė Pagrindinė dokumento antraštė 1.1.1.2 subtitl Subtitle Paantraštė Antraštė, paaiškinanti ar patikslinanti pagrindinę antraštę 1.1.1.3 alttitl Alternative Title Alternatyvi antraštė Kita dokumento antraštė 1.1.1.4 partitl Parallel Title Lygiagreti antraštė Pagrindinė dokumento antraštė kita kalba 1.1.1.5 IDNo Identification number 1.1.3.5 software Software used in Production Identifikacinis numeris Naudojama programinė įranga Unikalus dokumento numeris, sudaromas pagal archyvo patvirtintas taisykles Programinės įrangos pavadinimas, versija ir įdiegimo data 2.1.1.1 titl Title Tyrimo antraštė Pagrindinė tyrimo antraštė 2.1.1.2 subtitl Subtitle Paantraštė Antraštė, paaiškinanti ar patikslinanti pagrindinę antraštę 2.1.1.3 alttitl Alternative Title Alternatyvi antraštė Kita tyrimo antraštė 2.1.1.4 partitl Parallel Title Lygiagreti antraštė Pagrindinė tyrimo antraštė kita kalba 2.1.1.5 IDNo Identification number 2.1.2.1 AuthEnty Authoring Entity/Primary Investigator 2.1.2.2 othid Other Identifications/Ack Identifikacinis numeris Pirminės atsakomybės duomenys Kiti tyrimo autoriai Unikalus tyrimo numeris, sudaromas pagal archyvo patvirtintas taisykles Asmuo ar organizacija, atlikę tyrimą Kitas asmuo ar organizacija, atlikę tyrimą nowledgments 2.1.3.1 producer Producer Leidėjas/gamintojas Asmuo ar organizacija atsakingi už tyrimą 2.1.3.2 copyright Copyright Autorinė teisė Asmuo/organizacija turinti autorines teises į tyrimą 2.1.3.3 proddate Date of Production Išleidimo data Tyrimo atlikimo (pabaigos) data 2.1.3.4 prodplac Place of Production Leidimo vieta Tyrimo atlikusios organizacijos adresas 2.1.3.6 fundag Fundings Finansavimo šaltinis Tyrimą užsakęs asmuo/organizacija 2.1.4.1 distrbtr Distributor Platintojas Organizacija atsakinga už tyrimo duomenų sklaidą 2.1.4.2 contact Contact Persons Kontaktiniai asmenys Už archyve kaupiamus tyrimo duomenis atsakingo asmens informacija, skirta vartotojams, kuriems gali kilti klausimų dėl tyrimo duomenų naudojimo tvarkos 2.1.4.3 depositr Depositor Pateikėjas Asmuo/organizacija, pateikę 66

tyrimą į archyvą 2.1.4.4 depdate Date of Deposit Pateikimo data Tyrimo pateikimo į archyvą data 2.1.4.5 distdate Date of Platinimo data Tyrimo, esančio archyve, Distribution 2.1.5.1 sername Series Name Serijos (apyrašo ar failų sąrašo) pavadinimas sklaidos pradžia Serijos (apyrašo-failų sąrašo), kuriai priklauso tyrimas, pavadinimas 2.1.5.2 serinfo Series Information Serijos informacija Serijos, kuriai priklauso tyrimas, istorija ir įvairių ypatybių reziumė 2.1.7 biblcit Bibliographic Citation 2.1.8 holdings Holdings Information Bibliografinis aprašas Fiziniai vienentai Išsamus tyrimo bibliografinis aprašas Informacija apie aprašomo tyrimo fizinius ar elektroninius vienetus 2.2.1.1 keyword Keywords Reikšminiai žodžiai Reikšminiai žodžiai (rekomenduojama 3-5) pasirenkami naudojantis kontroliuojamu žodynu (tezauru) 2,2.1.2 topcclas Topic Classification Temų klasifikatorius Pagrindinė tyrimo tema, pasirenkama iš kontroliuojamo žodyno (tezauro) 2.2.2 abstract Abstract Tyrimo santrauka Tekstas, trumpai apibūdinantis tyrimo tikslą, esmę ir apimtį (rekomenduojama 200-500 žodžių) 2.2.3.1 timeprd Time Period Tyrimo laikotarpis Tyrimo atlikimo laikotarpis 2.2.3.2 colldate Dates of Collection Duomenų surinkimo data Duomenų surinkimo laikotarpis 2.2.3.3 nation Countries Šalis Šalis(-ys), kurioje(-iose) surinkti duomenys 2.2.3.4 geogcover Geographic Coverage Geografinė aprėptis Geografinė vieta(-os), kurioje(-iose) surinkti duomenys 2.2.3.5 geogunit Geografic Unit Geografinis vienetas Geografinis vienetas(-ai), kuriame(-iuose) surinkti duomenys (apskritis, rajonas, miestas ir kt.) 2.2.3.6 / 2.2.3.8 2.2.3.7 / 2.2.3.9 2.2.3.8 / 2.2.3.1 0 anlyunit Unit or analysis (Nesstare) Tyrimo objektas Pagrindinis tyrimo analizės ar stebėjimo objektas, esantis sudėtine bendro tyrimo dalimi. Tai gali būti asmuo, šeima, institucija, organizacija, administracinis vienetas ir pan. universe Universe Tiriamoji grupė Grupė asmenų ar kitų tyrimo elementų, kurie yra tyrimo objektas ir su kuriais susijęs tyrimo rezultatas datakind Kind of Data Duomenų rūšis Duomenų rūšis naudota tyrimui (apklausos ar pžvalgos duomenys, administracinių įrašų duomenys, eksperimentų duomenys, psichologiniai 67

testai, tekstiniai duomenys, koduoti dokumentai ir pan.) 2.2.4 notes Notes and Pastabos Comments 2.3.1.1 timemeth Time Method Laiko metodas Tyrimo periodiškumas (vienkartinis, daugkartinis) 2.3.1.2 datacollecto r Data Collector Duomenų rinkėjas Asmuo/organizacija, atsakinga už apklausos, interviu ar kt. 2.3.1.3 frequenc Frequency of Data Collection Duomenų rinkimo dažnumas (jei rinkta per keletą kartų, kas 1 metai, kas 10 metų ir pan.) Atrankos metodas duomenų surinkimą 2.3.1.4 sampproc Sampling Procedure Tyrimo atrankos metodas 2.3.1.6 collmode Mode of Data Duomenų rinkimo Metodas naudotas duomenims Collection metodas rinkti 2.3.1.7 resinstru Type of Research Tyrimo Priemonė, naudota duomenims Instrument instrumentarijus rinkti 2.3.1.8 sources Data Sources Duomenų šaltiniai Šaltiniai, naudoti duomenims rinkti (apklausos, stebėjimo dokumentų analizės, statistiniai kitų tyrimų duomenys ir pan.) 2.1.3.9 collsitu Characteristics of Data Collection Duomenų rinkimo aplinkybės Svarbių duomenų rinkimo aplinkybių paaiškinimas (respondentų bendradarbiavimas ir pan.) 2.3.1.1 2 weight Weighting Duomenų svėrimas Jei duomenys buvo sverti, pateikiami svėrimo aprašymai 2.3.1.1 3 cleanops Cleaning Operations Valymo veiksmai Duomenų rinkinio išvalymo procedūros 2.3.2 notes Notes and Pastabos Comments 2.3.4 stdyclas Class of Study Tyrimo būsena Nurodomas tyrimo būsenos numeris arba įrašomas tekstas, paaiškinantis tyrimo būseną 2.4.1.1 accsplac Locations of Data Collection 2.4.1.2 origarch Original Archive Where Collection Stored Duomenų rinkinio saugojimo vieta Archyvas, kuriame saugomas tyrimo originalas Tyrimo skaitmeninio objekto saugojimo vieta(-os), pateikiant jo tikslų elektroninį adresą Archyvas, iš kurio buvo surinkti tyrimo duomenys. Pirminis archyvas 2.4.1.3 avlstatus Availability Status Prieigos sąlygos Tyrimo skaitmeninio objekto prieigos sąlygos. Jas nustato tyrimo autoriai, vadovaudamiesi archyvo naudojimosi taisyklėmis 2.4.1.4 collsize Extent of Collection Duomenų rinkinio dydis 2.4.1.6 fileqnty Number of Files Tyrimo duomenų failų skaičius 2.4.2.1 confdec Confidentiality Respondentų asmens Declaration Text duomenų apsaugos reikalavimai Duomenų rinkinio failų kiekis, įskaitant tik tuos failus, kuriuose yra tyrimo duomenys Nurodomas failų skačius 68

2.4.2.3 restrctn Restrictions Apribojimai Naudojimosi tyrimo duomenimis apribojimai pagal archyvo taisykles 2.4.2.5 citreq Citation Requirement 2.4.2.6 deposreq Deposit Requirement Citavimo reikalavimai Pateikimo į archyvą reikalavimai Publikacijos, parengtos tyrimo duomenų pagrindu, turi būti cituojamos kaip šaltiniai nuorodose ar literatūros sąraše. Reikalavimai vartotojams, norintiems kaupti savo tyrimus archyve 2.4.2.7 conditions Access Conditions Prieigos sąlygos Papildoma informacija apie prieigos prie tyrimo duomenų sąlygas 2.4.2.8 disclaimer Disclaimer Įspėjimas Informacija apie atsakomybę ir sankcijas už neteisingą tyrimo duomenų panaudojimą 2.5.1 relmat Related Materials Susiję dokumentai Su tyrimu betarpiškai susiję dokumentai (klausimynas, anketos ir pan.) 2.5.2 relstdy Related Studies Susiję tyrimai Su tyrimu susiję kiti tyrimai 2.5.3 relpubl Related Publications Susijusios publikacijos Su tyrimu susijusios publikacijos 2.5.4 othrefs Notes Pastabos Kitos pastabos, susijusios su tyrimu (pavyzdžiui, pagrindinė kalba, kuria rengiami tyrimo duomenys ir metaduomenys) Tyrimo failų aprašymas 3.1.1 filename File name Failo pavadinimas Tyrimo failo pavadinimas 3.1.2 filecont Contents of File Failo turinys Tyrimo failo turinys 3.1.3.1. 2.2 caseqnty Overall Case Count Tiriamųjų skaičius faile Tyrime dalyvavusių tiriamųjų kiekis faile 3.1.3.1. 2.1 varqnty Overall Variable Count Kintamųjų skaičius faile Tyrime panaudotų kintamųjų skaičius faile 3.1.5 filetype Type of File Failo tipas Tyrimo failo tipas 3.1.7 fileplac Place of File Production Failo sukūrimo vieta Archyvas, kuriame yra tyrimo produkcinis failas 3.1.9 ProcStat Processing Status Failo kūrimo statusas Kuriamo archive tyrimo failo statusas 3.1.12. 1 version Version Versija Kuriamo archive tyrimo failo ir/arba jam taikomo šablono 3.1.12. 2 verresp Version Responsibility statement Versijos atsakomybės duomenys versija Tyrimo failo versijos atsakomybės duomenys LiDA prieiga ir metaduomenų peržiūra LiDA archyvo katalogas per Nesstar WebView LiDA archyvas yra prieinamas per projekto svetainę http://www.lidata.eu.lt: 69

Atidaromas Nesstar WebView langas. Nesstar WebView leidžia: prieigą prie duomenų: juos peržiūrėti, atsisiųsti, eksportuoti, atsispausdinti; duomenų rinkinių, kintamųjų, su tyrimu susijusios medžiagos, lentelių paiešką; duomenų koreliacinę, regresinę, grafinę analizę. Prieiga prie duomenų priklauso nuo archyvo savininko, kuris turi parengęs atitinkamas prieigos taisykles. Šis taisyklių rinkinys gali būti patalpintas ir parodomas internete, archyvo savininko ar archyvo svetainėje. LiDA archyvo prieigos taisyklės prieinamos pagrindiniame projekto svetainės lange pasirinkus meniu Naudojimo taisyklės. LiDA archyvo duomenų peržiūra LiDA Nesstar WebView langas padalintaas į dvi dalis. Kairėje pusėje rodomas LiDA archyve saugomų tyrimų rinkinių katalogas, o dešinėje pusėje pasirinkto tyrimo rinkinio, atskiro tyrimo ar jo kintamojo metaduomenys. Metaduomenis taip pat galima peržiūrėti lango viršuje paspaudus mygtuką Description : 70

Kairėje lango pusėje esančiame tyrimo duomenų metaduomenų (angl. Metadata) skyriuje informacija pateikiama pagal DDI ji suskirstyta į keturis pagrindinius DDI blokus: Dokumento (kodifikatoriaus) aprašymas, tyrimo aprašymas, Duomenų failų aprašymas ir kita susijusi medžiaga. Kintamųjų (angl. Variables) skyriuje pateikiama informacija apie visus tyrimo kintamuosius. Kintamieji čia sugrupuoti į grupes. Norint peržiūrėti visą tyrimo informaciją, kairėje pusėje ties skyriumi reikia spausti informaciją išskleidžiančią ikoną. Kai informacija yra visa išskleista ir rodoma dešinėje lango pusėje, skyriaus pavadinimas paryškinamas raudonai ir ties juo atsiranda simbolis. Dešiniosios lango pusės viršuje yra trys pagrindiniai meniu elementai: Description, Tabulation ir Anglysis. Description peržiūrėti metaduomenis ar informaciją apie kairėje lango dalyje pasirinktą tyrimo elementą ar kintamąjį. Tabulation atlikti kintamųjų analizę. Paspaudus šį mygtuką iš pradžių rodoma tuščia lentelė. Norint įdėti kintamąjį į lentelę, reikia spustelėti ant kintamojo kairėje lango dalyje ir iš atsiradusio meniu pasirinkti reikiamą operaciją. Taip galima įkelti kelis kintamuosius ir juos vėliau analizuoti lango viršuje esančių mygtukų pagalba: 71

Analysis mygtuko pagalba galima atlikti regresinę ir koreliacinę analizę. Duomenų išsaugojimas į savo kompiuterį Pasirinkti saugojimui galima metaduomenis HTML ir XML formatu bei tyrimų duomenis įvairias formatais. Saugoma tai, kas rodoma dešinėje lango dalyje. Paspaudus mygtuką langas, kuriame reikia nurodyti kas ir kaip bus saugoma: atidaromas Duomenų eksportas ir spausdinimas 72

Norint eksportuoti tyrimo duomenis į Excel formatą, spaudžiamas mygtukas, į PDF formatą mygtukas. Norint spausdinti duomenis, spaudžiamas mygtukas. Bookmarks Ši funkcija naudojama išsaugoti tuo metu rodomą duomenų rinkinio atvaizdavimą, pavyzdžiui, informaciją apie kintamąjį, atliktą duomenų analizę ir pan. Išsaugotas duomenų rinkinio atvaizdavimas patalpinamas į serverį ir yra matomas kitiems tokias pat teises turintiems vartotojams. Norint sukurti Bookmark, reikia spustelti mygtuką ir iš išsiskleidžiančio sąrašo pasirinkti meniu Server Bookmark. Atidaromas langas, kuriame reikia nurodyti Bookmark pavadinimą ir aprašyti tai, ką norite išsaugoti, kad vėliau peržiūrint būtų galima suprasti, kodėl tai yra svarbu: Paspaudus mygtuką Add bookmark, jis parodomas tyrimo elementų rinkinio sąraše kairėje Nesstar WebView lango dalyje: 73

Norint peržiūrėti Bookmark, reikia spustelti pele ant jo pavadinimo ir iš išsiskleidžiančio meniu sąrašo pasirinkti reikiamą elementą: Paieška LiDA Nesstar WebView aplinkoje galima atlikti paprastą ir išplėstinę paieškas. Paprasta paieška atliekama pagrindiniame LiDA Nesstar WebView lange kairėje pusėje esančiame paieškos laukelyje įrašius užklausą ir paspaudus mygtuką : 74

Norint atlikti išplėstinę paieška, šalia paprastos paieškos lauko reikia spausti išplėstos paieškos langas:. Atidaromas 75

LiDA prieiga per elaba Taip pat Lietuvoje kuriama Lietuvos akademinė elektroninė biblioteka elaba. Prieiga per http://elaba.library.lt. Ji skirta Lietuvos mokslo institucijoms, kurių autoriai kuria mokslines ir studijų publikacijas, kurias reikia įkelti, saugoti, kataloguoti ir pateikti skaitytojams bei kitoms sistemoms. Pagrindinis tikslas sukurti aplinką bei priemones ir jomis naudojantis rengti, kaupti, ilgą laiką saugoti ir įvairiais išvesties būdais pateikti vartotojams Lietuvos mokslo ir studijų elektroninius dokumentus. elaba kaupiami, saugomi ir skelbiami elaba duomenų teikėjų įkelti šių tipų elektroniniai dokumentai: Knygos (monografijos, vadovėliai, mokymui skirtos knygos ir pan.); Periodiniai ar vienkartiniai recenzuojami mokslo leidiniai (žurnalai) bei mokslo populiarinimo leidiniai (žurnalai), išspausdinti, išleisti kompaktiniais diskais arba paskelbti internete; Atskiri moksliniai ir mokslo populiarinimo straipsniai, publikuoti mokslo ir mokslo populiarinimo leidiniuose; Pranešimai mokslinėse ar metodinėse konferencijose, seminaruose ir pan.; Studijų baigiamieji darbai, daktaro disertacijos ir jų santraukos; Mokslinių tyrimų ir eksperimentinės plėtros darbų bei projektų ataskaitos; Kita. elaba lange pasirinkite meniu Ištekliai ir iš sąrašo pasirinkite LiDA archyvo nuorodą: 76

ALEPH paieškos sistemos lange LiDA duomenų galima ieškoti per įvairias paieškas: paprastą, keliuose ištekliuose, detalią, komandinę ir išplėstą. Kokią paiešką pasirinkti priklauso nuo to, kokiu tikslu ieškote informacijos, kokią pradinę informaciją apie ieškomus leidinius jau turite ir pan.: - Paprastą paiešką tikslinga pasirinkti tuomet, jeigu atliekate bendresnio pobūdžio paiešką. Šios paieškos metu jūsų pageidaujamo paieškos žodžio arba žodžių ieško visuose paieškos laukuose arba viename pasirinktame paieškos lauke, t.y. pagal autoriaus pavardę, tikslią antraštę, žodį ar žodžius antraštėje, ISSN, ISBN, leidimo metus ir kt. Paprasta paieška dažniausiai naudojasi pradedantieji arba greitą paiešką atliekantys informacijos vartotojai. - Detalią paiešką tikslinga pasirinkti tuomet, jeigu žinote tikslius leidinio duomenis arba bent kelis bibliografinio aprašo elementus, pavyzdžiui, autorių, antraštė, publikavimo metus, leidimo vietą, leidyklą ar kitus duomenis. - Paiešką keliuose ištekliuose reikėtų pasirinkti tuomet, jeigu jums reikalingo leidinio ar leidinių neradote savo institucijos bibliotekos kataloge arba tuomet, kai jūsų bibliotekos kataloge neradote leidinių pagal pasirinktą žodį ar žodžius. Atlikę paiešką sužinosite, kokioje Lietuvos akademinėje bibliotekoje ar keliose bibliotekose yra jūsų ieškomas leidinys. - Išplėstą paiešką pasirinkite tuomet, jeigu norite suformuluoti sudėtingą paiešką, derinti kelis paieškos kriterijus. Rezultatai pateikiami pagal kiekvieną paieškos kriterijų atskirai, o taip pat visus paieškos kriterijus atitinkantys paieškos rezultatai. - Komandinę paiešką rekomenduojama atlikti didesnę informacijos paieškos patirtį turintiems vartotojams, kurie sugeba paiešką suformuluoti laukų komandų pagalba. Šiuo atveju galima suformuluoti itin sudėtingą paieškos klausimą, naudoti loginius operatorius, skliaustus ir pan. O tai leidžia gauti labai tikslius rezultatus. 77

Paprastos paieškos langas, kurio laukelyje Įveskite žodį arba frazę įrašoma užklausa ir kituose laukeliuose nurodomi užklausą apibūdinantys parametrai: Atlikus paiešką, paieškos rezultatai pateikiami lentelėje: 78

Lentelėje rodomi tik pagrindiniai tyrimo metaduomenys: autorius ir tyrimo antraštė. Norint peržiūrėti detalius metaduomenis apie tyrimą, reikia spausti numerį šios lentelės kairėje. Atidaromas langas, kuriame rodomi detalūs metaduomenys apie tyrimą. Metaduomenų sąrašo viršuje esanti nuoroda Sąsaja skirta atidaryti langą, iš kurio galima parsisiųsti su tyrimu susijusius dokumentus ar pačius duomenis. 79

Duomenims parsisiųsti paspaudus nuorodą Sąsaja atidaromas langas: Šiame lange pateikiamas su tyrimu susijusių duomenų ir dokumentų sąrašas. Paspaudus pele ant vienos iš sąrašo ikonų, parsiunčiamas duomenų failas ar kompiuterio ekrane parodomas pats dokumentas. 80

LiDA prieiga per Lietuvos virtualią biblioteką Lietuvos virtuali biblioteka yra kompleksinė sistema, suteikianti galimybę iš vieningos paieškos platformos ieškoti įvairaus tipo dokumentų. Paieška atliekama įvairiuose ištekliuose elektroniniuose kataloguose ir duomenų bazėse. Šiuo metu LVB galite ieškoti ir rasti: - bibliografinės informacijos apie socialinius ir humanitarinius mokslinius tyrimus bei rasti ir parsisiųsti tų tyrimų duomenis iš LiDA archyvo; - bibliografinius duomenis apie leidinius, aprašytus Lietuvos akademinių ir viešųjų bibliotekų bei kai kurių užsienio bibliotekų kataloguose; - straipsnių, konferencijų pranešimų ir kt. dokumentų, aprašytų institucijų publikacijų duomenų bazėse, bibliografinius duomenis ir santraukas. Dalis dokumentų pateikia ryšį į visatekstį dokumentą; - dokumentų, sukauptų Lietuvoje kuriamose duomenų bazėse Lituanistika, ETD, elaba, LABT katalogas, LiDA bibliografinius duomenis ir/ar pačius visateksčius dokumentus; - dokumentų (straipsnių, konferencijų pranešimų, knygų ir kt.), prieinamų per Lietuvos institucijose prenumeruojamas užsienio duomenų bazes, bibliografinius duomenis ir/ar pačius visateksčius dokumentus. LiDA archyvas bus prieinamas taip pat per Lietuvos virtualią biblioteką http://www.lvb.lt. 81

Norint atlikti paiešką tik LiDA archyve, reikia nuimti žymėjimus ties kitais informaciniais ištekliais. Jei žymėjimai nenuimami, tuo pačiu metu paieška atliekama ir kituose informaciniuose ištekliuose. Atlikus paiešką paieškos rezultatai pateikiami lentelės forma. Lentelėje rodomas tik tyrimo autorius ir antraštė. Norint peržiūrėti detalius metaduomenis apie tyrimą, reikia spausti tyrimo antraštės nuorodą. Atidaromas langas, kuriame rodomas išsamių metaduomenų sąrašas: 82

Norint parsisiųsti tyrimo duomenis ar su tyrimu susijusius dokumentus, reikia spausti Prieiga eilutėje esančią nuorodą. Atidaromas langas, kuriame pateikiamas su tyrimu susijusių elektroninių dokumentų sąrašas: 83

Šis langas toks pat kaip elaba paieškos sistemos. Šiame lange pateikiamas su tyrimu susijusių duomenų ir dokumentų sąrašas, kuriame paspaudus pele ant vienos iš sąrašo ikonų, parsiunčiamas duomenų failas ar kompiuterio ekrane parodomas pats dokumentas. Kiti archyvai ir duomenų rinkinių peržiūra Socialinių tyrimų archyvų sąrašus galite rasti LiDA projekto svetainėje http://www.lidata.eu pasirinkus meniu punktą Plėtra ir Bendradarbiavimas: Taip pat socialinių mokslų duomenų archyvų sąrašą internete pateikia Amsterdamo universiteto Sociologijos ir antropologijos departamentas - http://www.sociosite.net/databases.php: 84

Užsienio šalių duomenų archyvai ir jų paieškos sistemos Vokietijos socialinių mokslų infrastruktūros paslaugų asociacijos archyvas (angl. German Social Science Infrastructure Services GESIS) yra prieinamas per internetą adresu http://zacat.gesis.org/webview/index.jsp. Šis archyvas kaip ir LiDA naudoja Nesstar WebView aplinką duomenų archyvo turiniui atvaizduoti, ieškoti ir analizuoti. Jungtinės Karalystės duomenų archyvas (angl. UK Data Archive) yra prieinamas per internetą adresu http://www.data-archive.ac.uk/findingdata/aboutcat.asp. Pagrindinėje svetainėje pateikiama jungtinės paieškos galimybė galimybė atlikti paiešką vienu metu keliuose Jungtinės Karalystės archyvuose. Atlikus paiešką, paieškos rezultatų lange gali būti mygtukas į Nesstar WebView, kurį paspaudus patenkama į atitinkamo Jungtinės Karalystės duomenų archyvo Nesstar WebView aplinką. 85