Leheküljed

Repositooriumide interoperaablus

Viimati täiendati kasutaja Martin Sillaots poolt

, , ,

IMS Digital Repositories Specification - DR spetsifikatsioon (http://www.imsglobal.org/digitalrepositories/index.html) sisaldab soovitusi repositooriumide kõige enam levinud funktsioonide interoperaabluse tagamiseks. Põhiliselt võetakse kasutusele juba varem defineeritud spetsifikatsioonid IMS Meta-Data ja Content Packaging, selle asemel et koostada uusi infomudeleid.
Kuna Repositooriume oli loodud enne IMS DR spetsifikatsiooni loomist, siis on IMS koostanud kaks juurutamisstsenaariumit või repositooriumi tüüpi:
  1. vanad süsteemid (näiteks Z39.50 – digital libraries – tekstide, piltide ... digitaalsed salvestised või viited nendele materjalidele);
  2. uued, süsteemid, mis võimaldavad XQuery ( XML-li päringukeel) ja SOAP-i (Simple Object Access Protocol - XML teadete vahendamise standard).
Spetsifikatsioon määrab ära üldise viitamise mudeli, nii et kasutaja saaks otsida andmeid:
  1. otse ühest repositooriumist;
  2. mitmest repositooriumist ühe repositooriumi vahendusel (Search Gateway – toimib teiste LOR-de metaandmete tõlkijana);
  3. mitmest LOR-ist Harvesteri vahendusel
Repositooriumi arhitektuur
Repositooriumi funktsionaalne arhitektuur
Punased jooned ressursside kasutajate ja repositooriumide vahel kirjeldavad interopereeritavuse põhifunktsionaalsuste omavahelisi interaktsioone:
  1. otsi–esita;
  2. kogu–esita;
  3. sisesta–salvesta;
  4. päri–toimeta kätte;
  5. toimeta kohale–salvesta (kahe LRO vahel).
Hoiata–esita funktsioon ei ole spetsifikatsiooni esimeses versioonis teostatud (lisatakse tulevikus).
Seoste mudel
Repositooriumide interoperaabluse raammudel koos kasutajate rollidega
Sisu otsimine on keeruline ülesanne, kui andmed on säilitatud erinevates ja erinevat tüüpi repositooriumides. Probleem on veelgi tõsisem, kui repositooriumide metaandmete esitus ja andmetele juurdepääs on erinev (ebaühtlane). Probleemi leevendamiseks on vahenduskomponent. Sellel komponendi on järgmised funktsioonid:
  1. Tõlkimine – tõlgib ühe otsingu tulemused teise formaati. See võimaldab olemasolevatel ja IMS repositooriumidel omavahel suhelda.
  2. Agregeerimine – kogub IMS ja muud metaandmete infot teeb selle otsingute jaoks kättesaadavaks.
  3. Födereerimine – ühendatud otsing üle erinevate repositooriumide ja ühendatud otsingu tulemus.
Otsing – esitus
Jagatud otsing üle mitme repositooriumi
IMS soovitab otsingukeelena XQuery-t:
  1. otsing toimub IMS MD XML failide hulgas;
  2. XQuery on W3C spetsikatsioon;
  3. seda kasutavad ka kommertsettevõtted (kogukond on suur);
  4. query-by-example ???
  5. struktureeritud otsing ???
Info vahetamiseks soovitatakse SOAP sõnumeid. Neid on 3 tüüpi:
  1. RPC -tuntud argumendid (sõnumid) hästi tuntud meetoditele;
  2. messaging – üldised argumendid hästi tuntud meetoditele;
  3. session – üldised argumendid koos kontekstiga.
Kogumine–esitamine
Kogumine seisneb metaandmete pärimises repositooriumidest. Neid andmeid kasutatakse järgnevates otsingutes. Otsingu kiirendamiseks moodustatakse uus metaandmete repositoorium. 
Metaandmete kogumise mudel
Soovitusi kogumiseks:
Pull– tõmbav kogumine - Open Archive Initiative (OAI) on loonud lihtsa mudeli metaandmete tõmbamiseks (harvester – väljavedaja). OAI agent teostab perioodiliselt otsinguid kindlaksmääratud repositooriumide hulgas. Otsingu aluseks on kuupäevade vahemik. Otsitakse teatud perioodilise ajavahemiku tagant metaandmete uuendusi või uusi andmeid. Otsinguks sobivad kõik metaandmete spetsifikatsioonid. Metaandmete failis peab olema kirjas selle loomise kuupäev
<lifecycle><contribute><date><datetime>2002-01-01</datetime></date></contribute></lifecycle> 
Push– lükka kogumine – kui repositooriumi on täiendatud uue metaandmega, peab repositoorium teavitama (Alert) sellest vahekomponenti. 
Sisestamine–hoiustamine
Kuidas ressurss või metaandmed sisestatakse teise repositooriumi, LMS või autori arvuti vahendusel repositooriumisse. Enamasti kasutatakse edastusmeediumina FTP-d. FTP on laialt levinud, kuid sel on IMS hinnangul puudusi:
  1. ei sobi copyright materjalide edastamiseks, sest sessioon ei ole krüpteeritud;
  2. FTP teenuse võimaldamine toob kaasa ka teisi turvariske – repositooriumi volitamata kasutamine on väga lihtne;
  3. FTP ei vastuta ressursside veatuks ja täielikuks kohaletoimetamiseks.
Ressursside terviklikkuse tagamiseks soovitab IMS järgida Content Packaging (CP) spetsifikatsiooni soovitusi. CP on pakitud fail, mis sisaldab:
  1. õpiressurssi (suvaline fail või failid);
  2. õpiressursi metaandmeid (XML-fail);
  3. manifest fail (XML-fail).
Repositooriumi sisesta-hoiusta funktsionaalsust kirjeldav diagramm
Sisestamise käigus saadetakse autorilt repositooriumile SOAP sõnum, mille attachmentis on CP. Sisupakendusi võib ühe sõnumi sees olla ka mitu.
Säilitamise funktsioon tähendab lihtsalt repositooriumi võimet esitada IMS CP faile.
Pärimine–kohaletoimetamine
Kasutaja sooritab otsingu ressursi kasutamiseks. Kohaletoimetamine on repositooriumi vastus. IMS DRI spetsifikatsiooni esimeses versioonis ei käsitleta mittedigitaalsete ja tasuliste ressursside pärimist ja kohaletoimetamist.
Pärimismehhanism:
  1. otsing toimub metaandmete põhjal;
  2. otsingu tulemusel viidatakse ressursi asukohale (metadata tagi <location> kaudu);
  3. lihtsamal juhul on location-is kirjas URL, keerulisemal juhul pikem loetelu või meetod, mis asukoha määrab.
Kohaletoimetamiseks võib kasutada erinevaid protokolle:
  1. http – on-line materjalid (html, java, pdf, ...), stream (audio, video, ...);
  2. ftp – dokumendid, programmid, ...
Üldine sõnumi mudel
header
   message type
   destination address <!-- URL -->
   message authentication
body
   payload(s)
   audit element(s) <!-- võimaldab sõnumile lisada (kumulatiivselt) läbivaatamise infot – näiteks maksed, kasutamine, esitused, ... -->
Kasutusjuhtumi näide
Kasutaja otsib metaandmedmeid mitmest repositooriumist ja pärib leitud õpiressursse:
  1. kasutaja logib LCMS-i. LMS-i või otsinguportaali;
  2. kasutaja on autoriseeritud;
  3. kasutaja teostab otsingu;
  4. vahetarkvara (föderaalne moodul) vahendab otsingu erinevatele repositooriumitele;
  5. otsingu tulemused tagastatakse vahemoodulile;
  6. vahemoodul edastab kasutajale otsingu ühendatud tulemused;
  7. kasutaja valib tulemuste seast konkreetse ressursi;
  8. ressurss toimetatakse kohale konkreetse repositooriumi poolt.
Kasutaja otsib metaandmeid mitmest repositooriumist ja pärib leitud ressursse.
Allikas
Tõlgitud tekst ja joonised on pärit dokumendist nimega IMS Digital Repositori Interoperability (IMS DR) Core Functions Information Model
Haridus- ja Noorteamet