MetaX-Blogi

Teemme ketterästi Suomen tutkimusaineistojen metatietovarantoa, joka tulee palvelemaan OKM:n tutkimusaineistopalveluita (esim. TPAS, IDA ja Etsin). Tässä blogissa käsitellään kehityksessä ajankohtaisia ja usein avoimia asioita, eikä mikään tässä esitetty edusta mitään virallisia linjauksia. Sen sijaan toivomme palautetta ja avointa keskustelua.

måndag 18 december 2017

Katalogeista

By Stuart Caie from Edinburgh, Scotland (Indexed) CC BY 2.0, via Wikimedia Commons


Tänään vaihtui taas sprintti. Edellisen sprintin aikana on paljon pohdittu versiointia (johon palaan joku toinen kerta piakkoin) sekä hakemistojen versus yksittäisten tiedostojen kuvailemista. Koska järjestelmiä on palvelukokonaisuudessamme useita (esimerkiksi tässä kyse on pitkälti MetaXin keskustelusta IDA:n ja kuvailutyökalun kanssa) pienilläkin yksityiskohdilla voi olla yllättävän suuria vaikutuksia järjestelmäkokonaisuuden muissa osissa. Pyrimme koko ajan varmistamaan sen, että käyttäjälle toiminnallisuudet näyttäytyvät selkeinä ja että aineistojen hallinta on luotettavaa. Pysyväksi tarkoitetun aineiston pitää olla suojassa tahattomilta muutoksilta, mutta järjestelmä ei toisaalta saa olla liian jäykkä. MetaXin monitasoisuus ja joustavuus ovat käsittääkseni aika uniikkeja. Tuntuu oikeasti, että olemme tekemässä jotain ihan uudenlaista, uudenaikaista palvelua.

Yksi juonne on järjestelmän sisäiset katalogit (Research Data Catalog). Ne mahdollistavat eri tietolähteistä tulevien metatietojen hallinnan yhdessä ja erikseen. Esimerkiksi kukin haravointilähde saa omat metatietonsa katalogiluetteloon. Haravointi tapahtuu Etsimen CKANin avulla. Haravointilähteinä ovat tähän asti olleet Tietoarkisto, Kielipankki ja SYKE. Myös esimerkiksi Zenodosta haravointi on onnistunut vanhaan Etsimeen. Kun haravointi ensi vuonna siirtyy MetaXiin, entistä tarkemmat mappaukset mahdollistuvat. Olemmekin jo hieman suunnitelleet uusia haravia, tosin esimerkiksi odottelemme vielä Tietoarkiston uuden rajapinnan DataCite-formaattia. Katsotaan miten saamme mahdollisimman nättiä ja täydellistä tietoa asiakkaillemme.

Seuraavassa sprintissä tehdään arkkitehtuuridokumentaatioita, perehdytetään uutta tiimiläistämme ja kirjoitellaan skriptejä aineistojen tiedoston kokojen ja määrien koostamiseen. Lisäksi esiin on noussut pohdintaa migraatiosta ja kasvavien aineistojen joustavasta ja selkeästä hallinnasta.

Inga kommentarer:

Skicka en kommentar