JHS 179 Planering och utveckling av en övergripande arkitektur

Bilaga 7. Metodanvisning för semantisk interoperabilitet

  • Version: 2.0
  • Publicerad: 7.2.2017
  • Giltighetstid: tills vidare

    1 Inledning

I detta dokument presenteras en metod för att förbättra den semantiska interoperabiliteten för information inom den offentliga förvaltningen i Finland. Interoperabilitetsmetoden kompletterar samlingen av metoder för övergripande arkitekturarbete som används vid planering, utveckling och underhåll av informationsarkitektur. Till interoperabilitetsmetoden finns ett programvaruhjälpmedel som ger styrning för att använda, producera och dokumentera återanvändbara datadefinitioner. Semantisk interoperabilitet berör förutom information också processer.

Denna metodanvisning för semantisk interoperabilitet utgör en del av styrningen av informationsförvaltningen inom den offentliga förvaltningen, och är kopplad till Julkisen hallinnon metatietopalvelu, som utvecklas stegvis och finns beskriven i Julkisen hallinnon metatietopalvelun esiselvityksessä1.

Genom att följa interoperabilitetsmetoden främjar organisationerna inom den offentliga förvaltningen den semantiska interoperabiliteten mellan informationssystem på det sätt som informationsförvaltningslagen och förordningar som givits med stöd av den bestämmer.

      1.1 Bakgrund

I 3 kapitel 7 § i informationsförvaltningslagen konstateras det att en myndighet inom den offentliga förvaltningen ska i syfte att möjliggöra och säkerställa interoperabiliteten för informationssystemen inom den offentliga förvaltningen planera och beskriva sin övergripande arkitektur samt iaktta den utarbetade och uppdaterade övergripande arkitekturen och de beskrivningar samt definitioner av interoperabiliteten som den övergripande arkitekturen förutsätter samt beskrivningar och definitioner av interoperabiliteten mellan informationssystemen enligt ansvarsområde.

I 1 kapitel 3 § i informationsförvaltningslagen definieras interoperabilitet för informationssystem

"informationssystemens tekniska och innehållsliga interoperabilitet med övriga myndigheters informationssystem inom den offentliga förvaltningen när systemen utnyttjar samma information."

I definitionsdokumentet för Julkisen hallinnon tietoarkkitehtuuri [Den offentliga förvaltningens informationsarkitektur] (version 1.0) konstateras att

"I utvecklingen av verksamheten inom den offentliga förvaltningen siktar man bl.a. på elektroniska informationsintensiva tjänsteprocesser."

Förbättring av den semantiska interoperabiliteten främjar automatisering av informationsintensiva processer. Ökningen av information med enhetlig betydelse och ökat sambruk möjliggör koppling av informationssystem och processer för att skapa nya effektiva och användarvänliga tjänstehelheter. Detta är till nytta för såväl klienter som den offentliga förvaltningen.

      1.2 Termer och definitioner

kodlista

fi koodisto

en code list

en lista över tillåtna värden för klassens egenskaper

egenskap

fi ominaisuus
en attribute

karaktärsdrag för objekt eller klass

tillämpningsprofil

fi soveltamisprofiili

en application profile

en datadefinition som definierar datainnehåll som behövs eller tillhandahålls av ett datasystem så att de är semantiskt kompatibla med andra informationssystem genom att utnyttja befintliga ordlistor och datamodeller

datakomponent

fi tietokomponentti

en core component

en datadefinition som beskriver information om fenomen i den fysiska världen och deras egenskaper på ett realiseringsneutralt sätt och möjliggör återanvändning

datakomponentbibliotek

fi tietokomponenttikirjasto

en core vocabulary

en organiserad mängd återanvändbara datakomponenter

    2 Målbild

Med metoden för semantisk interoperabilitet är det möjligt att realisera den i informationsförvaltningslagen avsedda innehållsliga interoperabiliteten vid informationsutbyte mellan organisationer inom den offentliga förvaltningen i Finland.

Med hjälp av metoden skapas de i informationsförvaltningslagen nämnda beskrivningarna och definitionerna som den övergripande arkitekturen förutsätter, när det gäller den offentliga förvaltningens gemensamma informationsarkitektur. Metoden och dess referensram utgör en central del av den nationella servicearkitekturen och styr organisationerna att verka mot automation av elektroniska informationsintensiva tjänsteprocesser som nämns i definitionsdokumentet för informationsarkitekturen.

Genom att följa metoden

  • görs branschspecifika datakomponenter synliga och gemensamt använda
  • bildar harmoniserade datakomponenter innehåll i informationssystemarkitekturdefinitioner som krävs för interoperabilitet och som avses i informationsförvaltningslagen 4.2 §
  • är uppgifter som behövs för informationsutbyte enhetligt dokumenterade utan att medföra omedelbara ändringskrav på befintliga tekniska realiseringar (till exempel databasstrukturer).

För organisationer i den offentliga förvaltningen rekommenderas följande förfarande:

  1. Identifiera och beskriv en situation där användarens eller aktörens informationsbehov utöver aktörens egna informationslager också kräver att information i andra aktörers informationslager utnyttjas.
  2. Utarbeta nödvändiga verksamhetsarkitekturbeskrivningar över situationen och härled verksamhetens informationsbehov ur dessa.
  3. Utarbeta från informationsbehoven en tillämpningsprofil enligt interoperabilitetsmetoden. Tillämpningsprofilen är en implementeringsoberoende beskrivning av informationsinnehåll för visst informationsbehov.
  4. Realisera nödvändiga tekniska datastrukturer baserat på tillämpningsprofilen (till exempel för dataöverföring mellan olika informationslager). Se också bilaga 9 Beskrivning av integration och gränssnitt.

Genom att följa detta förfarande säkerställer den offentliga förvaltningens organisation att betydelsen i dess egna informationslager bevaras oförändrad också i situationer där informationsinnehållet utnyttjas utanför organisationen.

När organisationerna förnyar informationssystem som har kommit till slutet av sin livscykel kan man med hjälp av metoden säkerställa den semantiska interoperabiliteten för datadefinitioner i de system och informationslager som förnyas.

    3 Metodens referensram

Interoperabilitetsmetoden och det programvaruredskap som utvecklats till den baseras på den referensram som presenteras nedan och vars centrala delar utgörs av ordlistor, datakomponenter, tillämpningsprofiler och kodlistor. Referensramen betonar arbetet med ordlistor för att förbättra interoperabiliteten för verksamhetssätt, information och informationssystem.

Picture 1

Figur 1. Interoperabilitetsmetodens referensram.

    4 Interoperabilitetsmetod

Med hjälp av interoperabilitetsmetoden kan organisationerna inom den offentliga förvaltningen beskriva sina informationslager så att det från dem kan överföras eller så att de kan ta emot information vars informationsinnehåll är entydigt till sin betydelse det vill säga alla parter förstår det på ett enhetligt sätt. Vid överföring av data som definierats med interoperabilitetsmetoden bibehålls den innehållsliga betydelsen som informationens skapare har avsett. I det följande beskrivs metoden för att skapa sådana beskrivningar.

Innan själva metoden beskrivs presenteras interoperabilitetsmetodens delfaktorer och resultat som skapas med hjälp av metoden, samt beroenden mellan dessa resultat.

Image1

Figur 2. Interoperabilitetsmetoden.

I interoperabilitetsmetodkontexten refererar "begrepp" enligt metoden för terminologiskt ordlistearbete till en bild som människan formar vid observation av sin omgivning, vid jämförelse av dess enskilda företeelser med varandra, vid identifiering av likheter och skillnader mellan företeelser och vid klassificering av dessa i grupper av liknande fenomen. Denna för människans tankeverksamhet naturliga process kallas begreppsbildning. I ordlistor specificeras begreppets innehåll (definition), begreppets namn (term) och relationer till andra begrepp. Genom relationerna bildar begreppen begreppssystem. Ibland kallas dessa felaktigt för begreppsmodeller.

      4.1 Datakomponenter

Datakomponenter består av klasser och deras egenskaper. Klassernas och egenskapernas betydelse definieras i ordlistor där man från komponenten refererar klass- och egenskapsspecifikt till ingående begrepp.

  • Datakomponenterna är i sig alltid klasser, men de kan forma en intern hierarki med över- och underklassrelationer.
  • För egenskaper har definierats ett presentationssätt för informationen som kan vara antingen en allmän informationstyp eller referens till en annan klass.
  • Till en datakomponent läggs också beskrivningar av klassens och dess egenskapers betydelse i en komponentspecifik kontext det vill säga en förklaring till vilken information som komponenten ska överföra från ett informationslager till ett annat.
  • I definitionen av datakomponenter används internationella, nationella och organisationens egna standarder för datakomponenter.
  • En preciserad datakomponent (se figur 2) är en datakomponent som har avgränsats eller utökats med branschspecifika egenskaper för att lämpa sig för användningskontexten.

      4.2 Ordlistor

Datakomponenternas klasser och egenskaper är som utgångspunkt bundna till kontexten, så för att säkerställa interoperabiliteten måste de begrepp som beskriver dem definieras separat på ett så neutralt sätt som möjligt. För detta utarbetas separata ordlistor (till exempel den offentliga förvaltningens gemensamma ordlistor och branschspecifika ordlistor), där de begrepp som behövs för att beskriva datakomponenterna har definierats så fritt från kontext som möjligt.

Den ordlista som används ska finnas publicerad i överenskommet format och det ska vara möjligt att referera till begrepp i den med begreppets unika identifierare.

Om begrepp som komponenterna behöver inte finns publicerade i den offentliga förvaltningens gemensamma eller branschspecifika ordlistor, ska begreppet definieras i ordlistan. Definiering av begrepp som beskriver datakomponenters klasser och egenskaper görs i en arbetsprocess för ordlistor enligt JHS 175 -rekommendationen enligt principerna för terminologiskt ordlistearbete (www.jhs-suositukset.fi/suomi/jhs175).

De begrepp som definieras i den offentliga förvaltningens gemensamma ordlista, det vill säga s.k. kärnbegrepp ska harmoniseras av den offentliga förvaltningens arbetsgrupp för kärnordlistor (YSR) eftersom dessa begrepp ofta är definierade på olika sätt inom olika målområden eller branscher.


Exempel:

  • personbeteckning och yrke är kärnbegrepp, för deras definition svarar YSR.
  • lön och förmån är gemensamma begrepp, för deras definition svarar en part som utsetts och befullmäktigats av delegationen för informationsförvaltningen inom den offentliga förvaltningen(JUHTA), t.ex. någon s.k. intressegrupp enligt JHS 175.
  • studierätt är ett branschspecifikt begrepp, det vill säga det förvaltas av någon intressegrupp (utbildningsväsendet), och som också publiceras i den offentliga förvaltningens gemensamma ordlista, men ansvaret för dess definition ligger hos den part som förvaltar begreppet.

      4.3 Kodlistor

Kodlistor och kodvärden används som datatyp för att bestämma gemensamt överenskomna och godkända värdeområden för egenskaper. Kodvärdets betydelseinnehåll definieras i ordlistan där det från kodlistan refereras på kodvärdesnivå till de begrepp som ingår.

Exempel:

Datakomponentens Person (klass: person) egenskap Civilstånd kan få de specificerade värdena "Äktenskap", "Änka", "Registrerat partnerskap", "Ogift" osv. Dessa värden lagras i kodlistan "Civilstånd". Kodlistorna sparas och underhålls som regel i olika aktörers kodtjänster, där de också bör vara tillgängliga i maskinläsbar form.

      4.4 Tillämpningsprofiler

Tillämpningsprofilen är en datadefinition som används:

  • Allmänt som precisering eller utvidgning av någon befintlig datamodell till ett annat användningsändamål.
  • I interoperabilitetsmetoden också som en ny informationssystems- eller användningsändamålsspecifik datamodell som använder gemensamma datakomponenter.

När tillämpningsprofilen skapas ska internationellt överenskommen praxis följas (Guidelines for Dublin Core Application Profiles). Den centrala principen är att gemensamma datakomponenter i tillämpningsprofiler kan preciseras för olika användningsändamål utan att ändra datakomponenternas betydelseinnehåll.

Datakomponentens beskrivning ska motsvara begreppets betydelseinnehåll och beskrivningen för den preciserade datakomponenten ska följa definitionen för datakomponenten.

Exempel på definitioner som bevarar semantiken och på definitionskonflikt:

Huvudprodukten i en glassfabrik är glass, en mjölkbaserad fryst dessert vars huvudråvara är grädde. Fabriken har beslutat att utöka sitt produktsortiment med sorbet och yoghurtglass. Sorbet är en fryst dessert vars huvudråvara är frukt- eller bärsaft. Yoghurtglass eller isyoghurt är en fryst dessert vars huvudråvara är mjölkbaserad yoghurt.

Dessa produkter kan fabriken i sin konsumentreklam sanningsenligt benämna med termen "dessert", den sista maträtten i den västerländska mattraditionen. Däremot kan den inte fortsätta marknadsföring under bara den ursprungliga produktbeteckningen glass, eftersom ingen grädde används vid tillverkning av sorbet och isyoghurt och därigenom är de inte glass enligt definitionen.

Tillämpningsprofiler skapas till exempel i följande fall:

  • när det gäller informationsutbyte mellan sådana aktörer vars informationslager inte är jämförbara
  • man vill förenhetliga datadefinitioner i olika datamodeller
  • man vill precisera gemensamma datakomponenter branschspecifikt
  • man vill definiera vilken information som är branschspecifik.

    5 Tillämpning av interoperabilitetsmetoden

I nedanstående figur presenteras interoperabilitetsmetoden process i form av ett arbetsflödesdiagram.

Image2

Figur 3. Arbetsflödesdiagram.

      5.1 Arbetsinstruktion

  1. Identifiera och beskriv en situation där aktörens informationsbehov kräver utöver aktörens eget informationslager också att andra aktörers informationslager utnyttjas. För att underlätta användningen av uppgifter ska datadefinitionerna som förklarar dem beskrivas på ett gemensamt sätt och publiceras öppet.
  1. Beskriv aktörens informationsbehov eller en datadefinition som beskriver aktörens eget informationslager som en tillämpningsprofil.
  1. Tillämpningsprofilen beskrivs genom att utnyttja den offentliga förvaltningens gemensamma datakomponentbibliotek och ett branschspecifikt bibliotek. Datakomponentbiblioteket innehåller klasser och egenskaper som ska användas i definitionerna. Med gemensamma datakomponenter avses såväl klasser och egenskaper som harmoniserats i KMR-gruppen som branschspecifika klasser och egenskaper (KMR Käsitemalliryhmä2). Egenskapers värdeområden är om möjlig definierade i kodlistetjänster.
  1. Granska datakomponenter i datakomponentbiblioteket.
  • Om en datakomponent som känns lagom hittas, kontrollera att det informationsinnehåll som datakomponenten givits (klass, egenskaper och deras betydelser) motsvarar behovet.
  • Om datakomponentens informationsinnehåll motsvarar behovet, utnyttja datakomponenten i sin helhet eller tillämpliga egenskaper i en tillämpningsprofil.
  • Om det informationsinnehåll som givits datakomponenten inte motsvarar behovet, utvidga den befintliga datakomponenten.
  • Vid utvidgning läggs den nya egenskapen som behövs som kandidat till den befintliga klassen.
  • Precisera vid behov egenskapens värdeområde genom att definiera en ny kodlista i en lämplig kodlistetjänst.
  • Använd den utökade komponenten eller utökade egenskapen som en del av den egna tillämpningsprofilen.
  • Anmäl den tillagda egenskapen till KMR-gruppen för behandling.
  • Utvidgningar blir kandidater till det gemensamma datakomponentbiblioteket och antingen
  • godkänns de som del av det gemensamma datakomponentbiblioteket och en ny överordnad egenskap läggs till biblioteket, eller
  • så fastställs de som definitioner för specialfall som ska användas bara i en viss tillämpningsprofil.
  • Om ingen datakomponent hittas, skapa en datakomponent som en del av datakomponentbiblioteket.
  • Skapa komponenten genom att definiera den nödvändiga klassen med utnyttjande av ordlistan och där definierade begrepp.
  • Lägg till nödvändiga egenskaper till klassen genom att utnyttja ordlistan och där definierade begrepp.
  • Precisera vid behov egenskapens värdeområde genom att definiera en ny kodlista.
  • Använd den nya komponenten som en del av den egna tillämpningsprofilen.
  • Anmäl den nya komponenten till KMR-gruppen för behandling.
  • Nya komponenter blir kandidater till det gemensamma datakomponentbiblioteket och antingen
  • godkänns de som del av det gemensamma datakomponentbiblioteket och en ny klass och dess egenskaper läggs till biblioteket, eller
  • så fastställs de som definitioner för specialfall som ska användas bara i en viss tillämpningsprofil.
  • Skapa en tillämpningsprofil, det vill säga realiseringsspecifik datadefinition, av de valda datakomponenterna med hjälp av ett lämpligt verktyg.
  1. Skapa tekniska datastrukturer med tillämpningsprofilens datadefinition som grund.

Genom att använda gemensamma ordlistor kan behovsspecifika definitioner kopplas till gemensamma definitioner för sin betydelse.

Alaviitteet

1) https://www.avoindata.fi/data/fi/dataset/julkisen-hallinnon-yhteisen-metatietopalvelun-esiselvitys

2) https://wiki.julkict.fi/julkict/juhta/juhta-n-jaostot/tietoarkkitehtuuriryhma/kmr-kasitemalliryhma