Vad menas med FAIR?
FAIR är ett internationellt erkänt begrepp som är uppbyggt av 15 vägledande principer för forskningsdata och datahantering. Enligt de så kallade FAIR-principerna ska forskningsdata vara
- sökbara (Findable)
- tillgängliga (Accessible)
- interoperabla (Interoperable)
- återanvändningsbara (Reusable).
2016 antog Sverige och EU:s medlemsländer rådslutsatser om en övergång till ett öppet vetenskapssystem. I rådslutsatserna uppmuntras medlemsländerna att följa FAIR-principerna i sina forskningsprogram och principer för finansiering.
Vetenskapsrådets rekommendation om datahantering enligt FAIR
Vetenskapsrådet rekommenderar att de forskningsdata som framställs genom forskning hanteras i enlighet med FAIR-principerna, förtydligade genom de kriterier som tagits fram av Vetenskapsrådet för att uppnå FAIR data.
FAIR-principerna bör implementeras med beaktande av gällande lagstiftning och, i så stor utsträckning som det är möjligt och tillämpligt, utifrån de tekniska, organisatoriska och/eller disciplinsspecifika förutsättningar som finns tillgängliga.
Rekommendationen avser i första hand de forskningsdata (och metadata) som finansieras av offentliga medel och som kan publiceras med öppen tillgång, men tillämpning av FAIR-principer kan göras bredare än så och vara relevant även för forskningsdata som inte kan publiceras som helt öppna.
Rekommendationen om datahantering enligt FAIR är övergripande och har som syfte att skapa en gemensam utgångspunkt för implementering av FAIR-datahantering.
Kriterier för FAIR forskningsdata
Vetenskapsrådet har tagit fram kriterier för samtliga 15 FAIR-principer. FAIR-kriterierna har som syfte att öka förståelse kring och kunskap om vad FAIR-principerna innebär i praktiken. De kan användas av forskare, forskningsfinansiärer eller för strategiska beslut vid implementering av FAIR i organisationens policyer.
Vissa aspekter av FAIR är mer krävande och komplexa att uppfylla än andra – och att bedöma uppfyllnad av. Vissa principer förutsätter att andra principer är uppfyllda, exempelvis är PID (princip F1) en fundamental komponent som måste finnas på plats för att andra principer ska kunna uppfyllas. Uppfyllnad av vissa principer inbegriper samverkan med olika stödjande funktioner.
Ett kriterium kan uppfyllas på olika sätt och i olika grad. Vissa aspekter kan i vissa situationer rimligen vara uppnåeliga bara för metadata och inte data, exempelvis när det gäller känsliga data.
Kriterierna är allmängiltigt formulerade och eventuella jämförelser av FAIRness behöver ta hänsyn till forskningsområde och datatyp.
För att stödja arbete med FAIR-datahantering behövs det även stödjande infrastrukturer, tjänster, och inte minst kompetens kring och en kultur av FAIR och god datahantering.
Forskningsdata ska vara sökbara


(Meta)data are assigned a globally unique and persistent identifier.
Digitala objekt behöver förses med globalt unika och beständiga kodsträngar som identifierar objektet.
Beständiga identifierare behöver vara utformade på ett sätt som möjliggör att digitala objekt som publiceras på nätet ska vara beständiga och sammanlänkningsbara med andra typer av digitala objekt.
Vilka insatser behövs för att uppfylla kriteriet?
Beständiga identifierare ska utformas i enlighet med gällande rekommendationer. Ifall identifierarna till en början endast används internt bör de vara utformade på ett sådant sätt att de kan integreras i enlighet med rådande rekommendationer vid online användning.


Data are described with rich metadata.
Det bör finnas särskilt framtagna maskinläsbara metadata utformade på ett sätt som möjliggör att data går att söka sig till.
För att forskningsdata ska vara lätta att hitta och använda för användare behöver det tas fram en kortfattad beskrivning av dessa data på ett sätt som tillåter att sökningar ska kunna processas maskinellt.
Vilka insatser behövs för att uppfylla kriteriet?
Förutom benämning bör maskinläsbara metadata även innehålla andra typer av beskrivningar som exempelvis innehåll, den aktör som publicerat digitala objektet, tidsperioden som den är insamlad eller skapad, ämnesområdet som avses, och så vidare.


Metadata clearly and explicitly include the identifier of the data it describes.
Metadata som beskriver data innehåller referens till en globalt unik beständig identifierare för det objekt (det data) det beskriver.
Metadata bör innehålla en referens till identifierare för det objekt det beskriver. Detta är viktigt för att säkra det digitala objektets beständighet i de fall då metadata respektive data tillgängliggörs separat.
Vilka insatser behövs för att uppfylla kriteriet?
Det bör eftersträvas att metadata och data kan nås genom samma beständiga identifierare. Maskinläsbara metadata bör innehålla en referens till identifierare för det objekt det beskriver.


(Meta)data are registered or indexed in a searchable resource.
Metadata som beskriver det digitala objektet är sökbara och enkla att hitta på webben. Metadata som beskriver ett digitalt objekt bör utformas för att öka objektets synlighet och för att öka potential för dess användning.
Vilka insatser behövs för att uppfylla kriteriet?
Metadata bör utformas på ett sådant sätt att de möjliggör tillgängliggörandet via ett eller flera för det ändamålet avsedda tjänster, portaler eller repositorier. Detta kan exempelvis göras genom maskinläsbara standardiserade metadata som tillåter skördning av metadata, indexering i generella sökmotorer, med mera.
Forskningsdata ska vara tillgängliga


(Meta)data are retrievable by their identifier using a standardized communications protocol.
Metadata, och om tillämpligt data, går att nå, läsas av och få tillgång till via ett standardiserat kommunikationsprotokoll (såsom http eller ftp), genom en tilldelad identifierare. Om detta av någon anledning inte är möjligt, till exempel av säkerhetsskäl, så behöver det finnas en beskrivning av hur förfarandet ser ut.
Det tekniska protokoll som styr avläsning av de digitala objekten på webben bör vara standardiserade och tillåta att objekten kan nås genom sina identifierare. Om objekten inte kan nås för avläsning eller tillgång inte kan ges på ett automatiserat sätt så behöver förfarandet för hur detta går till vara tydligt beskrivet.
Vilka insatser behövs för att uppfylla kriteriet?
Det bör finnas en identifierare som ger tillgång till det digitala objektet genom ett standardiserat kommunikationsprotokoll. Om tillgång inte kan ges via ett automatiserat protokoll så bör metadata innehålla en beskrivning av hur tillgång kan fås.


The protocol is open, free, and universally implementable.
Kommunikationsprotokollet som används för att nå och läsa av objekten bör vara öppet, kostnadsfritt och generellt implementerbart.
Det tekniska protokoll som används för avläsning av de digitala objekten på webben eller för att ge tillgång till objekten bör i sig inte utgöra en begränsande faktor för tillgång.
Vilka insatser behövs för att uppfylla kriteriet?
Kommunikationsprotokoll som används för att nå de digitala objekten bör vara utformade på ett sätt som inte försvårar eller begränsar tillgång till och avläsning av digitala objekt som är avsedda att vara öppet tillgängliga.


The protocol allows for an authentication and authorization procedure, where necessary.
Det tekniska protokoll som används för avläsning av de digitala objekten på webben eller för att ge tillgång till objekten bör vid behov kunna utformas på ett sådant sätt som tillåter verifiering av att en användare är den som den utger sig för att vara, dvs. autentisering, samt kunna avgränsa tillgång till det data som användaren har rättighet att få åtkomst till, dvs. accesskontroll.
Om det föreligger behov av mekanismer för användarroller och identifiering bör dessa möjliggöras genom protokoll som styr tillgången till informationen.
Vilka insatser behövs för att uppfylla kriteriet?
Protokoll som används för att nå de digitala objekten bör vara utformade på ett sätt som möjliggör en implementering av auktoriserings- och autentiseringsmekanismer.


Metadata are accessible, even when the data are no longer available.
Metadata som beskriver ett digitalt objekt finns kvar även om tillgång till objektet upphört.
Även om tillgång till ett digitalt objekt blir begränsad eller upphör bör tillgången till de övergripande metadata finnas kvar. Vissa data kan exempelvis endast nås på en fysisk plats och inte genom webben, men för att kunna hitta dessa data behövs det fortfarande tillgång till metadata på webben.
Vilka insatser behövs för att uppfylla kriteriet?
Metadata bör förvaltas och tillgängliggörs över tid, även då data kopplade till dessa beskrivningar inte längre finns tillgängliga (exempelvis via webben).
Forskningsdata ska vara interoperabla


(Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.
För att öka potentialen i användning av informationen över tid behöver metoder för utformning av semantiska beskrivningar av informationen vara standardiserade, dokumenterade och tillgängliga.
För att användare ska kunna förstå hur informationen har strukturerats behöver de ha tillgång till informationen men också sättet att tolka informationen.
Vilka insatser behövs för att uppfylla kriteriet?
För att användare ska kunna förstå hur informationen har strukturerats behöver metoder för utformning av semantiska beskrivningar av informationen vara dokumenterade och tillgängliggjorda. Om befintliga (standardiserade) semantiska beskrivningar av den digitala informationen används bör det beskrivas. Om inga standardiserade beskrivningar finns och nya beskrivningar tas fram i samband med att informationen skapas bör dessa dokumenteras och tillgängliggöras tillsammans med informationen.


(Meta)data use vocabularies that follow FAIR principles.
För beskrivning av digitala objekts innehåll används kontrollerade vokabulärer, terminologier eller ontologier som i sig uppfyller FAIR kriterierna. Beskrivningar av dessa är dokumenterade och tillgängliga.
Kontrollerade och vedertagna vokabulärer, terminologier eller ontologier underlättar tolkning, sammanlänkning, interoperabilitet och återanvändning av data och minimerar risken för misstolkningar av begrepp och definitioner.
Vilka insatser behövs för att uppfylla kriteriet?
Befintliga standardiserade vokabulärer, terminologier eller ontologier bör användas. Om sådana saknas och nya tas fram bör dessa vara i enlighet med etablerade standarder, och de bör dokumenteras och tillgängliggöras.


(Meta)data include qualified references to other (meta)data.
Relationer mellan de olika delarna i ett sammanhängande digitalt objekt, deras innebörd samt relationer till eventuella andra digitala objekt beskrivs på ett standardiserat och kontextualiserande sätt.
Beskrivning av relationer mellan olika objekt (såsom om aktuella data bygger på andra data, eller om aktuella data behöver kompletteras med annan information) underlättar förståelse och återanvändning. Att uttrycka relationer på ett standardiserat sätt underlättar sammanlänkning av olika data och metadata.
Vilka insatser behövs för att uppfylla kriteriet?
Relationer mellan olika objekt bör beskrivas. För att uttrycka relationer bör vedertagna format för detta som tillåter sammanlänkning eftersträvas (såsom RDF, Resource Description Framework).
Forskningsdata ska vara återanvändningsbara


(Meta)data are richly described with a plurality of accurate and relevant attributes.
De digitala objektens proveniens och innehåll beskrivs med kontextuella metadata.
Genom att beskriva innehållet med så rik metadata och semantik som möjligt ges så goda förutsättningar som möjligt för att innehållet ska vara sökbart, kunna bevaras över tid, användas och återanvändas och att egenskaper som påverkar huruvida data passar för syftet med återanvändningen upptäcks och kan hanteras så tidigt som möjligt i processen.
Vilka insatser behövs för att uppfylla kriteriet?
Det digitala objektets nytta för användning behöver optimeras genom att det tillförs kontextuella metadata som beskriver dess innehåll och betydelse samt sammanhanget inom vilket det är skapat/insamlat.


(Meta)data are released with clear and accessible data usage license.
Det digitala objektet inkluderar tydlig rättighetsmärkning/licens. Villkor bör omfatta både metadata och (där det är tillämpligt) data.
Om det inte är tydligt på vilket sätt och under vilka villkor ett digitalt objekt får användas kan det påverka tillgång till och användning av informationen. Det behöver därför framgå tydligt vilka rättighetsmärkningar, licenser eller regler som gäller, både avseende data och metadata.
Vilka insatser behövs för att uppfylla kriteriet?
Information som genereras genom vetenskaplig forskning behöver tillgängliggöras på ett sätt så att villkor för användning och återanvändning är tydliga.


(Meta)data are associated with detailed provenance.
Det digitala projektets proveniens inkluderar bland annat informationens ursprung, aktörer som har skapat och/eller ändrat informationen, de aktiviteter som genomförts samt i vilken ordning och när respektive aktivitet är utförd.
För att användare av det digitala objektet ska kunna förstå syftet i vilket informationen har tagits fram och av vem så behöver objektets proveniens beskrivas.
Vilka insatser behövs för att uppfylla kriteriet?
Det digitala objektets proveniens bör beskrivas på ett standardiserat sätt, i enlighet med gällande rekommendationer.


(Meta)data meet domain-relevant community standards.
Standardiserade sätt används för att beskriva ett specifikt objekt och dess olika delar vilket skapar möjligheter till förståelse och interoperabilitet.
Att använda sig av standardiserade sätt att beskriva domänspecifik information underlättar att informationen kan sökas, tolkas och sammanlänkas.
Vilka insatser behövs för att uppfylla kriteriet?
Digitala objekts innehåll bör vara strukturerat och beskrivet på ett så standardiserat sätt som möjligt och i enlighet med gällande rekommendationer.
Vägledning för implementering av kriterierna
För att FAIR datahantering ska kunna implementeras i forskningsprocessen har Vetenskapsrådet tagit fram en mer detaljerad beskrivning i form av en vägledning till kriterierna. Vägledningen har som syfte att på en mer detaljerad nivå stödja den praktiska implementeringen av kriterierna. Den kan användas som ett gemensamt stöd för alla som stödjer forskare i planering av datahantering, framförallt de stödjande funktionerna för datahantering vid lärosäten och infrastrukturer där anpassning till FAIR-datahantering och praktisk implementering av FAIR-principerna ofta sker.
Vägledning för implementering av kriterier för FAIR forskningsdata
Publicerad
Uppdaterad