Datahanteringsplan

Planering av datahantering

Forskningsdata och forskningspublikationer är bland de viktigaste resultaten av offentligt finansierad forskning. Därför är utgångsläget att forskningsmaterial som har producerats med finansiering av Finlands Akademi ska vara öppet tillgängligt.

På välmotiverade grunder kan materialets tillgänglighet dock definieras skilt enligt en skala från fritt tillgängligt till för alla hemligstämplat. Om du inte kan göra hela forskningsmaterialet tillgängligt för fortsatt bruk, måste du ändå lagra materialets metadata i en nationell eller internationell söktjänst. Ur forskningsetisk och lagstiftningsmässig synvinkel bör forskningsmaterialet i allmänhet bevaras för verifieringsändamål.

Planeringen av datahanteringen gör det möjligt att öppna forskningsdata och minska risken för att material försvinner, och den utgör en väsentlig del av god vetenskaplig praxis. Datahanteringsplanerna ska kunna genomföras vid forskningsplatsen och de åtgärder som ingår i planerna ska följa god datahanteringspraxis.

Datahanteringsplanerna lämnas till Akademin i två olika skeden:

1. I ansökningsskedet

I ansökningsskedet ska alla sökande kort beskriva sin datahantering under punkt 4.3 i forskningsplanen (Öppen vetenskap).

Av beskrivningen ska framgå:

  • var materialet lagras och hur det säkerhetskopieras under forskningsprojektet
  • hur man löser eventuella juridiska och etiska frågor som gäller delning av data (t.ex. äganderätt, upphovsrätt, känslighet)
  • var materialet eller den del av materialet som kan publiceras görs tillgängligt efter att projektet avslutats
  • Om man inom projektet inte samlar in eller producerar material som helt eller delvis lämpar sig för fortsatt användning, ska det motiveras varför materialet inte på något sätt eller ens delvis kan öppnas för fortsatt användning.

I ansökans finansieringsplan bör sökande beakta att de utgifter som hänför sig till lagring och tillgängliggörande av forskningsdata anses höra till värdorganisationens omkostnader, men de kan också på goda grunder godkännas som forskningskostnader som täcks med Akademins finansiering. Om projektet t.ex. fokuserar på behandling av stora datamängder eller om behandlingen av projektdata kräver exceptionellt mycket arbetskraft eller arbetstid, kan forskaren ansöka om finansiering för lönekostnader i anslutning till databehandling.

2. Efter ett positivt finansieringsbeslut

Den som fått ett positivt finansieringsbeslut ska lämna in en egentlig datahanteringsplan inom åtta veckor från beslutsdagen. Vi uppmanar finansieringsmottagare att i god tid be en dataexpert vid den egna organisationen om hjälp med att skriva datahanteringsplanerna. Vi rekommenderar att man använder verktyget DMPTuuli för att skriva planerna. Datahanteringsplanen ska vara högst ca tre sidor lång.

Den egentliga datahanteringsplanen lämnas in i e-tjänsten i samband med att sökanden godkänns innan godkännandet av forskningsplatsens representant. Konsortiet har en gemensam datahanteringsplan och endast konsortieledaren lämnar in den i samband med att finansieringen godkänns. Forskningsplatsen förbinder sig till att övervaka att datahanteringsplanen kan genomföras vid forskningsplatsen och att åtgärderna följer god datahanteringspraxis.

Finansieringen kan betalas ut först efter att både den sökande och forskningsplatsens representant har godkänt den. Efter detta meddelar systemet ekonomiförvaltningen vid forskningsplatsen om att finansieringen har beviljats och att finansieringen kan börja användas.

Innehållet i dessa anvisningar motsvarar innehållet i de anvisningar som har publicerats i DMPTuuli om Finlands Akademis utlysningar. Obs! Akademins utlysningar av finansiering för forskningsinfrastruktur följer andra datahanteringsanvisningar.

Frågor i datahanteringsplanen, Finlands Akademis anvisningar och god praxis

Innehåll

  1. Allmän beskrivning av data
  2. Iakttagande av etiska principer och lagstiftning
  3. Dokumentation och metadata
  4. Lagring och säkerhetskopiering under forskningsprojektet
  5. Öppna, publicera och arkivera data efter avslutat forskningsprojekt
  6. Datahanteringens ansvarsområden och resurser

Din datahanteringsplan är ett levande dokument som beskriver hur dina forskningsdata kommer att hanteras genom forskningens hela livscykel. Uppdatera planen när ditt forskningsprojekt framskrider.

För att undvika upprepningar kan du hänvisa till din forskningsplan i datahanteringsplanen och vice versa. I forskningsplanen beskrivs de vetenskapliga metoderna och analysen av datamaterialet. I datahanteringsplanen beskrivs däremot den tekniska och administrativa behandling av datamaterialet.

’Data’ är ett brett begrepp inom ramen för datahanteringsplaner. Data inbegriper all information och allt material som dina forskningsresultat grundar sig på. All forskning producerar inte forskningsdata som lämpar sig för fortsatt bruk, men varje i forskningsprocess genereras och utnyttjas data som bör hanteras korrekt och systematiskt under hela processen.

Hur skriver man en datahanteringsplan?

  • Läs igenom alla frågor först! Svara på frågorna i det fall att de är relevanta för ditt forskningsprojekt. Om en fråga inte är relevant, motivera varför.
  • Lägg till bakgrundsinformation i början av planen (t.ex. sökandens och projektets namn, projektnummer, finansieringsprogram och datahanteringsplanens version). Visa din förmåga till datahantering och dokumentation också genom att namnge datahanteringsplanen på ett tydligt sätt.
  • Använd datahanteringsplanen som ett riskbedömningsdokument. Visa att du kan identifiera, förutse och hantera eventuella risker i anknytning till datahanteringen inom ditt forskningsprojekt.
  • Skriv datahanteringsplanen utgående från ditt eget forskningsprojekt. Kopiera inte in exempel från andra texter.
  • Följ din organisations eller finansiärens anvisningar.

Varför är datahantering och att skriva en datahanteringsplan viktigt?

  • De är en del av god vetenskaplig praxis. Du sparar tid och pengar!
  • Risken att förlora forskningsdata minskar.
  • I planen kan du redan i förväg ta ställning till eventuella komplicerade frågor som gäller ägande- och nyttjanderätt.
  • Att skriva en datahanteringsplan hjälper dig att följa FAIR-principerna, vilket innebär att forskningsdata ska vara sökbara (Findable), tillgängliga (Accessible), interoperabla (Interoperable) och återanvändbara (Re-usable).
  • Planeringen hjälper dig att följa finansiärers riktlinjer.
  • Datahanteringsplanen visar dina projektledarfärdigheter.

1. Allmän beskrivning av data

Beskriv kort vilka slags data som samlas in eller produceras. Ange också vilka slags befintliga data som kommer att (åter)användas. Du kan t.ex. lista texttyper, bilder, fotografier, mätningar, statistik, fysiska prover eller koder.

Kategorisera dina data genom att dela in dem på ett åskådligt sätt, till exempel:

  1. A) befintliga data som insamlats tidigare och återanvänds i detta projekt
  2. B) data som samlas in för detta projekt
  3. C) data som producerats inom detta projekt.

Kategoriseringen i punkt 1.1 kan utgöra en generell struktur för resten av datahanteringsplanen.

Ange filformat för alla data. I vissa fall kan formatet som används under forskningsprojektet vara ett annat än det format som används vid arkiveringen av datamaterialet. Ange båda formaten. Filformatet är av central betydelse för framtida tillgänglighet och återanvändbarhet av data.

Beskriv i datahanteringsplanen hur mycket lagringsutrymme som behövs för dina data – inte hur många informanter som deltagit i projektet. Det räcker med en grov uppskattning av storleken på dina data (t.ex. mindre än 100 gigabyte, ungefär 1 terabyte, eller flera petabyte).

Rekommendationer för bästa praxis

  • Använd tabeller eller punktuppställningar för att koncist presentera typer av data, filformat, programvara, och storlek på data.
  • Exempel på filformat: .csv, .txt, .docx, .xlsx och .tif.
  • Kom ihåg att nämna all slags särskild eller ovanlig programvara som krävs för att läsa eller använda data, i synnerhet om programvaran kodas inom ramen för projektet.
  • Du kan även uppskatta hur mycket data produceras eller insamlas under projektets gång, exempelvis per vecka: ”Projektet producerar/samlar in ca 100 gigabyte data per vecka.”

Undvik överlappningar med forskningsplanen! Dataanalysen och metodologiska frågor som gäller projektets data ska beskrivas i forskningsplanen.

Beskriv hur metoderna som används för att samla in, analysera och bearbeta data kan påverka kvaliteten på projektets data och hur du ämnar minimera riskerna.

Kvalitetskontroll av data säkerställer att data inte ändras av misstag och att kvaliteten upprätthålls under hela livscykeln. Kvalitetsproblem kan uppstå i samband med den tekniska hanteringen, konverteringen eller överföringen eller i samband med kontextuell hantering och analys.

Rekommendationer för bästa praxis

  • Utnyttja befintliga versionskontrollprocesser. Detta kan betyda t.ex. användande av filnamnskonventioner eller Git-verktyg.
  • Rekommendationen är att transkriptioner av ljud- eller videoupptagningar kontrolleras av någon annan än den som transkriberat dem.
  • Analogt material ska digitaliseras med så hög resolution som möjligt för precision.
  • Vid alla konverteringar ska det ursprungliga informationsinnehållet säkerställas.
  • Ordna övningssessioner och skriv anvisningar för att säkerställa att alla i din forskningsgrupp är insatta i kvalitetskontroll och kan förutse risker i anslutning till kvaliteten på data.

Undvik överlappningar med forskningsplanen! Detaljer med anknytning till dataanalys, metoder och verktyg ska beskrivas i forskningsplanen. Du ska till exempel inte inkludera beskrivningar av instrumentens kalibrering i datahanteringsplanen.

2. Iakttagande av etiska principer och lagstiftning

Frågor med anknytning till rättigheter samt juridiska och etiska aspekter omfattar all forskningsdata. Visa att du känner till relevant lagstiftning i anslutning till behandlingen av dina forskningsdata. Om du hanterar personuppgifter eller känsliga uppgifter ska du beskriva hur deltagarnas identitet kommer att skyddas och hur du kommer att anonymisera eller pseudonymisera data.

Rekommendationer för bästa praxis

  • Bekanta dig med din organisations etiska riktlinjer, anvisningar om integritetsskydd och datasäkerhetspolicy och var beredd att följa bestämmelserna i dem.
  • Om en etikprövningsnämnd ger ett utlåtande om din forskning ska du i datahanteringsplanen ange hur du ämnar följa direktiven (t.ex. hur deltagarnas identitetsskydd tryggas genom att man avlägsnar känsliga eller personliga uppgifter ur data innan de görs tillgängliga).
  • Om du kommer att behandla personuppgifter, ange vilken typ av data du ämnar samla in.
  • Med personuppgifter avses alla uppgifter som anknyter till en identifierad eller identifierbar person. Personuppgifter är t.ex. namn, telefonnummer, positionsuppgifter och uppgifter om far- och morföräldrars genetiska sjukdomar.
  • Läs mer på Dataombudsmannens webbplats.

Undvik överlappningar med forskningsplanen! Detaljer gällande etiska frågor, liksom utlåtanden från etiska kommittéer och användning av försöksdjur, ska beskrivas i forskningsplanen.

Ange hur du kommer överens om nyttjanderätten för projektets data, såväl insamlat, producerat som (åter)använt datamaterial. Här kan du använda kategoriseringen du gjort upp under punkt 1. Varje kategori under punkt 1.1 inbegriper olika rättigheter och licenser. Beskriv de processer med anknytning till överföring av nyttjanderätter som är relevanta för ditt projekt. Beskriv frågor i anknytning till sekretesspraxis om det är relevant för ditt projekt.

Licensera ditt datamaterial!

Rekommendationer för bästa praxis

  • Avtal om äganderätten och nyttjanderätten bör ingås i ett så tidigt skede av projektets livscykel som möjligt.
  • Har du fått samtycke för förvaring och tillgängliggörande av data?
  • Följ finansiärens policy och riktlinjer.
  • Det rekommenderas att all data och alla koder och all programvara görs tillgängliga för återanvändning t.ex. genom Creative Commons, GNU, MIT eller en annan ändamålsenlig licens.

3. Dokumentation och metadata

Dokumentationen av data möjliggör att andra (både människor och datorer) kan hitta, använda och citera data och filer. Utan ändamålsenlig dokumentation kan ditt datamaterial inte återanvändas.

Dokumentationen av data innehåller väsentlig information, t.ex. a) metadata (för upptäckt och identifiering) var, när, varför och hur datamaterialet samlades in, samt b) beskrivande information om hur man tolkar datamaterialet korrekt med metadatastandarder, ordförråd och t.ex. readme-filer.

Rekommendationer för bästa praxis

  • Beskriv alla dokumentationstyper som kommer att användas (t.ex. readme-filer och metadata.) för att andra ska kunna hitta, förstå och återanvända ditt datamaterial. Arkiv förutsätter ofta användning av en viss metadatastandard. Ta reda på om det finns en metadatamodell eller -standard inom ditt forskningsområde, som du kunde använda.
  • Tänk på hur informationen kommer att organiseras under projektet. Beskriv t.ex. konventioner om filnamn, versionskontroll och mappstruktur.
  • Använd sådana forskningsverktyg som automatiskt skapar metadata i standardiserade format.
  • Identifiera vilken slags information som ska sparas för att andra forskare ska kunna hitta, få tillgång till, tolka, använda och citera dina forskningsdata. För minimikrav för dokumentation av datamaterial, se t.ex. Qvain User Guide.

4. Lagring och säkerhetskopiering under forskningsprojektet

Beskriv var datamaterialet lagras och säkerhetskopieras under forskningsprojektet. Fundera över vem som ska ansvara för säkerhetskopiering och återställande. Om flera forskare är involverade ska du göra upp en plan med dina samarbetspartner och säkerställa en trygg överföring mellan de medverkande.

Visa att du känner till vilka lagringsmöjligheter din organisation erbjuder. Det räcker inte med att hänvisa till it-tjänster. Slutligen är det du själv – inte it-avdelningen eller din organisation – som ansvarar för ditt datamaterial.

Beskriv metoderna för bevaring och tillgängliggörande av datamaterialet efter att forskningsprojektet har avslutats utförligare i avsnitt 5.

Rekommendationer för bästa praxis

  • Det rekommenderas att du använder dig av en säker förvaringsplats som erbjuds och förvaltas av din egen organisations it-avdelning eller någon annan betrodd it-leverantör (såsom CSC).
  • Använd inte externa hårddiskar som primär lagringsplats.
  • Följ din organisations krav på datasäkerhet.

Det är ytterst viktigt att trygga datasäkerheten, i synnerhet om datamaterialet innehåller känsliga data, personuppgifter, politiskt känslig information eller affärshemligheter. Ange vem som har tillgång till ditt datamaterial, vad de har rätt att göra med det och hur du säkerställer att data tryggt överförs till dina samarbetspartner.

Rekommendationer för bästa praxis

  • Åtkomsten till datamaterialet ska regleras och övervakas enligt graden av konfidentialitet.

5. Öppna, publicera och arkivera data efter avslutat forskningsprojekt

Beskriv hur du gör ditt material upptäckbart och tillgängligt för vidare användning. Om datamaterialet delvis eller i sin helhet inte kan göras tillgängligt ska du motivera varför du endast erbjuder tillgång till metadata.

Om ditt projekt innehåller känsliga data som inte kan öppnas, beskriv hur projektets metadata kommer att öppnas. Beskriv hur känsliga uppgifter lagras på ett säkert sätt under punkt 5.2.

Öppen tillgänglighet främjar återanvändningen av forskningsdata.

Rekommendationer för bästa praxis

  • Du kan publicera en beskrivning av datamaterialet (dvs. metadata) utan att göra själva datamaterialet öppet tillgängligt. På så sätt kan du begränsa tillgängligheten.
  • Publicera datamaterialet i ett dataarkiv (data repository) eller i en datapublikation (data journal).
  • Du kan söka lämpliga arkiv på org.
  • Föredra arkiv/repositorier eller förläggare som ger permanenta identifikationer (PID) till ditt datamaterial. På så vis kan materialet nås via en permanent länk (t.ex. DOI, URN).
  • Kom ihåg att kontrollera finansiärens, vetenskapsområdets eller nationella rekommendationer för dataarkiv/repositorier.
  • Det rekommenderas att all data och alla koder och all programvara görs tillgängliga för återanvändning t.ex. genom Creative Commons, GNU, MIT eller en annan ändamålsenlig licens.

Undvik överlappningar med publiceringsplanen! Att publicera en vetenskaplig artikel är inte samma sak som att publicera datamaterial. Datapublikationer (data journal) är specialiserade forum för publicering av forskningsdata.

Beskriv kort vilka data som ska arkiveras, var och hur länge. Långvarig bevarande/lagring innebär att data bevaras/lagras så länge som nödvändigt – även i flera decennier eller århundraden.

Du kan kategorisera ditt datamaterial efter den planerade förvaringstiden:

  1. A) data som förstörs när projektet har avslutats
  2. B) data som arkiveras under en verifieringsperiod (varierar efter vetenskapsområde; t.ex. 5–15 år)
  3. C) data som arkiveras för eventuell återanvändning (i t.ex. 25 år)
  4. D) data av långvarigt värde som arkiveras i en kuraterad tjänst för framtida generationer i tiotals eller hundratals år.

Du måste bestämma vilka data ska bevaras och vilka data som förstörs. Unika data eller data som är svåra att reproducera kan ha ett långsiktigt värde och är skäl att bevaras. För digital lagring bör man använda särskilda arkiv/repositorier som är avsedda för långvarigt bevarande.

Rekommendationer för bästa praxis

  • Beslut om lagring av data bör fattas redan då datahanteringen planeras, och besluten bör ta hänsyn till t.ex. riktlinjer och krav från organisationer.
  • Använd arkiv/repositorier som är engagerade i långsiktig kurering av datamaterial. Tjänsten Fairdata PAS är t.ex. specialiserad på datamaterial som har betydande värde för organisationen eller på nationell nivå, både nu och särskilt i framtiden. Kontakta din organisations datastöd om du vill veta mera om PAS.

6. Datahanteringens ansvarsområden och resurser

Här kan du sammanfatta alla ansvarsområden som beskrivits i föregående frågor. Fastställ också vem som är ansvarig för datamaterial från ditt projekt efter att det är avslutat.

Rekommendationer för bästa praxis

  • Beskriv datahanteringens roller och ansvarsområden i fråga om t.ex. insamling av data, produktion av metadata, datakvalitet, lagring och säkerhetskopiering, arkivering och tillgängliggörande av data. Namnge ansvariga personer när det är möjligt.
  • I fråga om samarbetsprojekt, förklara hur datahanteringen koordineras och vilka som är de ansvariga inom de olika samarbetsorganisationerna.
  • Ange vem som ansvarar för genomförandet av datahanteringsplanen, och för att den granskas och uppdateras vid behov.
  • Planera in regelbunden granskning av datahanteringsplanen.

Uppskatta vilka resurser som behövs (t.ex. pengar och tid) för hantering, förvaring och tillgängliggörande av data. Dessa kan inkludera kostnader för förvaring, hårdvara, personalresurser (tid) och kostnader för användning av repositorier.

Rekommendationer för bästa praxis

  • Beakta vilken typ av extra it-tjänster och resurser som behövs, och vilka extra kostnader som dessa inbegriper.
  • Överväg noggrant vilka resurser som behövs för att dela, lagra och kuratera datamaterialet.
  • Kom ihåg att specificera datahanteringskostnaderna i budgeten, enligt finansiärens krav.

Har du frågor eller synpunkter?