Datahanteringsplan

Planering av datahantering

Forskningsdata och forskningspublikationer är bland de viktigaste resultaten av offentligt finansierad forskning. Därför är utgångsläget att forskningsmaterial som har producerats med finansiering av Finlands Akademi ska vara öppet tillgängligt. På välmotiverade grunder kan materialets tillgänglighet dock definieras skilt enligt en skala från fritt tillgängligt för alla till hemligstämplat. Om du inte kan göra hela forskningsmaterialet tillgängligt för fortsatt bruk, måste du ändå lagra materialets metadata i en nationell eller internationell söktjänst. Ur forskningsetisk och lagstiftningsmässig synvinkel bör forskningsmaterialet i allmänhet bevaras för verifieringsändamål. Planeringen av datahanteringen gör det möjligt att öppna forskningsdata och minska risken för att material försvinner, och den utgör en väsentlig del av god vetenskaplig praxis. Datahanteringsplanerna ska kunna genomföras vid forskningsplatsen och de åtgärder som ingår i planerna ska följa god datahanteringspraxis.

Datahanteringsplanerna lämnas till Akademin i två olika skeden:

1. I ansökningsskedet

I ansökningsskedet ska alla sökande kort beskriva sin datahantering under punkt 4.3 i forskningsplanen (Öppen vetenskap).

Av beskrivningen ska framgå:

  • var materialet lagras och hur det säkerhetskopieras under forskningsprojektet
  • hur man löser eventuella juridiska och etiska frågor som gäller delning av data (t.ex. äganderätt, upphovsrätt, känslighet)
  • var materialet eller den del av materialet som kan publiceras görs tillgängligt efter att projektet avslutats
  • Om man inom projektet inte samlar in eller producerar material som helt eller delvis lämpar sig för fortsatt användning, ska det motiveras varför materialet inte på något sätt eller ens delvis kan öppnas för fortsatt användning.

I ansökans finansieringsplan bör sökande beakta att de utgifter som hänför sig till lagring och tillgängliggörande av forskningsdata anses höra till värdorganisationens omkostnader, men de kan också på goda grunder godkännas som forskningskostnader som täcks med Akademins finansiering.

2. Efter ett positivt finansieringsbeslut

Den som fått ett positivt finansieringsbeslut ska lämna in en egentlig datahanteringsplan inom åtta veckor från beslutsdagen. Vi uppmanar finansieringsmottagare att i god tid be en dataexpert vid den egna organisationen om hjälp med att skriva datahanteringsplanerna. Vi rekommenderar att man använder verktyget DMPTuuli för att skriva planerna. Datahanteringsplanen ska vara högst ca två sidor lång. Den egentliga datahanteringsplanen lämnas in i e-tjänsten i samband med att sökanden godkänns innan godkännandet av forskningsplatsens representant. Forskningsplatsen förbinder sig till att övervaka att datahanteringsplanen kan genomföras vid forskningsplatsen och att åtgärderna följer god datahanteringspraxis. Finansieringen kan betalas ut först efter att både den sökande och forskningsplatsens representant har godkänt den. Efter detta meddelar systemet ekonomiförvaltningen vid forskningsplatsen om att finansieringen har beviljats och att finansieringen kan börja användas. Innehållet i dessa anvisningar motsvarar innehållet i de anvisningar som har publicerats i DMPTuuli om Finlands Akademis utlysningar. Obs! Akademins utlysningar av finansiering för forskningsinfrastruktur följer andra datahanteringsanvisningar.

Frågor i datahanteringsplanen, Finlands Akademis anvisningar och god praxis

Innehåll:

  1. Allmän beskrivning av data
  2. Iakttagande av etiska principer och lagstiftning
  3. Dokumentation och metadata
  4. Lagring och säkerhetskopiering under forskningsprojektet
  5. Öppna, publicera och arkivera data efter avslutat forskningsprojekt
  6. Datahanteringens ansvar och resurser

Hur gör jag en datahanteringsplan?

Börja med att läsa alla frågor!

Undvik överlappningar med forskningsplanen.

  • Forskningsplanen beskriver den vetenskapliga, analytiska och metodologiska behandlingen av materialet.
  • Data hanteringsplanen beskriver den tekniska och administrativa behandlingen av materialet.
  • För att undvika upprepningar kan du hänvisa till din forskningsplan i datahanteringsplanen.
  • Använd datahanteringsplanen som ett riskbedömningsdokument. Visa att du kan identifiera, förutse och hantera risker som anknyter till behandlingen av data.
  • Skriv datahanteringsplanen utgående från ditt eget forskningsprojekt. Kopiera inte in exempel från andra texter.
  • Skriv bara sådana meningar som du själv förstår.
  • Svara på frågorna i det fall att de är relevanta för ditt forskningsprojekt. Om en fråga inte är      relevant, motivera varför.
  • Svara åtminstone på frågorna i huvudpunkterna. Du behöver inte svara på alla underpunkter separat.
  • Lägg till bakgrundsinformation såsom den sökandes namn och projekttitel, projektnummer, finansieringsbeslutets id och datahanteringsplanens version.
  • Visa din förmåga till datahantering och dokumentation exempelvis genom att namnge      datahanteringsplanen på ett tydligt sätt.
  • Följ din organisations eller finansiärens anvisningar.

Varför behöver man förvalta forskningsmaterial och göra en datahanteringsplan?

  • Det är en del av god vetenskaplig praxis.
  • Risken att förlora forskningsdata minskar.
  • I planen kan du redan i förväg ta ställning till eventuella komplicerade frågor som gäller ägande- och nyttjanderätt.
  • Planen är ett stöd för fri tillgång och främjar produktivt framtida samarbete.
  • Planeringen hjälper med att följa finansiärers riktlinjer.
  • Du sparar tid och pengar.
  • Datahanteringsplanen visar dina projektledarfärdigheter.

’Data’ är ett brett begrepp inom ramen för datahanteringsplaner. Forskningsdata inbegriper all information och allt material som dina forskningsresultat grundar sig på. I planen kan du koncentrera dig på sådana data som hör till ditt ansvarsområde.

Datahanteringsplanen ska beskriva hur forskningsdata kommer att hanteras genom forskningens hela livscykel. Datahanteringsplanen är ett levande dokument som bör uppdateras allteftersom forskningsprojektet framskrider.

Rutinerna för hantering av forskningsdata ska följa FAIR-principerna, vilket innebär att forskningsdata ska vara sökbara (Findable), tillgängliga (Accessible), interoperabla (Interoperable) och återanvändbara (Re-usable).

1        Allmän beskrivning av data

1.1  Vilka slags data baserar sig forskningen på? Hurdana data samlas in, produceras eller återanvänds? Vilka filformat används? Ge även en grov uppskattning av hur mycket data som kommer att produceras eller samlas in.

Beskriv kort vilka slags data som samlas in eller produceras. Ange också vilka slags befintliga data som kommer att (åter)användas. Du kan t.ex. lista texttyper, bilder, fotografier, mätningar, statistik, fysiska prover eller koder.

Kategorisera dina data genom att dela in dem på ett åskådligt sätt, till exempel:

A) data som samlas in för detta projekt

B) data som producerats inom projektet

C) befintliga data som insamlats tidigare och återanvänds i detta projekt

D) dokument som anknyter till forskningens hantering.

Det lönar sig att formulera kategoriseringen utifrån användarrättigheterna och licenserna för det material som du använt och producerat. Beskriv kortfattat enligt vilken licens du har rätt att (åter)använda data. Kategoriseringen i punkt 1.1 kan utgöra en generell struktur för resten av datahanteringsplanen.

Ange filformat för alla data. I vissa fall kan formatet som används under forskningsprojektet vara ett annat än det format som används vid arkiveringen av datamaterialet. Ange båda formaten. Filformatet är av central betydelse för framtida tillgänglighet och återanvändbarhet av data.

Beskriv i datahanteringsplanen hur mycket lagringsutrymme som behövs för dina data – inte hur många informanter som deltagit i projektet. Det räcker med en grov uppskattning av storleken på dina data (t.ex. mindre än 100 gigabyte, ungefär 1 terabyte, eller flera petabyte).

Rekommendationer för bästa praxis

  • Använd tabeller eller punktuppställningar för att koncist presentera typer av data, filformat, programvara, och storlek på data.
  • Exempel på filformat: .csv, .txt, .docx, .xslx och .tif.
  • Kom ihåg att nämna all slags särskild eller ovanlig programvara som krävs för att läsa eller använda data, i synnerhet om programvaran kodas inom ramen för projektet.
  • Du kan även uppskatta hur mycket data produceras eller insamlas under projektets gång, exempelvis per vecka: ”Projektet producerar/samlar in ca 100 gigabyte data per vecka.”
  • Undvik överlappningar med forskningsplanen! Dataanalysen och metodologiska frågor som gäller projektets data ska beskrivas i forskningsplanen.

1.2 Hur kontrolleras datamaterialets enhetlighet och kvalitet?

Beskriv hur metoderna som används för att samla in, analysera och bearbeta data kan påverka kvaliteten på projektets data och hur du ämnar minimera riskerna.

Kvalitetskontroll av data säkerställer att data inte ändras av misstag och att kvaliteten upprätthålls under hela livscykeln. Kvalitetsproblem kan uppstå i samband med den tekniska hanteringen, konverteringen eller överföringen eller i samband med kontextuell hantering och analys.

Rekommendationer för bästa praxis

  • Transkriptioner av ljudupptagningar eller videointervjuer ska kontrolleras av en annan person än den som transkriberat dem.
  • Analogt material ska digitaliseras med så hög resolution som möjligt för precision.
  • Vid alla konverteringar ska det ursprungliga informationsinnehållet säkerställas.
  • Programvara som använder sig av kontrollsummor ska användas.
  • Ordna övningssessioner och skriv anvisningar för att säkerställa att alla i din forskningsgrupp är insatta i kvalitetskontroll och kan förutse risker i anslutning till kvaliteten på data.
  • Undvik överlappningar med forskningsplanen! Detaljer med anknytning till dataanalys, metoder och verktyg ska beskrivas i forskningsplanen. Du ska till exempel inte inkludera beskrivningar av instrumentens kalibrering i datahanteringsplanen.

2        Iakttagande av etiska principer och lagstiftning

2.1 Vilka juridiska frågor är relevanta för datahanteringen (t.ex. GDPR och annan lagstiftning som påverkar behandling av data)?

Frågor med anknytning till rättigheter samt juridiska och etiska aspekter omfattar all forskningsdata. Visa att du känner till relevant lagstiftning i anslutning till behandlingen av dina forskningsdata. Om du hanterar personuppgifter eller känsliga uppgifter ska du beskriva hur deltagarnas identitet kommer att skyddas och hur du kommer att anonymisera eller pseudonymisera data.

Rekommendationer för bästa praxis

  • Bekanta dig med din organisations etiska riktlinjer, anvisningar om integritetsskydd och      datasäkerhetspolicy och var beredd att följa bestämmelserna i dem.
  • Om en etikprövningsnämnd ger ett utlåtande om din forskning ska du i datahanteringsplanen ange hur du ämnar följa direktiven (t.ex. hur deltagarnas identitetsskydd tryggas genom      att man avlägsnar känsliga eller personliga uppgifter ur data innan de görs tillgängliga).
  • Om du kommer att behandla personuppgifter, ange vilken typ av data du ämnar samla in.
  • Med personuppgifter avses alla uppgifter som anknyter till en identifierad eller identifierbar      person. Personuppgifter är t.ex. namn, telefonnummer, positionsuppgifter och uppgifter om far- och morföräldrars genetiska sjukdomar.
  • Läs mer på Dataombudsmannens webbplats.
  • Undvik överlappningar med forskningsplanen! Detaljer gällande etiska frågor, liksom utlåtanden från etiska kommittéer och användning av försöksdjur, ska beskrivas i      forskningsplanen.

2.2 Hur hanteras rättigheterna till det datamaterial du använder, producerar och delar?

Ange hur du kommer överens om nyttjanderätten för projektets data, såväl insamlat, producerat som (åter)använt datamaterial. Här kan du använda kategoriseringen du gjort upp under punkt 1. Varje kategori under punkt 1.1 inbegriper olika rättigheter och licenser. Beskriv de processer med anknytning till överföring av nyttjanderätter som är relevanta för ditt projekt. Beskriv frågor i anknytning till sekretesspraxis om det är relevant för ditt projekt.

Rekommendationer för bästa praxis

  • Kontrollera din organisations policy i fråga om äganderätt, nyttjanderätt och rätten att sprida data.
  • Har du fått samtycke för förvaring och tillgängliggörande av data?
  • Avtal om äganderätten bör ingås i ett så tidigt skede av projektets livscykel som möjligt.
  • Beakta också finansiärens principer.
  • Det rekommenderas att all data och alla koder och all programvara görs tillgängliga för återanvändning t.ex. genom Creative Commons, GNU, MIT eller en annan ändamålsenlig licens.

3        Dokumentation och metadata

3.1 På vilket sätt dokumenterar du ditt datamaterial så att det är sökbart, tillgängligt, interoperabelt och återanvändbart?  Vilka metadatastandarder, README-filer eller annan dokumentation kommer att användas för att andra ska kunna förstå och använda datamaterialet?

Dokumentationen av data möjliggör att andra (både människor och datorer) kan hitta, använda och citera data och filer. Dokumentationen innehåller väsentlig information som t.ex. berättar var, när, varför och hur datamaterialet samlades in, bearbetades och tolkades. Utan ändamålsenlig dokumentation är ditt datamaterial värdelöst. Beskriv verktyget, exempelvis Qvain, som du ämnar använda för att dokumentera dina data. Du behöver inte nämna metadatastandarder om du inte använder sådana. Förutse öppnandet av ditt projekts metadata eller dokumentation redan här. Ge en detaljerad beskrivning av öppnandet i punkt 5.

Undvik överlappningar med forskningsplanen!

Dokumentation på datanivå (data-level) och detaljer i fråga om experiment, analysmetoder och den vetenskapliga kontexten ska beskrivas i forskningsplanen.

I datahanteringsplanen ska du beskriva dokumentationen på projektnivå (study-level).

Rekommendationer för bästa praxis

  • Beskriv alla dokumentationstyper som kommer att användas (t.ex. README-filer och metadata.) för att andra ska kunna hitta, förstå och återanvända ditt datamaterial.
  • När du följer FAIR-principerna säkerställer du att ditt datamaterial är sökbart, tillgängligt,      interoperabelt och återanvändbart.
  • För minimikrav för dokumentation av datamaterial, se t.ex. Qvain Light.
  • Använd sådana forskningsverktyg som automatiskt skapar metadata i standardiserade format.
  • Identifiera vilken slags information som ska sparas för att andra forskare ska kunna hitta, få  tillgång till, tolka, använda och citera dina forskningsdata.

4        Lagring och säkerhetskopiering under forskningsprojektet

4.1 Var kommer datamaterialet att lagras och hur sker säkerhetskopieringen?

Beskriv var datamaterialet lagras och säkerhetskopieras under forskningsprojektet. Beskriv metoderna för bevaring och tillgängliggörande av datamaterialet efter att forskningsprojektet har avslutats utförligare i avsnitt 5.

Fundera över vem som ska ansvara för säkerhetskopiering och återställande. Om flera forskare är involverade ska du göra upp en plan med dina samarbetspartner och säkerställa en trygg överföring mellan de medverkande.

Visa att du känner till vilka lagringsmöjligheter din organisation erbjuder. Det räcker inte med att hänvisa till organisationens it-tjänster. Slutligen är det du själv – inte it-avdelningen eller din organisation – som ansvarar för ditt datamaterial.

Rekommendationer för bästa praxis

  • Det rekommenderas att du använder dig av en säker förvaringsplats som erbjuds och förvaltas av din egen organisations it-avdelning.
  • Använd inte externa  hårddiskar som primär lagringsplats.

4.2 Vem reglerar åtkomsten till datamaterialet och hur övervakas skyddad åtkomst?

Det är ytterst viktigt att trygga datasäkerheten, i synnerhet om datamaterialet innehåller känsliga data, personuppgifter, politiskt känslig information eller affärshemligheter. Ange vem som har tillgång till ditt datamaterial, vad de har rätt att göra med det och hur du säkerställer att data tryggt överförs till dina samarbetspartner.

Rekommendationer för bästa praxis

  • Åtkomsten till datamaterialet ska regleras och övervakas enligt graden av konfidentialitet.

5  Öppna, publicera och arkivera data efter avslutat forskningsprojekt

5.1 Vilken del av datamaterialet kan göras öppet tillgängligt eller publiceras? Var och när kommer datamaterialet eller dess metadata att göras tillgängliga?

Beskriv huruvida du har för avsikt att publicera datamaterialet eller på annat sätt göra det öppet tillgängligt delvis eller i sin helhet. Om datamaterialet delvis eller i sin helhet inte kan göras öppet ska du motivera varför.

Om ditt projekt innehåller känsliga data som inte kan öppnas, beskriv hur projektets metadata kommer att öppnas. Beskriv hur känsliga uppgifter lagras på ett säkert sätt under punkt 5.2.

Öppen tillgänglighet främjar återanvändningen av forskningsdata.

Rekommendationer för bästa praxis

  • Du kan publicera en beskrivning av datamaterialet (dvs. metadata) utan att göra själva  datamaterialet öppet tillgängligt. På så sätt kan du begränsa tillgängligheten.
  • Publicera datamaterialet i ett datarepositorium eller i en datapublikation.
  • Du kan söka lämpliga repositorier på re3data.org.
  • Kom ihåg att kontrollera finansiärens och vetenskapsområdets rekommendationer för datarepositorier och också de nationella rekommendationerna.
  • Det rekommenderas att all data och alla koder och all programvara görs tillgängliga för återanvändning t.ex. genom Creative Commons, GNU, MIT eller en annan ändamålsenlig licens.
  • Sträva till att använda epositorier eller förläggare som ger permanenta identifikationer ( t.ex. DOI, URN) till ditt datamaterial.
  • Undvik överlappningar med publiceringsplanen! Att publicera en vetenskaplig artikel är inte samma sak som att publicera datamaterial. Datapublikationer är specialiserade forum för publicering av forskningsdata.

5.2 Var bevaras datamaterial av långsiktigt värde och hur länge?

Beskriv kort vilka data som ska arkiveras och hur länge. Kategorisera dina dataset i enlighet med den planerade förvaringsperioden:

A) data som förstörs när projektet har avslutats

B) data som arkiveras under en verifieringsperiod (varierar efter vetenskapsområde; t.ex. 5–15 år)

c) data som arkiveras för eventuell återanvändning (i t.ex. 25 år)

D) data av långvarigt värde som arkiveras i en kuraterad tjänst för framtida generationer i tiotals eller hundratals år.

Beskriv vilka data som förstörs efter att projektet har avslutats och hur dessa kommer att förstöras. Beskriv principerna för det arkiverade datamaterialets tillgänglighet. Överväg att anlita arkiv med riktlinjer för kuratering.

Rekommendationer för bästa praxis

  • Kom ihåg att kontrollera både nationella och finansiärens och vetenskapsområdets rekommendationer för datarepositorier.

6 Datahanteringens ansvar och resurser

6.1 Vem (t.ex. roll och enhet) ansvarar datahanteringen (dvs. vem är dataansvarig)?

Här kan du sammanfatta alla ansvarsområden som beskrivits i föregående frågor.

Rekommendationer för bästa praxis

  • Beskriv datahanteringens/dataansvarigas uppgifter och ansvarsområden i fråga om  exempelvis insamling av data, produktion av metadata, datakvalitet, lagring och säkerhetskopiering, arkivering och tillgängliggörande av data. Namnge ansvariga personer när det är möjligt.
  • I fråga om samarbetsprojekt, beskriv vilka som är ansvariga för datahanteringen inom de olika samarbetsorganisationerna.
  • Ange vem som ansvarar för genomförandet av datahanteringsplanen, och för att den granskas och uppdateras vid behov.
  • Planera in regelbunden granskning av datahanteringsplanen.
  • Fastställ också vem som är ansvarig för datamaterial från ditt projekt efter att det är avslutat.

6.2 Vilka resurser behövs för hanteringen av ditt datamaterial för att data ska kunna öppnas och förvaras i enlighet med FAIR-principerna (sökbart, tillgängligt, interoperabelt och återanvändbart)?

Uppskatta vilka resurser som behövs (t.ex. pengar och tid) för hantering, förvaring och tillgängliggörande av data. Beakta vilken typ av extra it-tjänster och resurser som behövs, och vilka extra kostnader som dessa inbegriper.

Rekommendationer för bästa praxis

  • Kom ihåg att specificera datahanteringskostnaderna i budgeten, enligt finansiärens krav.
  • Beakta noggrant och motivera alla resurser som behövs för att dela, lagra och kuratera data. Dessa kan inkludera kostnader för förvaring, hårdvara, personalresurser (tid) och kostnader för användning av repositorier. Observera att också beredningen av tillgängliggörandet av materialet medför kostnader och tar tid. Förklara hur allt detta har beaktats i kostnadsberäkningen.

 

Har du frågor eller synpunkter?