Neem databeheer serieus...

... en vraag advies aan de datasteward

WUR leidt de komende tijd zeker honderd datastewards op; medewerkers die de rol krijgen om hun collega’s voor te lichten over en te begeleiden bij het verstandig verzamelen, verwerken en opslaan van onderzoeksdata. Wie zijn deze mensen en wat komen ze tegen bij WUR als het gaat om datagebruik? “Het lastigst is collega’s te overtuigen databeheer serieus te nemen.”

‘Je moet iemand overtuigen die al jaren op een bepaalde manier werkt’

Hergebruik van onderzoeksdata maakt ons werk effectiever en transparanter. Daarom maakt WUR de komende jaren werk van een FAIR databeleid. FAIR wil zeggen dat je data vindbaar (Findable), toegankelijk (Accessible), uitwisselbaar (Interoperable) en herbruikbaar (Reusable) moet zijn. Het komt erop neer dat data die voortkomt uit onderzoek beter aan publicaties kan worden gekoppeld.

Op papier sluit het WUR-beleid mooi aan bij de nationale en internationale ontwikkelingen, zegt datacoördinator Jacquelijn Ringersma van het Wageningen Data Competence Center (WDCC). “Maar het lastige is dat onderzoekers dit beleid maar mondjesmaat uitvoeren. We hebben veel over het waarom en het hoe gecommuniceerd, en redelijke diensten opgezet. Maar de uitvoering blijft achter bij het beleid. Of dat komt omdat de urgentie nog niet gevoeld wordt, of dat onderzoekers databeheer nog steeds niet zien als onderdeel van het onderzoeksproces, weet ik niet zo goed. Bij de Data Desk hebben we 4 fte en dat is natuurlijk onvoldoende om 3.000 onderzoekers te ondersteunen. Ook daarom introduceren we de datastewards.”

Wat houdt de rol van datasteward precies in?

Joeri Kalter, data steward bij de leerstoelgroep Humane Voeding & Gezondheid: “Op dit moment wordt er bij Voedingswetenschappen door de onderzoekers over het algemeen onvoldoende aandacht besteed aan verantwoorde planning en uitvoering met betrekking tot digitale data. Dit geldt zowel voor, tijdens en na een onderzoeksproject. Als datasteward sta je voor de opgave iemand te overtuigen een andere werkwijze toe te passen, terwijl die persoon al jaren op een bepaalde manier werkt. Je kunt bijvoorbeeld een goed Data Management Plan schrijven, maar het is ook belangrijk dat het geïmplementeerd wordt. Lukt het je niet, dan komen de bruikbaarheid, herbruikbaarheid en reproduceerbaarheid van de data in gevaar. Een datasteward kan ervoor zorgen dat dit proces wordt verbeterd.”

Joeri Kalter

Sylvia Brugman

Wat zijn moeilijke kwesties?

Sylvia Brugman, universitair docent Celbiologie en immunologie: “Het lastigst vind ik het om collega’s ervan te overtuigen goed databeheer ook echt serieus te nemen. Als de leerstoelhouder, de uiteindelijke verantwoordelijke, er helemaal niet mee bezig is, worden mensen er niet op aangesproken, of in ieder geval worden er nog geen consequenties aan verbonden.”

“Lastig is ook dat datastewardship een van de extra taken is die op het bord komt van een staflid. Vooralsnog zijn er verschillende mensen die deze rol op zich nemen bovenop hun eigen werk. In een paar groepen zijn echt datastewards aangenomen, maar in de meeste groepen zijn het bestaande stafleden.”

Datastewards tijdens een workshop van het WDCC. Foto: Judith Jockel

Felix Homa

Wat is voor jou een belangrijk aandachtspunt?

Felix Homa, bio-informaticus bij het Laboratorium voor Microbiologie: “Idealiter zouden we al onze onderzoeksdata gratis opslaan en er toegang tot hebben wanneer we dat willen. Maar dat is helaas nog theorie. Mijn rol bij Microbiologie is ervoor te zorgen dat onderzoekers en studenten toegang hebben tot voldoende computerkracht om hun gigabits en terabits aan data te verwerken. In de toekomst kan ik me voorstellen dat alle gegevens, samen met enkele metadata, in een systeem worden gegooid, en dat de computer de gegevens opslaat en uit zichzelf bewerkingen op die gegevens uitvoert. In dat geval hoeft de gebruiker niet meer na te denken over hoe of waar hij zijn gegevens moet opslaan of gebruiken.”

‘Ik zorg ervoor dat onderzoekers voldoende computerkracht hebben voor hun gigabits aan data’
‘Slecht gedocumenteerde datasets zijn soms zelfs voor de onderzoeker moeilijk te interpreteren’

Hoe doet WUR het momenteel als het gaat om FAIR databeleid?

Theo Viets, onderwijs- en onderzoeksmedewerker Dierwetenschappen: “We zitten in het begin van een proces. Eerst moeten we de onderzoekers ervan overtuigen dat het vastleggen van data goed moet gebeuren. Ik weet uit ervaring dat slecht gedocumenteerde datasets voor anderen en soms zelfs voor de onderzoeker moeilijk te interpreteren zijn. Wat FAIR betreft hebben we de Findability en de Accessibility wel goed op orde. In de WUR Library is allerlei data te vinden én ook toegankelijk. Nu is de aandacht gericht op de Reusability waarbij eigenlijk meteen de Interoperability moet worden meegenomen. Dat is wel een uitdaging, omdat je niet kunt inschatten welke datasets in de toekomst nog wel leesbaar zijn.”

“We zitten in het begin van een proces. Eerst moeten we de onderzoekers ervan overtuigen dat het vastleggen van data goed moet gebeuren. Ik weet uit ervaring dat slecht gedocumenteerde datasets voor anderen en soms zelfs voor de onderzoeker moeilijk te interpreteren zijn.”

Theo Viets

Fotografie: Judith Jockel

F indability - vindbaar

A ccessibility - toegankelijk

I nteroperability - uitwisselbaar

R eusability – herbruikbaar

De FAIR-principes zijn richtlijnen voor het beschrijven, opslaan en publiceren van wetenschappelijke data. Het uiteindelijke doel is het publiceren van verifieerbare onderzoeksresultaten met herbruikbare data, zodat anderen de data kunnen vinden en hergebruiken.

Deel dit artikel