7 vragen aan Jacquelijn Ringersma

‘Wat écht helpt? Een keer je data kwijtraken’

Fotografie: Judith Jockel

Jacquelijn Ringersma (58) is coördinator Data Management bij WUR. Een gesprek over nut en noodzaak van goed datamanagement. “Zonder een beetje dwang bereik je je doel niet.”

Hoe Serious ben jij about Data?

“Ik ben geen onderzoeker, dus ik genereer zelf geen onderzoeksdata. Maar ik ben in het verleden wel onderzoeker geweest. Vaak deed ik onderzoek in landen ver weg, zoals Mali, Turkmenistan, Burkina Faso. Er werd behoorlijk geïnvesteerd in het verzamelen van gegevens. Nu liggen deze te verteren op oude floppy disks of diskettes in formats die niemand meer kan lezen. Dat vind ik persoonlijk erg jammer. Met de data die ik toen verzamelde zouden nu inzichten over bijvoorbeeld klimaatverandering beter onderbouwd kunnen worden.

Jij bent de datacoördinator van WUR. In hoeverre is datamanagement voor jouw vakgebied van belang?

“Mijn baan gaat over het maken van databeleid voor WUR, en ook over het ondersteunen van onderzoekers over hoe ze meer uit hun data kunnen (laten) halen.”

“Mijn drijfveer om voor het onderwerp databeheer te gaan, is ten eerste: als de belastingbetaler betaalt voor het verzamelen van data lijkt het me logisch dat deze er iets voor terugkrijgt. Ten tweede heeft de universiteit baat bij goed databeheer in verband met continuïteit van onderzoek, maar ook in verband met integriteit en verifieerbaarheid. Ten derde krijg je als onderzoeker meer impact als je met je publicatie ook je data publiceert.”

‘De universiteit heeft baat bij goed databeheer voor de continuïteit van onderzoek’

Naam

Jacquelijn Ringersma

Carrière

Werkte van 1992 tot 2000 bij de leerstoelgroepen Irrigatie en Bodem- en Waterconservering

Datamanagement

Sinds 2005, eerst bij een Max Planck Instituut en vanaf 2010 bij WUR

Wat is volgens jou de belangrijkste verdienste van data voor de wetenschap?

“Zonder data is er op dit moment helemaal geen wetenschap. Data ondersteunen bijna elke wetenschappelijke vinding. Uiteraard is er ook onderzoek dat niet op data gebaseerd is, maar bij WUR is dat niet zo veel. In het vakgebied bedoelen we met data vaak digitale data. Bij de chemische leerstoelen en groepen van Agrotechnology and Food Science Group is er ook sprake van fysieke data, zoals producten die chemische processen ingaan. Daar hebben we nog niet zulke goede oplossingen voor.”

Waar loop jij tegenaan bij het ontwikkelen of invoeren van richtlijnen voor datagebruik, en wat loopt juist soepel?

“Er is bij WUR vrij gemakkelijk databeleid gekomen omdat het initiatief werd gedragen door de Graduate Schools en de Dean of Research, Wouter Hendriks. Hij staat erop dat we dit beleid verder ontwikkelen en uitdragen. Het is fijn dat het Wageningen Data Competence Center er is, en dat we voor datamanagement zo’n mooi samenwerkingsverband hebben met de Library, IT en Legal. Ook de ontwikkelingen met betrekking tot het Data Stewardship programma zijn een mooi resultaat en een voorbeeld dat het management van de organisatie vooruit wil.”

“Het is echter nog steeds moeilijk om de boodschap bij onderzoekers zó over te brengen, dat zij ook enthousiast worden of de incentive voelen om daadwerkelijk aan goed datamanagement te doen. Ik snap dat wel, want iedereen heeft het altijd druk met van alles en datamanagement wordt als extra last gezien. Bovendien lijkt het vaak zo dat degene die het meeste lol heeft van datamanagement degene is die na jou komt, en niet jijzelf.

‘Engagement van onderzoekers is het meest urgente issue in goed databeheer’

“Ik schat dat in zeker 50 procent van de onderzoeken de onderzoeker zijn of haar data goed op orde heeft. Nog altijd is de incentive om aan goed databeheer te doen, gering. Eigenlijk is het vooral belangrijk voor de organisatie, maar de wetenschapper zelf krijgt er geen extra credits door. Soms denk ik dat het een keer gruwelijk mis moet gaan om dingen te laten veranderen. Dat er überhaupt serieus werk is gemaakt van datamanagement is een rechtstreeks gevolg van de affaire rond Diederik Stapel in 2011, de voormalig hoogleraar psychologie aan Tilburg University die bekend werd als wetenschapsfraudeur. Hij had natuurlijk data verzonnen, dat kan in principe nog steeds, maar de kans dat je betrapt wordt is tegenwoordig wel wat groter.”

“Ik vind dat je onderzoekers mag bestraffen als ze hun datamanagement niet op orde hebben. Dat ze bijvoorbeeld niet mogen promoveren. Zonder een beetje dwang bereik je je doel niet. Al ben ik persoonlijk meer voor belonen. Ik hoop dat steeds meer onderzoekers het belang gaan inzien van goed databeheer. Wat daarbij helpt is dat databeheer onderdeel wordt van de evaluatie van het onderzoek. Dat zal het gedrag van onderzoeker vast veranderen. Wat echt helpt, hoe pijnlijk en lullig ook, is als een onderzoeker zijn of haar data kwijtraakt om welke reden dan ook. Hoe erg ook, voor het grote geheel is het uiteindelijk goed. Een beter bewijs dat het beleid rond datamanagement er niet voor niets is, krijg je niet.”

‘Het lijkt dat degene die het meeste lol heeft van datamanagement degene is die na jou komt, en niet jijzelf’

Wat is voor jou het belangrijkste data-boek van het moment en waarom?

“Ik haal mijn kennis over datamanagement vooral van congressen en netwerken. Boeken die meer de filosofische kant van data en Artificial Intelligence toelichten vind ik interessant. Gouwe ouwe is Gödel, Escher en Bach van Douglas Hofstadter, dat gaat over hoe je uit een algoritme - toch een regeltje tekst dat je in de computer zet - schijnbaar een zelfdenkend en sturend object kan maken. Het boek is meen ik uit begin jaren tachtig, maar nog steeds geweldig. Meer recent is de roman van Maxim Februari, Klont, dat gaat over een wetenschapper die beweert dat er een klont data in het net een eigen leven heeft gekregen.

Artificial Intelligence gaat erom dat we de computer zo kunnen bouwen dat-ie gaat denken als een mens. Dat fascineert me al lang, dat we uit iets doods iets levends kunnen maken. Ik heb kunstmatige intelligentie gestudeerd toen ik veertig werd.”

Vind je dat bedrijven als Facebook en Google aan banden moeten worden gelegd?

“Tja, daar gaat in ieder geval mijn werk niet over. De vraag wordt me wel vaak gesteld. Mensen moeten zelf maar besluiten of ze hun gegevens willen afstaan aan deze giganten. Gmail, Facebook, Instagram, WhatsApp: je levert je totaal uit, maar krijgt er leuke dingen voor terug. De macht van de datagiganten wordt wel steeds groter, ik denk dat dat een probleem is.”

Wat zijn volgens jou de belangrijkste ontwikkelingen op het gebied van Using Data?

“Interoperabiliteit - ofwel het uitwisselen van data - is in het vakgebied van datamanagement en data science het belangrijkste nog op te lossen technische issue. Engagement van onderzoekers is het meest urgente issue in goed databeheer.”

Deel dit artikel