Tien jaar samenwerking rond onderzoekssoftware
Zonder software is academisch onderzoek in bijna elke discipline onmogelijk. Maar niet alle onderzoeksinstellingen hebben de expertise in huis om specifieke onderzoekssoftware te ontwikkelen. Daarom richtten NWO en SURF tien jaar geleden het Netherlands eScience Center op. Raúl Zurita Milla (Universiteit Twente) pionierde met big data dankzij het Center.
"Nu de herfst nadert, verliezen planten hun bladeren. In de lente zien we ze weer bloeien. Het bestuderen van deze cyclische biologische gebeurtenissen heet fenologie. De timing van deze verschijnselen verschilt van plaats tot plaats en van jaar tot jaar, afhankelijk van de omgevingsfactoren", vertelt Raúl Zurita Milla, hoogleraar spatio-temporele analyse aan de Universiteit Twente.
"Ik bestudeer veranderingen in wat we de 'groene golf' noemen: de overgang van de winter, wanneer alles slaapt, naar de lente, wanneer alles weer tot leven komt. We maken kaarten waarop deze groene golf van zuid naar noord te zien is. In Nederland komt de lente later dan in Zuid-Spanje, waar ik vandaan kom, en in Noorwegen komt hij nog later."
“We kunnen de kans op tekenbeten en pollen voorspellen”
De modellen voor de groene golf zijn gebaseerd op fenologische waarnemingen van vrijwilligers, zegt Zurita Milla. "Je brengt je kinderen naar school, en je merkt op: hé, deze boom had vorige week nog geen bladeren en vandaag wel. Je kunt dit melden aan een fenologisch netwerk. Deze netwerken helpen om miljoenen waarnemingen te verzamelen."
Ramp
Zurita Milla en zijn team combineren deze informatie met omgevingsdata zoals temperatuur en daglengte om de komst van het voorjaar in kaart te brengen. "Door te zien hoe de groene golf in de loop van de tijd verandert, krijgen we inzicht in het effect van klimaatverandering. Het heeft ook een praktische, agrarische toepassing: boeren moeten misschien op andere tijdstippen planten of andere rassen gebruiken. En je kan je voorstellen dat het een ramp zou zijn als de bloei en de bestuivende insecten in de tijd niet op elkaar aansluiten, of de komst van de lente en de laatste vorst. Er zijn ook gezondheidsaspecten. Teken hebben een fenologie, en mensen gaan in bepaalde seizoenen de natuur in. Fenologisch onderzoek kan dus helpen voorspellen wanneer er meer kans op tekenbeten is. Momenteel werken we ook aan het modelleren van pollen. Zodat patiënten met hooikoorts op tijd hun medicijnen kunnen innemen of gebieden met veel pollen kunnen vermijden."
Omdat hij grootschalig fenologisch onderzoek wilde doen voor heel Europa en het Amerikaanse continent, benaderde Zurita Milla een paar jaar geleden het eScience Center. "Het ging om véél data. Onze modellen waren bovendien relatief traag en we wilden ze versnellen door ze op gedistribueerde systemen te laten draaien."
Van elkaar leren
De technologie waarmee de onderzoeker werkt is in de loop der tijd enorm veranderd. "Toen ik studeerde hadden we een desktopapplicatie, kregen we te horen op welke knoppen we moesten drukken en werden alle gegevens lokaal geanalyseerd. Tijdens mijn promotietijd ben ik aan het programmeren geslagen om mijn data-analyse te automatiseren. Nu moet ik overstappen op big data-programmeerframeworks, omdat de data domweg niet in mijn computer passen. Onderzoekers moeten geen data meer downloaden, maar hun code verplaatsen naar de cloud, waar alle data beschikbaar zijn. Dankzij de samenwerking met het eScience Center was ik op mijn faculteit een beetje een pionier met deze manier van werken. Vlak voor de covid-19-pandemie zijn we ons eigen big data center begonnen, omdat we beseften dat we moesten investeren in deze technologieën en instrumenten."
Kant-en-klare tools voor Aardobservatie
Zurita Milla, het eScience Center en SURF werkten enkele jaren samen in een zogeheten alliantieproject, waarbij alle partijen van elkaar leren. "Zij wilden meer weten over geospatiale data, en wij wilden kennis opdoen over big data-oplossingen. We hebben de algoritmes uit en te na besproken met research software engineers van het eScience Center, en SURF leverde de rekeninfrastructuur." Met de inzichten uit dit project en soortgelijke projecten hebben het eScience Center en SURF nu kant-en-klare tools, infrastructuur en opslag voor aardobservatiegegevens ontwikkeld. "Voor de geospatiale onderzoekscommunity heeft dit de toegangsdrempel tot big data verlaagd."
Opgericht om zichzelf overbodig te maken
“Een expertisecentrum voor onderzoeks-software als nationale organisatie is uniek in de wereld. Daar wordt door anderen jaloers naar gekeken”, zegt Joris van Eijnatten, sinds 2020 directeur van het Netherlands eScience Center. Bij het Center werken gepromoveerde wetenschappers met digitale expertise, die onderzoekers helpen bij het ontwikkelen van onderzoeks-software.
Ooit begon het eScience Center met zo’n tien mensen, inmiddels zijn het er honderd. De organisatie is daarom recent verhuisd naar een groter pand op het Amsterdam Science Park. Met SURF werkt het Center vooral samen rond het gebruik van de reken- en data-infrastructuur van SURF. “Daarnaast geven we gezamenlijke trainingen en wisselen we ideeën met elkaar uit op het gebied van innovatie en open science”, aldus Van Eijnatten.
Digitale vaardigheden
“Naast de samenwerkingsprojecten die we doen met instellingen, willen we de komende jaren ons trainingsaanbod uitbreiden. Denk aan deep learning, parallel programmeren en online samenwerken. Zodat deze expertise ook landt binnen de instellingen en bij onderzoekers.” Het eScience Center was bij de oprichting al bedoeld als tijdelijk orgaan. “We hebben geen termijn, maar het is denkbaar dat onze missie op een gegeven moment is volbracht.”
Het type onderzoeker dat aanklopt bij het Center was in de beginperiode vooral de bèta, die al overtuigd was van het nut van digitale onderzoeksmethoden en zelf kon coderen. “Tegenwoordig verschuift het accent naar de sociale en geesteswetenschappen. Dat is een heel andere doelgroep. Het betekent dat we op verschillende niveaus moeten werken en ons taalgebruik laagdrempeliger moeten maken. We bieden wel een bepaald geavanceerd niveau; we geven geen cursussen programmeren. Maar dat doen universiteiten nu wel.”
Nieuwe technologieën onderzoeken
“Onderzoeksinstellingen investeren nu meer in digitale kennis, bijvoorbeeld door datastewards aan te stellen. De volgende stap is dat ze moeten gaan investeren in research software engineers. Het is een proces; we zijn er nog lang niet. Jonge onderzoekers hebben meer digitale vaardigheden, maar informatica zou eigenlijk onderdeel moeten zijn van elke universitaire studie. Tegelijkertijd verandert de technologie voortdurend. Dat kunnen de universiteiten zelf niet allemaal volgen. Wij onderzoeken nieuwe dingen, zoals artificial intelligence, machine learning, quantumtechnologie en digital twins. Voorlopig is er dus nog genoeg te doen voor ons.”
Meer informatie over het eScience Center vind je op www.esciencecenter.nl.
Meer samenwerkingsprojecten van SURF en het Netherlands eScience Center:
Nieuwe technologie versterkt juridisch onderzoek
Hoogleraar Privaatrecht Gijs van Dijck ontwikkelde een technologie voor het doorzoeken, analyseren en visualiseren van rechterlijke uitspraken. Hierdoor kunnen rechtswetenschappers snel een groot aantal zaken analyseren. Hij deed dit samen met het Netherlands eScience Center en SURF. De technologie en broncode zijn beschikbaar.
Veranderingen in het heelal in real-time meten
De LOFAR-radiotelescoop maakt het mogelijk om veranderingen in het heelal snel te meten, maar dit kan tot nu toe niet in real time. Daardoor lopen we veel informatie mis. In het PADRE-project brengen we hier verandering in, door de verwerking van signalen te versnellen met GPU-kaarten.
De explosieve groei van genetische data bijbenen
Het verkrijgen van data wordt steeds goedkoper, waardoor datasets explosief groeien. Om te zorgen dat plantgenoom-analyses ook met grote datasets mogelijk blijven, werkt SURF samen met de WUR en eScience Center aan een schaalbare oplossing voor de bioinformatica-applicatie PanTools.
Hoe redeneren deep neural networks?
SURF en het Netherlands eScience Center bundelen hun krachten om DIANNA te ontwikkelen: een gestandaardiseerd open source systeem dat zal 'uitleggen' hoe Deep Neural Networks redeneren.
Het kankergenoom Googlen
Dankzij nieuwe technologieën maakt genoomsequencing nu standaard deel uit van kankerdiagnostiek. Het maakt op individuele patiënten toegesneden behandeling mogelijk. Ondanks de massale productie van genoomdata blijft de systematische en uitgebreide analyse van deze data achter vanwege computationele en algoritmische beperkingen. Wij werken daarom aan nieuwe analytische en computationele modellen.
Praktische skills voor onderzoekers
SURF en het eScience Center organiseren regelmatig gezamenlijk trainingen, bijvoorbeeld op het gebied van basis-programmeervaardigheden in combinatie met het gebruik van SURF-diensten.
Lees ook
De SURF Story over Serkan Girgin van het Center of Expertise in Big Geodata Science van de Universiteit Twente: Grensverlegger in Aardobservatie
Tekst: Josje Spinhoven