"We hebben in dit vakgebied te maken met enorme hoeveelheden data"
Grensverlegger in aardobservatie
Serkan Girgin (43) werd in mei van dit jaar uitgeroepen tot SURF Research Support Champion 2022. Hij bouwde aan de Universiteit Twente een data-analyseplatform dat onderzoekers eenvoudig toegang biedt tot compute resources en veel open-source geografische analysetools. "Rekenkracht zou een standaarddienst op de universiteit moeten zijn", betoogt hij.
Zonder vrienden en familie
Als opgroeiende tiener in Turkije was Serkan Girgin al bezig met techniek en programmeren. Op de middelbare school deed hij mee aan de nationale Olympische Spelen in Informatica, en later won hij een prijs voor jonge onderzoeker van het jaar. "Dat opende voor mij de deur naar een baan bij het nationale onderzoeksinstituut voor ruimtevaarttechnologie. Samen met mijn broer bediende ik een satellietgrondstation."
Nadat hij in 2008 promoveerde op milieutechniek en risicobeoordeling, ging hij naar Italië om acht jaar voor de Europese Commissie te werken. "Als expat is het soms moeilijk om zonder je vrienden en familie te leven. Mijn toenmalige vrouw was aangenomen bij de Universiteit Twente dus vandaar dat ik hier een functie heb gezocht. De situatie is ondertussen veranderd, maar ik ben gelukkig op de faculteit. Het is een heel internationale omgeving, en we werken aan het oplossen van wereldwijde vraagstukken."
Beeldverwerking van Griekenland tot Nairobi
Meer dan twintig collega's dienden een nominatieformulier in voor Girgin. Niet alleen omdat hij een platform heeft gebouwd waarmee onderzoekers enorme hoeveelheden gegevens kunnen analyseren die ze voorheen niet konden verwerken. Ze zeggen ook dat hij een "vriendelijk, behulpzaam en prettig persoon is om mee samen te werken".
Girgin kwam twee jaar geleden bij de faculteit Geo-Informatie Wetenschappen en Aardobservatie van de Universiteit Twente om een Center of Expertise in Big Geodata Science (CRIB) op te bouwen. Het CRIB biedt wetenschappelijk en technisch advies, maar ook infrastructuur voor cloud computing en big data-technologieën. Medewerkers en studenten gebruiken deze voor rekentaken met geospatiale en aardobservatiegegevens die niet op hun laptop of werkstation passen.
Denk bij dit soort onderzoek aan het verwerken van satellietbeelden voor het hele land Griekenland gedurende meerdere jaren. Het in kaart brengen van soorten huishoudens in sloppenwijken van Nairobi. De verspreiding van reptielensoorten in een bepaald land. Of het monitoren van droogte, het voorspellen van gewasopbrengsten en ziekten, of het onderzoeken van natuurrampen.
"Ik ben midden in de lockdown begonnen, dus ik heb maandenlang volledig virtueel gewerkt terwijl ik de behoeften van de onderzoekers hier leerde begrijpen. Aan deze faculteit hebben we te maken met veel data en we willen graag state-of-the-art methoden toepassen om problemen op te lossen. Maar er was geen gemeenschappelijke rekeninfrastructuur. Dus heb ik ons eigen compute-platform gebouwd." Dus heb ik ons eigen compute platform gebouwd."
Het Geospatial Computing Platform biedt een gebruikersvriendelijke interface voor data-analyse en visualisatie met honderden kant-en-klare softwarepakketten. Het is rechtstreeks toegankelijk via een webbrowser en vereist geen registratie of software-installatie. Het biedt parallelle, gedistribueerde en GPU-gebaseerde rekenmogelijkheden en dataopslag. Bovendien biedt het platform gedeelde workspaces die het mogelijk maken om samen te werken en gegevens te delen met meerdere gebruikers.
Het platform bedient nu meer dan 750 gebruikers, waaronder wetenschappelijk personeel, studenten, alumni en onderzoekspartners. Girgin beheert het en ondersteunt de gebruikers eigenhandig. Daarnaast doet hij als senior onderzoeker actief onderzoek naar geospatial computing infrastructuur en gedistribueerde ruimtelijke algoritmen. "Ja, dat is eigenlijk meer dan een fulltime baan", zegt hij lachend.
Leren overstappen van desktop naar cloud
Collega's die Girgin nomineerden als Research Support Champion noemden vaak hoe hij hielp hun horizon te verbreden. "Sommige onderzoekers hebben ervaring met cloud of high-performance computing, maar er is ook een grote groep die nog niet weet hoe ze van hun desktop naar de cloud moeten overstappen. De enige manier om het te leren is door het te proberen. Wij maken het eenvoudig voor hen: het platform is 24-7 beschikbaar en hoeft niet te worden opgezet. Onderzoekers hebben niet alleen een technologische oplossing nodig, ze willen ook ondersteuning. En snelle antwoorden. Vorig jaar heb ik meer dan 400 supportverzoeken afgehandeld."
Een andere manier om het de gebruikers makkelijker te maken, is dat CRIB geen proposals vereist. "We vragen mensen niet voor wat voor soort onderzoek ze het systeem gebruiken. De norm is momenteel dat je financiering moet aanvragen om toegang te krijgen tot compute resources. Ik denk dat dit moet veranderen. E-mail is een standaarddienst die iedereen aan een universiteit krijgt. Hetzelfde zou moeten gelden voor rekenkracht."
De volgende stap
Het veld van aardobservatie bevindt zich in een overgangsfase, zegt Girgin. "Het aantal satellieten en de resolutie van de beelden blijven toenemen. De hoeveelheid gegevens is enorm, en vaak open beschikbaar, bijvoorbeeld via het Copernicus-programma van de Europese Unie. De toegankelijkheid van de gegevens is voor veel toepassingen geen probleem meer. Maar om deze big data te verwerken, heb je meestal machine learning- of deep learning-methoden nodig, die zeer rekenintensief zijn. Daarom is het belangrijk om toegang te hebben tot stabiele en krachtige computing resources."
"En in plaats van datasets te downloaden, zoals gebruikelijk is, wordt tegenwoordig vaker gewerkt met datakubussen: je doet de analyse daar waar de data staan. Dat is veel efficiënter. De volgende stap die ik voor ogen heb, is dat de gebruiker het platform kan vragen om specifieke berekeningen op een eenduidige manier uit te voeren. Onderzoekers zouden niet allerlei tools en pakketten moeten gebruiken om eenvoudige analysetaken uit te voeren, of standaardalgoritmes steeds opnieuw moeten schrijven. Standaard interfaces voor het gebruik van geospatiale computerdiensten, die zijn geoptimaliseerd voor prestaties en energie-efficiëntie, kunnen hun werk aanzienlijk vergemakkelijken. Immers: zij zijn uitsluitend geïnteresseerd in de juiste resultaten."
Tekst: Josje Spinhoven
Foto's: Jelmer de Haas
SURF en aardobservatie
SURF levert reken- en datadiensten voor de Nederlandse aardobservatie-gemeenschap. Om het onderzoek naar een hoger niveau te tillen, willen we samenwerking op dit gebied stimuleren. We participeren daarom onder andere in het Europese project C-SCALE. Ook willen we onze reken- en data-infrastructuur en onze kennis waar mogelijk beter laten aansluiten bij de wensen van de community.