Bob Planqué wijst naar zijn oor om aan te geven dat hij luistert naar vogelgeluiden, op de achtergrond een boom
Story

Hoe vrijwilligerswerk vleugels kreeg: xeno-canto en de kracht van open data

Een website met opnames van natuurgeluiden, xeno-canto, was een van de drie winnaars van de Dutch Data Prize 2024. Initiatiefnemer Bob Planqué vertelt hoe hij en zijn kompaan Willem-Pier Vellinga de website tot een boegbeeld van FAIRness maakten. “We zijn uitgegroeid tot een soort hofleverancier van opnames met uitgebreide metadata."

De winnende onderzoekdatasets onderscheiden zich op het gebied van vindbaarheid, toegankelijkheid, interoperabiliteit en herbruikbaarheid (FAIR). Nadat xeno-canto de Dutch Data Prize in de categorie Levenswetenschappen en Gezondheid had ontvangen, stroomden uit heel de wereld de felicitaties binnen. “Dat was leuk”, zegt Planqué. “Op zo’n moment zie je hoe groot het veld is dat we met onze site bedienen.” Dit succes is het resultaat van tientallen jaren werk. In tegenstelling tot de meeste kandidaten bij de Dutch Data Prize die hoogstens een paar jaar in de lucht zijn, bestaat xeno-canto al sinds 2005.  

Schoenendozen met cassettebandjes 

Het was – en is – voornamelijk vrijwilligerswerk. Planqué en zijn kompaan Willem-Pier Vellinga werkten als wetenschappers in de harde bètahoek, maar in hun vrije tijd bestudeerden ze vogelgeluiden. “In die tijd kocht je nog cd’s, soms dvd’s, met vogelopnames. Veel mensen hadden ook een schoenendoos met zelf opgenomen cassettebandjes. Het probleem was: hoe meer opnames je verzamelde, hoe minder je eraan had. Want zeker in de tropen heb je te maken met honderden soorten. Ga je dan al die opnames één voor één afluisteren om te weten welke vogel je hoort?” 

“Bij Google Scholar komt de naam xeno-canto voor in 5.000 papers”

“In die tijd verscheen er een revolutionair product van een andere Nederlander, de inmiddels overleden Sjoerd Mayer. Die programmeerde software waarmee je die geluiden als het ware kon uitvouwen: je kon er doorheen scrollen en geluiden vergelijken. Maar dat werkte slechts met beperkte collecties op dvd.”  

Kritische massa 

“Ik had een beetje leren programmeren. We dachten: we maken gewoon iets voor het web. Dan zetten we daar onze eigen opnames op en sturen een mailtje rond naar andere vogelaars: wie doet er mee?” 

Bob Planqué in zijn werkkamer, je ziet boeken en schoolborden met wiskundige formules

"Opnames die op onze site staan, worden altijd vrijelijk gedeeld met anderen"

Die opzet bleek onverwacht succesvol. “Al vrij snel bleken Mayer en twee van zijn medewerkers bereid om hun collecties toe te voegen. Daarmee hadden we voor Zuid-Amerika meteen 40 procent van de vierduizend soorten! Dus we waren meteen relevant. En alles was gratis beschikbaar voor iedereen met internet.” Xeno-canto had zijn kritische massa bereikt. “Mensen dachten: ik kan nu eindelijk wat doen met die oude schoenendoos vol bandjes. Zo is dat balletje gaan rollen.”  

Rijtje principes 

Een paar jaar later werd het open karakter van xeno-canto formeel vastgelegd. “Voor een conferentie in Brazilië werd ik uitgenodigd om wat te vertellen over het project. Toen dacht ik: misschien is het aardig om een rijtje principes op te stellen. Waar staan we eigenlijk voor? Eén van die principes is dat we licenties van Creative Commons gebruiken. Opnames die bij ons staan worden altijd vrijelijk gedeeld met anderen. Dat is dus wat we tegenwoordig FAIR noemen.” 

“Xeno-canto is een digitaal project dat minder hard groeit dan het internet”

“Een ander principe: er is geen autoriteit. Iedereen mag altijd meediscussiëren over opnames, ook wie zelf geen opnames levert. Je moet wel lid zijn, want we willen weten wie je bent. Maar alles mag altijd in twijfel worden getrokken. En zolang er discussie is over de identificatie van een vogelsoort, wordt de desbetreffende opname apart gezet.” 

Mensen met weinig ego 

Het lidmaatschap van xeno-canto is kosteloos. Dit betekent dat ook vogelkenners uit minder rijke landen kunnen meedoen. Daar is Planqué het meest trots op: “Die mensen kunnen bij ons hun opnames plaatsen en meepraten. Zo kunnen ze internationaal naam maken als expert op het gebied van hun eigen fauna.” 

Handen houden een telefoon vast waarop de xeno-canto app is te zien

Xeno-canto wordt intensief gebruikt

Deze opzet van xeno-canto heeft een heel egalitaire sfeer gecreëerd, zegt Planqué. “Er zijn geen validators die het laatste woord hebben over identificaties. De leden zijn mensen met relatief weinig ego, want ze weten dat hun autoriteit misschien op de proef gesteld wordt. Feitelijk functioneert ons forum als peer review, waarbij alle leden peers zijn. Natuurlijk zullen er soms fouten optreden, maar we weten dat de foutmarge bij ons niet anders is dan elders.”  

Stelselmatig leegroven 

Twintig jaar van gelijkheid en openheid heeft veel opgeleverd. Xeno-canto wordt intensief gebruikt, niet alleen door geïnteresseerden, maar ook voor wetenschappelijk onderzoek. “Bij Google Scholar komt de naam xeno-canto voor in 5.000 papers”, verklaart Planqué tevreden. 

Een recente, snel groeiende toepassing is machine-learning: met de opnames van xeno-canto leren algoritmes om vogels automatisch te herkennen. “Op het gebied van natuurgeluiden zijn wij uitgegroeid tot een soort hofleverancier van opnames met uitgebreide metadata. Daarom komen veel groepen in de wereld bij ons langs.” 

“Als we bewegend beeld hadden verzameld in plaats van geluid, bestonden we nu niet meer”

Xeno-canto was dus al klaar voor de toekomst? “In feite wel. Onze site is al heel lang met software te benaderen, via een API die we aanbieden. Je kunt de site dus stelselmatig leegroven; dat staan wij gewoon toe. Ons doel is nu eenmaal het werk van anderen te faciliteren. Hoe beter wij dat kunnen, hoe beter wij het doen.” De aldus getrainde algoritmes zijn onder meer terug te vinden in apps voor de mobiele telefoon, zoals BirdNet. Daarmee zie je wat je hoort als je door het bos wandelt of gewoon op je balkon staat.  

Verkeerde zuinigheid 

Zijn er dingen waar Planqué zich zorgen over maakt? “Ja! In de wetenschap is het bijna onmogelijk om geld te krijgen voor het onderhoud van collecties als xeno-canto. Dat is een wereldwijd probleem. Als je een goed idee hebt voor een collectie, lukt het meestal wel om die van de grond te krijgen. Maar daarna beginnen de problemen. Men realiseert zich ook domweg niet dat collecties vaak onvervangbaar zijn. Ze vertegenwoordigen een enorm kapitaal en dat kan zomaar weg zijn.” 

Bob Planqué in zijn werkkamer, schoolbord met wiskundige formules

"Met machine-learning hopen we de komende jaren nog veel dieper in de data te kunnen duiken"

Dat xeno-canto al bijna twintig jaar bestaat is deels te danken aan de steun van Naturalis, dat de hosting en het onderhoud betaalt. Al heeft die instelling in haar eigen collectiebeheer ook last van verkeerde zuinigheid bij financiers.  

Mazzel gehad 

De tweede verklaring voor het overleven van xeno-canto is technologisch: “Wij bestaan al zo lang omdat we zo weinig kosten. Xeno-canto is een digitaal project dat minder hard groeit dan het internet. Tegen de tijd dat we bijvoorbeeld meer opslag nodig hebben, is die opslag navenant goedkoper geworden. Er zijn maar weinig projecten die op deze manier gerund kunnen worden, dus we hebben mazzel gehad. Als we bewegend beeld hadden verzameld in plaats van geluid, bestonden we nu niet meer.”  

“Als je genomineerd wordt voor de Dutch Data Prize, sta je sterker bij financiers”

Mede hierom raadt Planqué iedereen met een datacollectie dringend aan om mee te doen aan de Dutch Data Prize. “Als je genomineerd wordt sta je sterker. De mensen die over het geld gaan, zullen zich eerder realiseren dat je werk belangrijk is.” 

Prijzengeld 

Natuurlijk is het ook leuk om het prijzengeld mee naar huis te kunnen nemen. Wat gaat xeno-canto doen met die € 3.500? Planqué: “In principe is het geld bedoeld om de collectie FAIR te maken, maar xeno-canto is al maximaal open. We hebben echter ook plannen waarvoor we samenwerken met partners in het buitenland. Veel overleg kan via Zoom, maar af en toe moet je mensen toch in levenden lijve spreken. Die reizen kunnen we met het prijzengeld nu gemakkelijker betalen.” 

Wat houden die plannen eigenlijk in? “Machine-learning! Samen met de mensen van Naturalis zijn we een eigen algoritme aan het trainen. Daarmee hopen we de komende jaren veel dieper in de data te kunnen duiken. Welke geluiden lijken veel op elkaar en welke juist niet? Wat voor zangtypes kun je onderscheiden en wat voor geografische variatie zit er in de vogelzang? Zo kan xeno-canto een enorme boost geven aan dit gebied van de wetenschap.” 

Tekst: Aad van de Wijngaart 
Foto’s: Vera Duivenvoorden 

Bob Planqué (1977) 

2000 - 2004: PhD bij Centrum Wiskunde & Informatica 
2005 - 2006: research associate bij University of Bristol 
2006 - heden: achtereenvolgens docent en hoofddocent bij Vrije Universiteit (afdeling Wiskunde) 
2023 - heden: lid van Amsterdam Center for Dynamics and Computation 
2005 - heden: xeno-canto 

Gerelateerde onderwerpen: