MozFest: eerlijke regels voor data commons

Wat zouden de regels kunnen en moeten zijn voor het delen van sensordata, medische data en persoonsgegevens? De vragen van AMdEX tijdens MozFest 2022 zorgden voor levendige discussies. De antwoorden waren niet zo talrijk, maar daar gaat het ook niet om op dit festival voor en door de open internetbeweging.

De online AMdEX-sessie richtte zich op drie usecases die zich bezighouden met verschillende aspecten van het delen van data en het beheer en de governance van data. Alle vragen tijdens de sessie kwamen voort uit het geweldige werk van Elinor Ostrom over data commons. Ze wijdde haar onderzoek aan het collectieve beheer van schaarse hulpbronnen en hoe deze toe te passen, zodat wij (in plaats van big tech) controle houden over onze data.

“Data brengen heel interessante juridische, sociale, technische en filosofische vragen mee”, zegt Robert Goené, Lead bij het Future Internet Lab van Waag. Er zijn meer vragen dan antwoorden, waardoor dit “zo’n opwindend veld is om in te werken”. Gemakkelijk is het niet: verschillende soorten data vereisen verschillende benaderingen. Er is niet één data commons-oplossing voor alles. “Data commons zijn per definitie pluralistisch van aard en de gemeenschap bepaalt de regels.” Thomas van Binsbergen, onderzoeker softwaretalen bij AMdEX-partner Universiteit van Amsterdam, voegt toe: “Transparante regels, die menselijk ingrijpen in geval van conflict mogelijk maken.”

Case 1: Marineterrein

Hayo Schreijer, directeur van deXes en AMdEX-partner, omschrijft het Marineterrein in Amsterdam als een gebied met een scala aan sensoren en camera’s. Deze verzamelen een veelheid aan gegevens, met gevoeligheidsniveaus variërend van openbaar tot persoonlijk. “Die data zijn interessant voor studenten, journalisten, onderzoekers en de gemeente”, zegt Schreijer. “Maar het delen van data vereist een zekere mate van vertrouwen. Hoe weten we dat een geïnteresseerde gebruiker op een verantwoorde manier met de gegevens omgaat?”

De data van het Marineterrein leverden een interessante usecase op voor AMdEX, die ook tijdens een eerder evenement aan bod kwam. Om ervoor te zorgen dat het Marineterrein de controle houdt over hun data, heeft het AMdEX-team een ​​extra laag in de deelcyclus tussen data-eigenaren en datagebruikers opgezet. Alle partijen moeten akkoord gaan met een reeks regels voordat ze een transactie kunnen starten. Pas als de gebruiker de voorwaarden accepteert, heeft hij toegang tot de gegevens. In sommige gevallen kan een gebruiker bijvoorbeeld geaggregeerde gegevens ‘bestellen’ bij een data-eigenaar met behulp van micropayments – het betalen van een miniem bedrag. Bijkomende regels zijn dat de gebruiker bekend is en werkt op het Marineterrein.

“Dataspace, data union, data commons. Hebben we wel een gedeelde taal?”

Voor het delen van data zijn er nog legio uitdagingen. De data vaak nog niet klaar om gedeeld te worden, de kwaliteit moet verder verbeterd worden, evenals de metadata en datastructuur. De verschillende gevoeligheidsniveaus van de data (high trust, low trust) kunnen worden aangepakt met verschillende voorwaarden, waarvoor templates beschikbaar zijn (bijvoorbeeld via de Data Sharing Coalition). Deze voorwaarden moeten ‘leesbaar’ worden gemaakt en te handhaven zijn door computers.

Stefano, een van de aanwezigen bij de sessie, vraagt wie de eigenaar is van de data. Hij stelt dat het Marineterrein de datagebruikers zijn, niet de eigenaren. Zou de Algemene Verordening Gegevensbescherming (AVG) dat netelige probleem kunnen oplossen? Er volgt een korte discussie, waaruit duidelijk wordt dat de AVG niet spreekt over eigendom, maar over betrokkenen en verwerkingsrechten.

Deelnemer Mike was benieuwd naar de taal die gebruikt wordt om de data commons te beschrijven. “Dataspace, data union, data commons. Hebben we wel een gedeelde taal?” Nee, die hebben we niet. Schreijer: “Focus op het werk nu. De taal zoeken we wel uit als het juridisch noodzakelijk wordt.”

Case 2: BioCommons

In 2003 werd het menselijk genoom met succes in kaart gebracht en werd DNA-sequencing een miljoenenbusiness. Burgers leverden enthousiast hun DNA in voor stamboomonderzoek en genetische scans. Quirine van Eeden, conceptontwikkelaar bij Waag, betoogde in haar presentatie dat waardevolle inzichten uit dergelijke scans niet in handen van enkelen mogen liggen. “Deze data moeten worden gezien als commons. Ze moeten worden gedeeld met universiteiten, zorginstellingen en enkele commerciële partijen. We willen gaan nadenken over hoe we genetische data goed kunnen organiseren. Individuen konden bijvoorbeeld alleen relevante delen van hun DNA-sequentie delen. DNA bevat ook informatie over familieleden. Hoe organiseer je individuele en collectieve geïnformeerde toestemming? Hoe kunnen we het risico inschatten van het delen van deze data? Moeten we het organiseren van die toestemming uitbesteden aan partijen die dat risico kunnen inschatten?

BioCommons, een project van Waag, toont de diversiteit aan vragen in data commons en de grenzen van de AVG. Sessiedeelnemer Thomas: “De uitdaging is hoe je communiceert op de manier waarop de regels tot stand komen en transparant worden gemaakt. Wat zijn de regels voor de regels?” AMdEX-onderzoeker Van Binsbergen antwoordt dat het onderliggende systeem aanpasbaar moet zijn, omdat beslissingen in dit nieuwe domein continu moeten worden herzien. Er volgt discussie over wie de regels voor BioCommons zou moeten bepalen: collectieven? Individuen? Personen met of zonder de familieleden? En hoe de noodzakelijke transparantie voor toestemming te garanderen? Dit hele onderwerp sprak duidelijk sterk tot de verbeelding en wordt in een aparte sessie besproken.

Case 3: Sociale huisvesting en energierekeningen

Spreker Tom Griffioen is mede-oprichter van Clappform. Dit data-analyseplatform werkt samen met lokale en regionale overheid en met sociale woningbouwcorporaties. Het bedrijf werd gevraagd om te voorspellen welke van de 20.000 huishoudens in een bepaalde regio de hoogste energierekening zouden hebben, zodat ze een huurverlaging konden krijgen. De databeperkingen waren in dit geval streng: gegevens over energieverbruik waren niet beschikbaar op huisniveau, noch waren er data over de huidige financiële situatie van de huurders. De uitdaging was om gevoelige data op een eerlijke en betrouwbare manier te delen. Daartoe onderzoekt Clappform het gebruik van synthetische data. Er was enige verwarring onder het publiek over waarom de vraag in de eerste plaats op deze manier moest worden beantwoord. Huurders weten hoe hoog hun energierekening is en kunnen zelf huurverlaging aanvragen. Sommigen stelden voor om de eigenaren van de gegevens (de huurders) om hulp te vragen, omdat een eventuele huurverlaging hen ten goede zou komen.

Tekst: Karina Meerman

#slimgroengezond

Wil je meer van dit soort artikelen lezen? Volg ons dagelijks op LinkedIn, Twitter en schrijf je in voor onze Board Update.