dinsdag 7 april 2015

Zachte cijfers in het trendrapport open data

Op 31 maart jl. verscheen het tweede trendrapport open data. Een vlot leesbaar verhaal met daarin de stand van het land met betrekking tot diverse aspecten van open data.
Daarbij wordt zowel de landelijke Nederlandse trend als de verhouding tot de ontwikkelingen in andere landen, waarbij met name de UK en de USA als vergelijkingsmateriaal dienen. Om met dat laatste te beginnen; dat gaat mij iets te snel in de richting van benchmarking, oftewel: lijstjes. We "scoren" beter of slechter dan andere landen. Daarbij leunt het rapport op diverse benchmarks, en daar komt de achilleshiel al naar voren. Volgens de open data barometer zijn we gestegen van plaats 10 (in 2013) naar plaats 6 (in 2014), terwijl we volgens de eveneens aangehaalde open data census gekelderd zijn van plaats 5 naar plaats 16. Als de barometers zó uiteen lopen moet er wel onweer op komst zijn...

Het trendrapport signaleert zelf ook deze beperking en schrijft op bladzijde 30: "We moeten dan ook voorzichtig zijn met de uitkomsten van dergelijke barometers. Daarom kijken we hieronder naast de scores op de Open Data Barometer ook naar het aanbod van open data op data.overheid.nl." Op dat open data portaal telde het trendrapport in februari 2015 bijna 3200 datasets. Blijkbaar is er sindsdien een lijntje gelegd naar het dataportaal van statistiekgrootgrutter CBS, want op 7 april 2015 staat de data.overheid.nl-teller al op 6731. Zo snel kan het blijkbaar gaan.
Verwarrend is wel dat volgens de voorpagina van het portaal van die ruim 6700 datasets er slechts 2989 een open data licentie hebben, een kleine meerderheid heeft daarentegen een "andere licentie". Iets verder speuren in het portaal zelf levert op dat zo'n 3000 datasets in het Publieke Domein zitten (en er dus geen auteursrecht meer van toepassing is) c.q. van een CC-0 verklaring is voorzien (en er op die datasets dus geen actief auteursrecht wordt uitgevoerd). De overige pakweg 3700 hebben op een enkele uitzondering na een CC-BY-licensie, waarbij dus de naamsvermelding van de bronhouder als restrictie geldt. Ik neem aan dat dat in het verband van het trendrapport ook onder open data wordt geschaard, al wordt dat niet expliciet gemaakt.

Hetzelfde data.overheid.nl bevat ook een overzicht van weliswaar bekende, maar niet rechtstreeks aan data.overheid.nl gekoppelde open data portalen. Daar staat een hele trits lokale, regionale en thematische portalen, waarbij alleen dat van de gemeente Den Haag al meer dan 8.000 dataset bevat.
Maar dan hebben we dus geen 3200 open datasets in Nederland, maar minstens het vijfvoudige daarvan!

Zo wordt steeds meer duidelijk dat het voor een heldere monitor ontbreekt aan een eenduidige, stabiele meetlat voor de beschikbaarheid van open data. De aantallen dataset worden bovendien nog enorm beïnvloed door de wijze waarop de data is georganiseerd: de Top10NL als landsdekkende dataset telt voor één, terwijl een uitsplitsing naar de aloude bladindeling die de Topografische Dienst hanteerde zou honderden datasets opleveren ,en als je dat allemaal nog eens uitsplitst naar thema's in die datasets kun je die ene top10nl "opvoeren" tot een reeks van duizenden datasets. Dat telt lekker aan!

Misschien moeten wel geen datasets meer tellen, maar moeten er bij wijze van meetlat pakweg 20-30 maatschappelijke vragen en commerciële toepassingen worden geformuleerd waarvoor een of meer open datasets nodig zijn. Zoals een website die inzicht geeft in de relatie tussen prestatie van ziekenhuizen en het stemgedrag, of een app waarmee de recreatievaarder niet alleen overdag zijn vaarweg, maar ook het naderhand nathouden van zijn keel kan faciliteren. Zo'n meetlat geeft inzicht in de mogelijkheden met open data.

Daarmee komen we bij wat ik het interessantste thema in het rapport vind; de impact van open data. Daarbij wordt onderscheid gemaakt tussen politieke, sociale en economische impact. Denk bij politiek aan verantwoording door en transparantie van bestuur, bij sociaal aan publieksparticipatie en bij economisch aan nieuwe handel op basis van open data. Het trendrapport geeft aan dat de politieke impact nog wel redelijk scoort, maar dat de economische, en vooral de sociale impact erg achterblijven ten opzichte van de UK en de USA. Dat juist die politieke impact nog redelijk scoort is vreemd gezien het feit dat even daarvoor wordt aangegeven dat juist op de beleidsterreinen verantwoording en aanbesteding het data-aanbod in ons land minimaal is.



Het verbinden van de diverse dataportalen zal waarschijnlijk wel bijdragen aan de impact. Het trendrapport signaleert die fragmentatie en suggereert daarom de ontwikkeling van een Nationale Informatie Infrastructuur zoals in de UK gaande is. Die gaat overigens heel erg over de data en datasets, en weinig over de onderliggende (ICT-)infrastructuur.  Maar om nu een heel eigen open data infrastructuur op te zetten kan toch niet de bedoeling zijn? Zorg voor verbinding van bestaande registers en infrastructuren. Bijvoorbeeld door die kanalen en portalen van een sterrensysteem te voorzien waarmee wordt aangegeven hoe open het portaal zélf is (los van de er in aangeboden datasets). Heeft het portaal een API? Is die gebaseerd op een standaard? Heeft het een beheerder? En bouw zo aan een netwerk van Open Datapleinen, Lanen van Leefomgeving en crowdsourced olifantenpaadjes.

Geen opmerkingen:

Een reactie posten