zondag 18 oktober 2015

Serendipiteit: Op zoek naar het onverwachte in NGR 3.0

Onlangs werd ik benaderd om mee te denken over een nieuwe release van het Nationaal Georegister (NGR). Dat ik mag aanschuiven bij de sessie heb ik waarschijnlijk te danken aan mijn bemoeienis (of: bemoeizucht?) met NGR 1.0 en 2.0. En op deze pagina's komt onze nationale gouden geogids ook nogal eens als onderwerp voorbij.
Vooralsnog zit ik vooral als prototype van een datazoeker in die klankbordgroep. Eigenlijk een beetje vreemd, want beroepsmatig ben ik in mijn huidige baan bij Ordina niet of nauwelijks gebruiker van het NGR. Maar goed, de andere klankbordleden zijn vooral dataprovider,  dus laat mij deze rol maar even spelen (en zoekende lezer: geef mij input!).

Dit voorjaar schreef ik al over hoe een echt nieuwe interface er uit zou kunnen zien. Maar pas afgelopen week snapte ik welk hoger doel zo'n interface ook kan dienen.
Dat hogere doel is serendipiteitWikipedia omschrijft serendipiteit nogal plat als "het vinden van iets onverwachts en bruikbaars terwijl je op zoek bent naar iets totaal anders". Wat mij betreft is voor de zoeker de mindset om open te staan voor iets onverwachts een integraal onderdeel van het begrip serendipiteit.

Wat heeft dat nu met een georegister als het NGR te maken? Welnu: als we als geosector echt willen dat die rijkdom aan (open) geodata die we in dit land hebben, en die voor een flink deel in het NGR staat beschreven ook echt wordt gebruik, dan moet de zoeker ook worden verleid om buiten de gebaande paden te zoeken. Zoals je in de lokale boekhandel ook altijd stuit op een leuk, want onverwacht, boek van een schrijver waarvan je al weer bijna vergeten was dat je die een half jaar geleden bij DWDD met interesse had aangehoord. Nog sterker: het hele concept van de ramsj-winkelketen Action is hier op gebaseerd.

De NGR-bezoeker die alleen maar op zoek is naar de juiste URL voor de WMS of WFS van een dataset waarvan hij absoluut zeker weet dat de one-and-only te gebruiken dataset is heeft niets met serendipiteit. Maar de ruimtelijk ontwerper of beleidsadviseur en nog meer de app- of webbouwer die rond een thema wat geodata bij elkaar wil harken wordt in haar creatieve proces enorm geholpen als de zoekfunctie van het NGR niet recht op zijn doel af gaat, maar ook wat ruimte laat om een dataset te ontdekken die buiten de gebaande paden ligt.
Ik ben benieuwd wat dit vraagt van de user interface, de search engine en van de metadata in het NGR .Maar het lijkt me geweldig als we dit in NGR 3.0 kunnen fietsen!

zondag 20 september 2015

LEF: Rijkswaterstaat meets Openstreetmap

"Ceci nést pas une carte". Of: "Openstreetmap: més d'un mapa".

Dat zijn -vrij naar René Magritte respectievelijk FC Barcelona- twee uitspraken die heel erg op Openstreetmap van toepassing zijn. Er zit onder de motorkap van OSM namelijk een rijkdom aan data die niet allemaal in de kaart getoond kan worden. Om een idee te krijgen van de rijkdom aan "features" (objecten) en "tags" (attributen) is het aardig om een kijkje te nemen in het objectenhandboek van OSM (ja, dat bestaat!). Dat kan de vergelijking met BRT, BGT en NWB aardig doorstaan!

Met name vanwege die laatste, het Nationaal Wegenbestand heeft de dienst Centrale Informatievoorziening (CIV) van Rijkswaterstaat de stoute schoenen aangetrokken en de OSM-community benaderd om te verkennen waar er wederzijdse kansen liggen voor samenwerking.
Na een tweetal voorbereidende gesprekken kwamen afgelopen zaterdag in het LEF Future Center van Rijkswaterstaat zo'n 25 "mappers" en een even grote groep Rijkswaterstaters (aangevuld met vertegenwoordigers van andere basisregistraties) bijeen om "aan elkaar te snuffelen".

De structuur (of: afwezigheid daarvan) van beide organisatie werd naast elkaar gelegd, de cultuurverschillen onder de loep genomen. En uiteraard werd met een blik onder de motorkap gegeven van een hele serie als open data beschikbare RWS datasets (NWB, Weggeg, DTB), van de stukje bij beetje beschikbaar komende BGT, en natuurlijk ook van Openstreetmap. Als bonus werd een "sneak preview" gegeven van een aantal RWS datasets niet nu nog niet open zijn, maar waarvan het interessant is om met de OSM-community te verkennen wat de waarde is van het wél open maken.

Het mooie is dat er ook spijkers met koppen zijn geslagen: een zestal acties zijn benoemd waar OSM-ers én Rijkswaterstaters en IenM-ers gezamenlijk aan de gang gaan. Variërend van het wegnemen van drempels voor beginnende mappers (door een remake van www.openstreetmap.nl) tot het zoeken naar een nieuwe opslagwijze waarmee het gemakkelijker wordt mutaties vanuit verschillende bronnen (NWB én OSm) aan elkaar te knopen. Wordt dus vervolgd!

Met dank aan Eric van Rijkswaterstaat voor het starten van dit initiatief, met dank aan de mensen van bewaking en catering van het LEF om op zaterdag te deuren open te gooien, met dank aan Joris voor de creatieve begeleiding, en natuurlijk dank aan Johan, Frans, Gertjan, Marianne, Marc, Henk, han, Tom, Bas, Jo, Stefan, Wim, Frank, Ed, Luc, Bram, Barry, Sylvia, Fred, René, Rob, Myckel, Fred, Martien, Henk, Peter, Jasper, Matthijs, Christine, Olivier, Nick, Orchida, Gerald, Karin, Marco, Rob, Sander, Jaap-Willem, Vincent, Iris en Harry (heb ik zo iedereen?) voor hun bijdrage en inzet op deze inspirerende dag.

O ja, op twitter kun je de dag teruglezen met de tag #OSMRWS

donderdag 4 juni 2015

Slimme steden (en een pienter platteland)

"Smart cities" zijn hot. En dan niet alleen in de letterlijke zin van het woord, als in hittestress, omdat de stad  haar warmte niet kwijt kan. Nee, ik bedoel met name het concept "smart cities"
Daarbij is er wel een substantieel verschil van inzichten wie of wat er nu smart zou moeten zijn. Gaat dat over ICT en andere techniek ten behoeve van monitoring van geluid, lucht, verplaatsingen etc., geregistreerd door overheid, bedrijfsleven of smart citizens? Of gaat het over de smart city in het dagelijks gebruik, zoals de zelfdenkende glasbak, de vrije-parkeerplaats-app en de straatverlichting-verlichting-on-demand. Of over een slim ingerichte stad, waarbij niet meer de stedenbouwkundige concepten uit de 20e eeuw met met name de fysieke relatie tussen de functies wonen, werken en recreëren het uitgangspunt vormen, maar de internetconnectie de ruggengraat vormt.
Waarschijnlijk een mix van bovenstaande.

Nu is deze eeuw weliswaar de "eeuw van de stad", maar toch zou ik een lans willen breken om ook naast "smart cities" ook naar een "clever countryside" te kijken. Of in goed Nederlands: een "pienter platteland". En dan niet, zoals in sommige übermetropolitane denkbeelden, het platteland als de moestuin of wandelpad van de stad. Nee, het platteland gewoon als plek waar nog altijd bijna 10% van de Nederlandse bevolking woont (uitgaande van de CBS buurten met een bevolkingsdichtheid lager dan 500 inwoners per km2. Dan heb je het écht over platteland hoor). Da's meer inwoners dan in Amsterdam en Rotterdam samen.

Juist op het platteland kan de virtuele wereld een essentiële aanvulling vormen op de fysieke leefomgeving. Juist op het platteland staan voorzieningen als bieb, scholen en winkels zodanig onder druk dat de levensvatbaarheid van dorpsgemeenschappen op het randje balanceert. Daar gaat het niet over een beetje beter of een beetje slechter functioneren, zoals in de smart city het geval is. Nee, op het platteland is het er op of er onder. Een pienter platteland of een simpel sterfhuis. Daar maakt "smart" het verschil!

zondag 26 april 2015

Voorwaarts en niet vergeten: over houdbaarheid van data en webservices

Afgelopen week las ik in een al wat ouder exemplaar van The NewYorker een interessant artikel over the Internet Archive. Dat is de organisatie die zich bezig houdt met de archivering van alles wat er op het Web verschijnt. Een dag later was ik op bezoek bij de UvA, om daar te praten over ontsluiting van historisch kaartmateriaal. Die twee zaken maakte dat ik me probeerde voor te stellen wat er morgen gebeurt met geodata die we vandaag als webservice aan de buitenwereld ter beschikking stellen.

Langzaam maar zeker worden geo-webservices zoals die door PDOK worden aangeboden niet alleen maar ingezet om een Proof op Concept op te tuigen maar ook "voor 't eggie". Daarmee komt een aandachtspunt dat een aantal jaar geleden al eens in het PDOK klantenpanel werd aangehaald: historie.
Laat ik voorop stellen dat ik het heel erg waardeer als PDOK en andere aanbieders hun data in zo actueel mogelijke vorm aanbieden. meestal wil je actuele gemeentegrenzen, recente luchtfoto's, en up-to-date adressen. Maar je hoeft geen archivaris te zijn om toch af en toe behoefte te hebben aan iets meer belegen services. Die behoefte aan historiek valt in een paar soorten uiteen.

Allereerst kan voor het in beeld brengen van een historische ontwikkeling het van belang zijn ook over data van gisteren, vorig jaar en vorige eeuw te beschikken. In het verlengde daarvan: het kan voor het kunnen koppelen van administratieve data nodig zijn om te beschikken over de gemeente-indeling, wijk en buurt grenzen of postcodes die in overeenstemming is met die administratieve data.

Een ander aspect is de reproduceerbaarheid. Instellingen zoals de planbureaus hebben de wettelijke plicht hun onderzoek gedurende 5 jaar te kunnen reproduceren. Dat vereist dat de services zoals ze vandaag worden aangeboden tot en met 25 april 2020 beschikbaar zijn. Dat geldt niet alleen voor de geodata waarop de WMS of WFS service is gebaseerd, maar ook de configuratie van die service zelf: de layernamen, de visualisatieregels, het schaalbereik etc. Bij gebruik van een externe SLD moet dus ook die SLD met een datumstempel van vandaag beschikbaar blijven. Zelfs als die configuratie aantoonbare fouten bevatte, en daarom ondertussen een update heeft gekregen.
Vergelijkbaar met de eis vanuit de planbureaus is de simpele wens te garanderen dat als ik vandaag naar een webkaart kijk en daar conclusies uit trek, ik hoop dat ik morgen diezelfde conclusies kan trekken, en kan delen met collega's, of kan verdedigen tegenover andere partijen. Als in de tussentijd a) de geodata en/of b) de configuratie van de service wijzigt wordt verkrijgen van inzichten op basis van die webkaart wel erg vergelijkbaar met het schieten op een bewegend doel.


Voor de geodata wordt er in de brondatabases vaak wel een "versioning" systeem gebruikt, waarin met behulp van delta tables of een vergelijkbaar mechanisme de stand van zaken van ieder willekeurig moment X kan worden teruggehaald. Voor de configuratie van de services geldt hetzelfde mits ze met behulp van een version control system zoals GIT of SVN worden beheerd. Maar voor zowel data als configuratie geldt dat deze vorige versies vaak alleen ten behoeve van het technisch beheer beschikbaar zijn. De eindgebruiker van die services (u en ik) hebben het maar te doen met die ene combinatie van actuele data en huidige configuratie die naar buiten wordt aangeboden.

Ik realiseer me dat dat een fikse inspanning kan zijn voor de aanbieder van de services. aan de andere kant, je kunt ook betogen dat de performance van zo'n historische service een tandje minder mag zijn. Het gros van de request zal immers op actuele data & configuratie betrekking hebben.

Misschien iets voor het Rijkscentrum voor het Cultureel Erfgoed om hier mee te experimenteren met hun geoservices? De geoservices van vandaag zijn immers de Atlas der Neederlanden van morgen!

zondag 19 april 2015

Een extra dimensie voor GeoSamen: van "gouden driehoek" naar "quadruple helix"

Al eerder kwam op deze plaats de Nederlandse geobeleidsvisie met de welluidende titel GeoSamen aan bod. In die visie staat de "Gouden driehoek" centraal: het samenspel van bedrijfsleven, kennisinstellingen en overheid. Nu is een term met daarin het woord "driehoek" voor met name het op inwinning gerichte deel van de geosector natuurlijk een aantrekkelijke metafoor maar het is toch wat zorgelijk dat buiten onze sector de term "Gouden driehoek" wegens iets teveel associatie met opiumproductie alweer op de mestvaalt der vergetelheid is gedumpt, en vervangen door de triple helix. (Voor niet-ingewijden: een helix is een driedimensionale spiraal: een triple helix zijn drie in elkaar draaiende spiralen)

Opmerkelijk is dat al tijdens de presentatie van GeoSamen, op het Geofort in april 2014, geconcludeerd werd dat er wellicht een punt aan de gouden driehoek ontbrak: de burger! Des te opvallender omdat in de tekst van Geosamen initiatief door burgers als een belangrijke sociale trend wordt herkend, en een pagina verder wordt geschreven dat "overheden, bedrijfsleven, wetenschap en burgers afspraken moeten maken over de inrichting van onze toekomstige informatievoorziening". Op de 20 resterende bladzijden van de visie wordt de burger hooguit een enkele keer genoemd maar dan slechts als consument aan wie "producten, wetenschappelijke doorbraken en innovatieve overheidsdienstverlening actief worden gecommuniceerd". Verder is het alleen de gouden driehoek wat de klok slaat.

Dat die burger er zo mager afkomt in GeoSamen is opmerkelijk in deze tijd van participatiesamenleving. Want de burger kan tegenwoordig twee petten op hebben. Ten eerste is de burger degene voor wie we het allemaal doen. Wellicht denkt het geobedrijfsleven precies te weten wat de burger wil, of denkt de geo-overheid nog dat overheid en samenleving synoniemen zijn, maar anno 2015 kom je met zo'n paternalistische instelling niet meer weg. De burger weet zélf, individueel of in diverse, snel wisselende, coalities heel goed wat-ie wil. En, en dat is de tweede rol van de burger; hij is dankzij gemakkelijk verkrijgbare gereedschappen (lees: open source software) en brandstoffen (lees: open data) ook steeds meer in staat om niet alleen aan te geven wat hij wil, maar dit ook zelf te realiseren.

Ondertussen zien we dat met name in regionale en lokale innovatieagenda's die vierde partij wel in beeld is. Soms wordt de burger daarbij nog wel geacht zich in een maatschappelijke organisatie te verbinden, zoals in de Noordelijke Innovatieagenda 2014-2020, soms mag die burger ook individueel aanschuiven. Dat zien we met name bij de ontwikkeling van stedenbouwkundige plannen, zoals Oostenburg in Amsterdam.
En we zien in de praktijk al diverse LivingLabs waarin ook de burger een partijtje mag meeblazen en ook de verse samenwerking tussen Rijkswaterstaat en de OpenStreetMap community is een mooi voorbeeld van invulling geven aan de quadruple helix.

Al met al een schone taak voor het klassieke geo-trio overheid, kennisinstellingen en bedrijfsleven om hun eigen positie ten opzichte van die calculerende burger te bepalen. Wat verwacht je van de burger? Wat kun je de burger bieden om te helpen die verwachting te realiseren? Misschien helpt het om even te gaan buurten in Eindhoven waar TU/e bestuursvoorzitter Jan Mengelers vorige maand een essay uitbracht waarin de noodzaak om grassroots ontwikkelingen te herkennen, erkennen en waar nodig te stimuleren wordt beschreven. En dat niet alleen in Geosamen versie 1.1 op te nemen, maar uiteraard ook als leidraad bij het handelen te nemen.

dinsdag 7 april 2015

Zachte cijfers in het trendrapport open data

Op 31 maart jl. verscheen het tweede trendrapport open data. Een vlot leesbaar verhaal met daarin de stand van het land met betrekking tot diverse aspecten van open data.
Daarbij wordt zowel de landelijke Nederlandse trend als de verhouding tot de ontwikkelingen in andere landen, waarbij met name de UK en de USA als vergelijkingsmateriaal dienen. Om met dat laatste te beginnen; dat gaat mij iets te snel in de richting van benchmarking, oftewel: lijstjes. We "scoren" beter of slechter dan andere landen. Daarbij leunt het rapport op diverse benchmarks, en daar komt de achilleshiel al naar voren. Volgens de open data barometer zijn we gestegen van plaats 10 (in 2013) naar plaats 6 (in 2014), terwijl we volgens de eveneens aangehaalde open data census gekelderd zijn van plaats 5 naar plaats 16. Als de barometers zó uiteen lopen moet er wel onweer op komst zijn...

Het trendrapport signaleert zelf ook deze beperking en schrijft op bladzijde 30: "We moeten dan ook voorzichtig zijn met de uitkomsten van dergelijke barometers. Daarom kijken we hieronder naast de scores op de Open Data Barometer ook naar het aanbod van open data op data.overheid.nl." Op dat open data portaal telde het trendrapport in februari 2015 bijna 3200 datasets. Blijkbaar is er sindsdien een lijntje gelegd naar het dataportaal van statistiekgrootgrutter CBS, want op 7 april 2015 staat de data.overheid.nl-teller al op 6731. Zo snel kan het blijkbaar gaan.
Verwarrend is wel dat volgens de voorpagina van het portaal van die ruim 6700 datasets er slechts 2989 een open data licentie hebben, een kleine meerderheid heeft daarentegen een "andere licentie". Iets verder speuren in het portaal zelf levert op dat zo'n 3000 datasets in het Publieke Domein zitten (en er dus geen auteursrecht meer van toepassing is) c.q. van een CC-0 verklaring is voorzien (en er op die datasets dus geen actief auteursrecht wordt uitgevoerd). De overige pakweg 3700 hebben op een enkele uitzondering na een CC-BY-licensie, waarbij dus de naamsvermelding van de bronhouder als restrictie geldt. Ik neem aan dat dat in het verband van het trendrapport ook onder open data wordt geschaard, al wordt dat niet expliciet gemaakt.

Hetzelfde data.overheid.nl bevat ook een overzicht van weliswaar bekende, maar niet rechtstreeks aan data.overheid.nl gekoppelde open data portalen. Daar staat een hele trits lokale, regionale en thematische portalen, waarbij alleen dat van de gemeente Den Haag al meer dan 8.000 dataset bevat.
Maar dan hebben we dus geen 3200 open datasets in Nederland, maar minstens het vijfvoudige daarvan!

Zo wordt steeds meer duidelijk dat het voor een heldere monitor ontbreekt aan een eenduidige, stabiele meetlat voor de beschikbaarheid van open data. De aantallen dataset worden bovendien nog enorm beïnvloed door de wijze waarop de data is georganiseerd: de Top10NL als landsdekkende dataset telt voor één, terwijl een uitsplitsing naar de aloude bladindeling die de Topografische Dienst hanteerde zou honderden datasets opleveren ,en als je dat allemaal nog eens uitsplitst naar thema's in die datasets kun je die ene top10nl "opvoeren" tot een reeks van duizenden datasets. Dat telt lekker aan!

Misschien moeten wel geen datasets meer tellen, maar moeten er bij wijze van meetlat pakweg 20-30 maatschappelijke vragen en commerciële toepassingen worden geformuleerd waarvoor een of meer open datasets nodig zijn. Zoals een website die inzicht geeft in de relatie tussen prestatie van ziekenhuizen en het stemgedrag, of een app waarmee de recreatievaarder niet alleen overdag zijn vaarweg, maar ook het naderhand nathouden van zijn keel kan faciliteren. Zo'n meetlat geeft inzicht in de mogelijkheden met open data.

Daarmee komen we bij wat ik het interessantste thema in het rapport vind; de impact van open data. Daarbij wordt onderscheid gemaakt tussen politieke, sociale en economische impact. Denk bij politiek aan verantwoording door en transparantie van bestuur, bij sociaal aan publieksparticipatie en bij economisch aan nieuwe handel op basis van open data. Het trendrapport geeft aan dat de politieke impact nog wel redelijk scoort, maar dat de economische, en vooral de sociale impact erg achterblijven ten opzichte van de UK en de USA. Dat juist die politieke impact nog redelijk scoort is vreemd gezien het feit dat even daarvoor wordt aangegeven dat juist op de beleidsterreinen verantwoording en aanbesteding het data-aanbod in ons land minimaal is.



Het verbinden van de diverse dataportalen zal waarschijnlijk wel bijdragen aan de impact. Het trendrapport signaleert die fragmentatie en suggereert daarom de ontwikkeling van een Nationale Informatie Infrastructuur zoals in de UK gaande is. Die gaat overigens heel erg over de data en datasets, en weinig over de onderliggende (ICT-)infrastructuur.  Maar om nu een heel eigen open data infrastructuur op te zetten kan toch niet de bedoeling zijn? Zorg voor verbinding van bestaande registers en infrastructuren. Bijvoorbeeld door die kanalen en portalen van een sterrensysteem te voorzien waarmee wordt aangegeven hoe open het portaal zélf is (los van de er in aangeboden datasets). Heeft het portaal een API? Is die gebaseerd op een standaard? Heeft het een beheerder? En bouw zo aan een netwerk van Open Datapleinen, Lanen van Leefomgeving en crowdsourced olifantenpaadjes.

woensdag 1 april 2015

De geosector, zij leefde in onschuld, in het paradijs. Totdat ze de vrucht met de nam GPS kreeg aangeboden en daar een hap van nam. Daarmee verruimde ze haar aandachtsgebied van het aloude verzamelen, registreren en analyseren van "gegevens met een vaste plaats op, boven, onder of in het aardoppervlak" naar het stoeien met "location based services"; locatie als dynamisch kenmerk van personen, in trains, planes & automobiles, te land, ter zee, en in de lucht.

Tot voor een paar jaar was privacy hierbij in de Nederlandse geosector nauwelijks punt van aandacht. Maar nu is er een "witboek" met de titel "Privacy op zijn plaats". In opdracht van Geonovum geschreven door Angélique van Oortmarssen, Marc de Vries en Bastiaan van Loene. Heel knap hoe de drie schrijvers dit ogenschijnlijk droge onderwerp in pakweg 40 pagina's niet alleen leesbaar maar zelfs levendig weten te maken.Technische ontwikkelingen, de wet, de interpretatie daarvan, ervaringen, en ethische aspecten passeren de revue, geïllustreerd met pakkende voorbeelden. En de schrijvers zijn niet te beroerd om aan te geven waar de onduidelijkheden zitten. Zij hebben de wijsheid ook niet in pacht.

Zomaar even een eye-opener uit het witboek waarmee duidelijke wordt dat de reikwijdte van privacywetgeving ten aanzien van ruimtelijke informatie ver blijkt te strekken; informatie over perceelsgrenzen, en zelfs gedetailleerde luchtfoto's moeten onder bepaalde omstandigheden als persoonsgegevens worden beschouwd (!)

Het eerste hoofdstuk is in tien pagina's de beste compacte inleiding over wat locatie-informatie is en wat het kan die ik ooit heb gezien. Dat kun je zo in een willekeurige geovisie opnemen. Vooral de zin "locatie-informatie is daarbij oliemannetje dat data uit verschillende databronnen aan elkaar kan relateren" kan mij erg bekoren. Hoofdstuk twee legt de juridische kaders op een begrijpelijke manier uit, en beschrijft daarbij uitdrukkelijk de grijze gebieden. Met een zevental praktijkcases uit overheid, onderzoek en bedrijfsleven wordt vervolgens de praktijk opgezocht.
Om het witboek niet als een nachtkaars uit te laten gaan wordt in het slothoofdstuk een goede aanzet voor vervolg gegeven. Door hierbij ene onderscheid te maken in 3 niveaus ("pistes") wordt degene die er hier en nu mee aan de slag wil niet wordt gedwongen zich met "Brussel" aan een tafel te zetten, maar in een voor hem of haar qua inhoud en tijdspad aantrekkelijke setting wordt uitgenodigd.

Eén interessant aspect pik ik er nog even uit: de Wet bescherming persoonsgegevens stelt dat de persoonsgegevens eerst en vooral verzameld moeten zijn voor een gerechtvaardigd, duidelijke bepaald en goed omschreven doel. Verdere verwerking -al dan niet binnen dezelfde organisatie- mag alleen als dit niet onverenigbaar met het oorspronkelijke doel, aldus artikel 9 van de Wpb. Altijd  bijzonder, zo'n dubbele ontkenning, maar lid 2 van hetzelfde artikel geeft aan dat er rekening moet worden gehouden met verwantschap tussen het beoogde nieuwe doel en het oorspronkelijk doel. Ik ben benieuwd hoe je dit moet toepassen op open data. Daar is het doel voor verdere veerwerking juist vaak juist een heel ander dan het oorspronkelijk doel van registratie. En hoe pas je dit toe op OpenStreetMap, een registratie die als doel heeft tot een vrij, zonder belemmeringen bruikbare kaart van de hele wereld te komen. Da's een breed doel, bijna net zo breed als de inhoud van deze crowdsourced registratie.


Lezen dus! En kom op donderdag 23 april naar de workshop "Privacy.. en wat er wel kan" op de beurs Overheid 360°

zaterdag 7 maart 2015

Linked metadata: de nieuwe interface voor het NGR en andere geo/dataregisters

Vele toetsaanslagen hebben mijn toetsenbord al geteisterd als het aankwam op de interface van wat het uithangbord van de Nederlandse geo-informatie zou moeten zijn: het Nationaal Georegister.
Gebruikers klagen -nog steeds- dat er wel een "zoek"- maar geen "vind"-functie in het NGR zit.
En er schijnen gebruikers te zijn die de zoekfunctie zelfs niet kunnen vinden!

Vandaag heb ik een sneak preview gehad van een mogelijke nieuwe interface voor het NGR, en voor andere registers. De gedachte er achter is dat "thema" de belangrijkste zoekingang is. Nu zijn de afbakeningen van thema's in registers als het NGR altijd wat "fuzzy". Zo zijn "planologie" en "ruimtelijke ordening" weliswaar geen synoniemen maar wel zeer nauw verwant. Met een goede thesaurus kunnen die verbanden worden aangebracht. Nog beter is het combineren van thesauri uit verschillende sectoren en disciplines, juist omdat de datasets en services in het NGR betrekking hebben op een grote diversiteit aan sectoren en vakgebieden.

Wat is nu die interface? Zoiets:
http://synoniemen.net/grafisch_js.php?zoekterm=hoogte
Klik er vooral even op om 'm "in het echt" te zien.
Ik kwam 'm tegen op synoniemen.net. De crux is dat de zoekterm in het centrum wordt weergegeven, en dat de "eerstegraads"-synoniemen als direct verbonden bolletjes worden weergegeven, en de "tweedegraads"-synoniemen daar weer aan verbonden.
Lijkt me erg leuk om zo de termen uit de NGR-thesaurus, en de datasets en services waar deze zoekterm aan hangt weer te geven. Het lijkt dan wel linked metadata!


Deze vrolijke zoekfunctie is gemaakt met D3.js, dé JavaScript bibliotheek voor alle mogelijke datavisualisaties. Absoluut de moeite waard om daar eens in te duiken.


Naast de verwantschap tussen thema's zou je ook nog een onderlinge verwantschap tussen datasets kunnen toepassen. In de metadatastandaarden is daar ruimte voor gereserveerd om die aan te geven.Wellicht dat daarmee de verwarring over het verschil tussen zes typen bebouwde kommen kan worden weggenomen.

Wat tenslotte ook meerwaarde kan hebben is het op soortgelijke wijze presenteren van de verschijningsvormen van een dataset: dat brengt de logische samenhang tussen een dataset, een daarvan afgeleide WFS of downloadservice en een of meer daarvan afgeleide WMS-services in één oogopslag in beeld.

Aanvulling: een misschien wel nog mooiere versie is te vinden op http://zoeken.bibliotheek.nl/

vrijdag 6 maart 2015

Verscheurde woonplaatsen in de BAG: Avezaath en Vinkel

Een beetje in het verlengde van mijn vorige blog (over bebouwde kommen) heb ik het vergrootglas eens op het fenomeen woonplaatsen gelegd.
Met de invoering van de BAG (basisregistratie adressen en gebouwen) heeft Nederland eindelijk een formele indeling van woonplaatsen. Uitgangspunt is een of meer woonplaatsen samen één gemeente vormen, en dat zodoende de woonplaatsindeling een landsdekkende indeling vormt. Hartstikke handig, want zo'n indeling is redelijk robuust, al is het maar dat het nogal een administratieve (gemeentelijke) rompslomp is om een woonplaatsindeling te veranderen. Ik ken maar een geval: het opgaan van de voorheen afzonderlijke Amsterdam-Zuidoost in de woonplaats Amsterdam. Daarmee is het complete grondgebied van de gemeente Amsterdam nu ook één woonplaats Amsterdam geworden.

GIS-technisch aandachtspunt daarbij is dat de woonplaats Amsterdam nu een multi-polygoon is. dat blijkt vaker voor te komen: zo bestaat uit de woonplaats Geldermalsen uit een multi-polygoon. Dat hoeft geen probleem te zijn; ik ga er van uit dat een fatsoenlijk GIS-pakket snapst dat die 2 deeltjes bij elkaar horen.

Iets verder stroomopwaarts langs de Linge (en de A15) is de situatie een stuk complexer. Door een gemeentelijke herindeling is het noordelijke deel van Kapel-Avezaath (met tussenstreepje, met BAG-ID 3377) bij de gemeente Buren terecht gekomen, en het deel ten zuiden van de A15 als woonplaats Kapel Avezaath (zonder tussenstreepje, met BAG-ID 2560) bij Tiel.

Nog iets oostelijker is de situatie nog complexer: daar ligt ten noorden van de A15 het "gestreepte" Kerk-Avezaath (BAG-ID 3378) in de gemeente Buren. Ten zuiden van de snelweg het streeploze Kerk Avezaath (BAG-ID 2561), dat een multipolygoon blijkt te zijn.

25 kilometer naar het Zuiden, in het Brabantse Vinkel een soortgelijke situatie. Ook deze woonplaats is de afgelopen decennia geteisterd door herindelingen. Inmiddels is Vinkel opgedeeld in een groot westelijk deel (BAG-ID 3612) dat sinds 1 januari 2015 bij de gemeente 's-Hertogenbosch hoort, en twee kleine oostelijke delen die onder het gezag van de burgemeester van Bernheze valt. Die oostelijke delen (BAG-ID 3063) lijken een multipolygoon te zijn, maar blijken bij nadere bestudering door een 5 meter brede corridor langs de gemeentegrens met elkaar verbonden te zijn. Een creatieve oplossing! Helaas voor het onderscheid met het Bossche deel van Vinkel een tussenstrepje (Vin-kel?) geen soelaas

Conclusie: pas op voordat je met alleen de woonplaatsennámen uit de BAG aan de gang gaat. Voor je het weet mis je de helft. Een goed idee: gebruik het ID!

dinsdag 3 maart 2015

De ene kom is de andere niet: 6 smaken bebouwde kom

Verwarring in geoland! Sinds de februari -release van 2015 levert Kadaster in de top10nl bij de "geografische gebieden" drie gradaties: "buurtschap", "huizengroep" en "plaats, bewoond oord".
Van die eerste soort geniet Bartlehiem landelijke bekendheid. Bij de "huizengroep" springen "De Lucht-West" en "De Lucht-Oost" (welbekend voor wie wel eens op de A2 van Utrecht naar 's-Hertogenbosch rijdt) in het oog. En de derde groep is natuurlijk de hoofdmoot. Al lijken daar op dit moment Amsterdam-Noord en -Zuidoost, en de Haagse Vinexwijken "Leidschenveen" en "Ypenburg" nog te ontbreken. Het vermoeden rijst dat we hier  met een multi-polygon probleempje van doen hebben.
De verwarring zit 'm in de status van deze geografische gebieden. Het lijken aanduidingen voor bebouwde kommen, zoals we die allemaal kennen van de blauwe (verkeers-)borden bij het binnenrijden van een plaats. Maar dan zijn die buurtschappen en huizengroepen weer wat teveel van het goede. Alhoewel, er zijn ook plaatsnaamaanduidingen met blauwe of zwarte letters op een witte achtergrond (in vaktaal: pseudeo-komborden). Als u Bartlehiem binnenrijdt komt u zo'n bord tegen.

De verwarring wordt nog wat groter omdat er diverse definities van bebouwde kommen blijken te zijn. Naast de hierboven aangehaalde versie (1) die op grond van de Wegenverkeerswet door de gemeenteraad moet worden vastgesteld is er ook een bebouwde kom (2) die op grond van de Wegenwet door Gedeputeerde Staten wordt vastgesteld. Hiermee wordt bepaald welke wegen in een gemeentelijke wegenlegger moeten worden geregistreerd. Van de provincie Utrecht heb ik daarvan een fijne webservice kunnen vinden.
We gaan nog even door, want er bestaat ook een bebouwde kom in de Boswet. Die wet gaat over kappen en herplanten van bomen buiten de bebouwde kom. Steeds meer gemeenten gaan er toe over om in dit Boswet-perspectief de grens van de bebouwde kom gelijk te stellen aan de gemeentegrens. We zijn er nog niet, want ook in de context van de WABO (o.a. vergunningsverlening) en in de zin van de APV (o.a. hond wel of niet aan de lijn) speelt de grens van de bebouwde kom een juridische rol. Het is aan de gemeente om te bepalen of er voor ieder van bovengenoemde doelen een aparte bebouwde kom wordt vastgesteld, of dat er met 1 of 2 bebouwde komgrenzen wordt volstaan.

Verder is het goed om nog even te wijzen op het CBS bestand Bevolkingskernen  in Nederland. De definitie voor deze dataset sluit aan bij een definitie die de Verenigde Naties hanteren. Het gaat hierbij een een aaneengesloten gebied, met een herkenbaar stratenpatroon, overwegend door mensen bewoond. Hierbij kan één kern zich overigens over gemeentegrenzen uitstrekken. Zo omvat "Groot-Dordrecht" de bewoonde delen van Dordrecht, Zwijndrecht, hendrik-Ido-Ambacht, Papendrecht, Waarom het Amsterdamse havengebied wél, en de Europoort en Maasvlakte niet tot een bevolkingskern worden gerekend is me overigens nog niet duidelijk. Deze dataset is ook als webservice beschikbaar.

En om het verhaal compleet te maken haal ik er dan ook nog een beleidsmatige begrenzing bij. In de hoogtijdagen van de Rijks-ruimtelijke ordening (de Vijfe Nota) wees Minister Jan Pronk "met de dikke duim" rode contouren aan als grens voor verdere verstedelijking. Met de Nota Ruimte zijn die contouren in 2000 vervangen door de op een GIS-analyse gebaseerde "Begrenzing Bebouwd Gebied"  (BBG). Dit bestand heeft diverse reorganisaties op dat departement glansrijk doorstaan en is te vinden op de website van de Rijksoverheid. De bijgaande zeer gedegen beschrijving geeft niet alleen inzicht in de achterliggende rekenregels, maar is ook een tijdsdocument voor zowel de status van Rijksbemoeienis met ruimtelijke ordening als voor de geo-ict rond de eeuwwisseling. Coverages! AML! Those were the days my friend!

Al met al genoeg voer voor verwarring. Als de geo-professionals door de bomen het bos al niet meer zien, hoe moet een "buitenstaander" er dan iets van kunnen snappen? Hier merk je dat een georegister meer zou moeten zijn dan een aanbodgestuurde opsomming van datasets, maar juist een context (=vraag) gestuurde benadeing zou moeten hebben. Op zijn minst door kruisverwijzing tussen deze datasets. Daarvoor is registratie van de genoemde datasets in het Nationaal Georegister natuurlijk het absolute minimum.

 Voor deze blogpost heb ik dankbaar gebruik gemaakt van een artikel op de site van Dirkzwager Overheid&Vastgoed

zondag 8 februari 2015

Een Huis der Kansen aan de Laan van de Leefomgeving

Een dik half jaar terug schreef ik op deze plek al eens over de Laan van de Leefomgeving, en met name de wijze waarop je met geo-informatie ontwikkelingsplanologie kunt bedrijven.

Nu de laatste weken het voortbestaan van het warenhuis V&D de economische krantenpagina's overheerst toetste ik de ambities van de Laan van de Leefomgeving eens aan de ontwikkelingen in de retailsector. Wat me opvalt is dat de Laan met haar informatiehuizen focust op wat er wel of niet op een bepaalde locatie mag. uit de programmadefinitie GOAL:  "Het gaat daarbij om informatie voor besluiten met rechtsgevolgen, zoals vergunningen of een omgevingsplan".

Naar mijn idee liggen er daarmee nog kansen voor een informatiehuis (of misschien wel aanbouwtjes bij de bestaande informatiehuizen) die informatie verzamelt over wat er op een bepaalde locatie haalbaar is. De gevolgen van de overvloedige kantoor- en bedrijfshallenbouw rond de eeuwwisseling kan iedereen om zich heen zien. Het overschot aan fysieke winkelruimte wordt ook steeds duidelijker, en dat heeft niet alleen met V&D te maken.

Het zou de kwaliteit van ruimtelijke initiatieven helpen als ook informatie over bevolkingsontwikkeling, arbeidsmarkt, koopkracht etc. via de Laan van de Leefomgeving wordt ontsloten. Daarnaast draagt de laagdrempelige beschikbaarheid (huizen aan deze Laan kennen hopelijk geen drempels!) bij aan een transparanter besluitvormingsproces; betrokken burgers en andere stakeholders kunnen met de beschikbaarheid van dit soort informatie ruimtelijke initiatieven in hun achtertuin beter op waarde schatten. En het helpt de verantwoordelijke overheden om tot betere omgevingsplannen te komen die aansluiten bij actuele ontwikkelingen ten aanzien van woning- kantoren- en winkelmarkt.

Dus als er nog een kaveltje vrij is aan de Laan van de Leefomgeving: een Huis der Kansen zou een verrijking voor het straatbeeld zijn. Of dat huis door de overheid gebouwd mag worden valt nog te bezien; als een of meer commerciële geodata-aanbieders zo'n pakhuis kunnen neerzetten lijkt me dat ook prima. Al is het in dat verband wel wrang dat onlangs de "V&D van de geodata" (Bridgis) failliet is gegaan.

Nieuwe postcodegrenzen geven greep op geodatakwaliteit (1)

De inkt van het -voor mij verrassende- bericht over het faillissement van geodatamakelaar Bridgis was nog niet droog of op diverse plekken ontstonden er discussies en initiatieven over het zélf vervaardigen van een bestand met postcodegrenzen. Niet dat erop dit moment in het geheel geen bronnen meer zijn voor zo'n bestand, bij mijn weten levert First Element nog steeds de Bridgis versie, terwijl Geodan al sinds jaar en dag zelf zo'n bestand maakt en vermarkt.
In de Nederlandse open source geo community werd de discussie of we geen crowdsourced 6 positie postcodevlakkenkaart zouden kunnen maken aangezwengeld door Jan-Willem van Aalst, en een weekje later zag ik dat Esri Nederland ook aan het experimenteren is met het zelf uitwerken van een algoritme om aan de hand van de BAG, het NWB en andere open data tot een landsdekkend 6-positie postcodevlakkenbestand te komen.

Los van de vraag over nut en noodzaak van het zelf maken van zo'n dataset, over eigenaarschap en hoe je een en ander "vermarkt" is zijn deze initiatieven erg interessant voor het thema datakwaliteit. Het is een prima oefening in het definiëren van  kwaliteitsparameters: waar moet een 6-positie postcodevlak (en zijn "vader" en "grootvader", de 5- en 4-positie vlakken) eigenlijk aan voldoen?

Een primaire eis lijkt mij dat alle adrespunten van een 6-positie postcode binnen het resulterende vlak moeten liggen. Maar zelfs dat is niet altijd evident; de plaatsing van een verblijfsobjectpunt in de BAG is soms discutabel: neem je als BAG-beheerder de bij een appartement de locatie van de gemeenschappelijke ingang (vaak ook de locatie van de brievenbus) of prik je dat VBO-punt op het verblijfsobject zelf? Die 355 verblijfsobjecten in de 42 verdiepingen tellende Haagse Toren zijn op dat punt een mooie uitdaging! Zoek 'm maar op in de BAG-viewer: bij postcode 2516LX.

Voor het oog van de kaartlezer is het daarnaast prettig als de grenzen van de postcodegebieden er een beetje smakelijk uitzien: liefst geharmoniseerd met topografie wegen, spoorlijnen, rivieren en kanalen. En voor het koppelen van data ook handig als de grenzen waar mogelijk samenvallend met wijk- en buurtgrenzen zoals CBS en gemeenten die hanteren. Maar dat dan wel met zo min mogelijk vertices (tussenpunten): performance is immers ook een kwaliteit.


Historie opbouwen zou natuurlijk mooi zijn, maar dan leg ik de lat wel heel erg hoog; als ik er van uitgaan dat het een landsdekkend bestand moet opleveren ontkom je er niet aan dat bij het ontstaan van een nieuwe 6-positie postcode de buurvlakken iets van hun oorspronkelijke territorium moeten prijsgeven. O ja, wat is dan eigenlijk landsdekkend? Moet het IJsselmeer in 6-positie postcodes worden verkaveld? Het Hollands Diep? De Rijn, IJssel, Waal en Maas. Het Uddelermeertje?

Nog een stap verder redenerend kun je je afvragen waarvoor je eigenlijk een 6-positie vlakkenkaart zou willen toepassen. Voor het weergeven van een absoluut verschijnsel (bijvoorbeeld: aantal inwoners) is een figuratieve kaart beter geschikt, voor het weergeven van een relatief verschijnsel (zoals inwonerdichtheid) zou dit de extra eis opleveren dat de oppervlakte van de te maken postcodevlakken een direct relatie heeft met het aantal adressen (of nog scherper: verblijfsobjecten) in dat postcodegebiedje. Dat wordt wel heel complex. Mag ik die even parkeren?

Zoals u op de GeoBuzz kon merken is Alterra bezig met het opzetten van een framework waarmee de vraag "wat is datakwaliteit?" beter moet kunnen worden beantwoord. Misschien zijn deze bottom-up postcodegrenzen een leuke case: het vereist geen specifieke domeinkennis (over bijv. bodem, geluid of natuur), de discussie leeft al op diverse plekken, en is concreet genoeg om ook direct toepasbaar te zijn.

Ik ben er nog niet over uitgepraat, zoals de lezer aan de titel al merkte. Stay tuned voor meer aspecten, en voortschrijdend inzicht