maandag 29 maart 2010

datakwaliteit: weet wat je eet

Ingewijden in de Nederlanse geoscene weten elkaar goed te vinden voor de uitwisseling van data. Dat is een groot goed dat we vooral moeten koesteren, bijvoorbeeld door elkaar op 13 april op de GIS Tech weer te treffen.

Toch staan we voor een professionaliseringsslag op dit gebied: In de geo-beleidsnota Gideon werden al een aantal geodataketens onderscheiden, mét het voornemen deze compleet in beeld te brengen. Dat komt nog maar moeizaam van de grond.

Dat zou toch niet zo moeilijk mogen zijn: veel van die data wordt al meer dan 10 jaar op diverse plaatsen gebruikt, dus er is veel kennis aanwezig over de "functionele behoeftestelling", oftwel welke rol speelt een dataset in de bedrijfsprocessen.

Waar we nog een professionaliseringsslag moeten maken is de vorm waarin data de keten doorloopt: ik zie te vaak een dataset per jaar van vorm verschillen: andere veldnamen, zelfde veldnaam maar andere definitie, ander type datacompressie, ander geodataformaat. Terwijl dat met ETL-tools als FME en ArcGIS/Modelbuilder toch eenvoudig goed te regelen moet zijn.

Als die vorm nou bij iedere levering hetzelfde is wordt het voor de ontvangende partij eenvoudiger er consistentiechecks op uit te voeren. door bijvoorbeeld een aantal controlescripts die bij binnenkomst op een dataset kunnen worden losgelaten.

Daarna komt de echte professionaliseringsslag: bij constateren van fouten de boel terugsturen in plaats van als gebruiker zelf te gaan repareren. Blijkbaar is dat nu nog de weg van de minste weerstand. En lost het probleem slechts op één gebruikersplek op.

Tijd voor een kwaliteitskeurmerk: niet zo zwaar aangezet als een basisregistratie, wel een "goedgekeurd door gebruikers"-stempel. Met een eervolle vermelding in het Nationaal Georegister!