dinsdag 12 februari 2008

Data bij de bron: Niet per definitie goed

Sinds een aantal jaar waart de mantra "data bij de bron" door geo-nederland. Goed bedoeld, want wat we er mee willen is dat er geen kopietjes van kopietjes van kopietjes van datasets gaan rondzwerven. Waardoor je, zoals mijj meermalen is overkomen, door collega's van andere overheden uiteindelijk je eigen data weer cadeau krijgt. Hoezo sigaar uit eigen doos?
Maar om daarvoor de data bij de bron te moeten laten is niet de oplossing. Want die bron is gespecialiseerd in het inwinnen, het verzamelen van data. Data beheren en beschikbaar stellen is een wezenlijk nadere tak van sport. Of wordt de openbare bibliotheek bij u in de buurt bestierd door A.F.T.H. van der Heijden of Arnon Grunberg?
Nog sterker, zelfs die (bewerkte) kopietjes van (bewerkte) kopietjes zijn geen probleem. Misschien zijn namelijk de bewerkingen die u doet voor mij weer een handig startpunt. Zolang maar eenduiding traceerbaar is welke weg de data heeft afgelegd. Deze zogenaamde lineage (het "DNA") van data is nog onontgonnen terrein.
Het lijkt me een goed plan na eerdere GML-estafette en aankomende (15 mei 2008) metadata estafette een data estafette te gaan houden.