vrijdag 22 augustus 2008

Metadata: India zoeken, Amerika vinden

Nu portalen sterk in de belangstelling neemt ook de aandacht voor de wijze waarop in portalen wordt gezocht toe. Dat zoeken kan in hoofdzaak op 2 manieren.

Ten eerste door gericht te zoeken naar een dataset waarvan de zoeker weet dat-ie bestaat, maar waarvan alleen de locatie nog onbekend is. Vergelijk het met gericht boodschappen doen (met een boodschappenlijstje) of het via de kortste of snelste weg naar zuidelijk Frankrijk te rijden. Dit soort zoeken in geodataportalen zal met name door professionele GIS-gebruikers worden gedaan. Zij zijn immers door ervaring, door hun netwerk of door vaktijdschriften op de hoogte van het bestaan van specifieke datasets. Ik noem dit een "find".

De tweede manier van zoeken is de wijze die incidentele GIS-gebruikers eerder zullen hanteren. Die zijn rond een thema (recreatie, arbeidsplaatsen, wat dan ook) op zoek naar informatie. Zij willen rond dat thema rond kunnen snuffelen, ontdekken. "Discovery" (ontdekken) is het label dat ik hier op plak.

Het GSDI Cookbook (2004) zegt ons dat metadata de volgende doelen kent:

  • Discovery metadata - What data sets hold the sort of data I am interested in? This enable organisations to know and publicise what data holdings they have.
  • Exploration metadata - Do the identified data sets contain sufficient information to enable a sensible analysis to be made for my purposes? This is documentation to be provided with the data to ensure that others use the data correctly and wisely.
  • Exploitation metadata – What is the process of obtaining and using the data that are required? This helps end users and provider organisations to effectively store, reuse, maintain and archive their data holdings.

"Marcel en Marcel" (Reuvers en De Rink) vertaalden dat in 2006 naar:

  • Discovery: uitsluitend gericht op het zoeken naar resources;
  • Exploration: evaluatie en toetsing of de resource aan de informatiebehoefte voldoet;
  • Exploitation: het benaderen en verkrijgen van de resource.

In Cookbook en bij Reuvers en De Rink wordt geen onderscheid gemaakt tussen "vinden" en "ontdekken". Wellicht omdat de schrijvers slechts de geo-professionals voor ogen hadden?

Een heel goed en prettig leesbaar boek over dit onderwerp (niet specifiek GIS) is Everything is miscellaneous (the power of the new digital disorder) waarin David Weinberger aangeeft dat we nog veel te veel geneigd zijn met digitale catalogi ("the third order of order") een verbeterde versie van de aloude kaartenbakken ("the second order of order" te bouwen, en daarmee voorbij gaan aan de specifieke mogelijkheden die digitale catalogi bieden.

Vinden vereist formele metadata, ontdekken (vaak dmv browsen) is meer gebaat bij tagging. Voorbeeld hiervan is de fotowebsite Flickr, waar bezoekers niet alleen hun eigen maar vooral ook elkaars foto's van labels (tags) kunnen voorzien.

Net zoals bij amazon.com: Mensen die deze datasets gebruikten, gebruikten ook dataset Y. Dat levert onverwacht hergebruik van data op, en laat dat nou precies het doel van Gideon zijn!