Metadata

Wat is Metadata?

Metadata is het belangrijkste onderdeel van een datawarehouse. Toch krijgt het onderwerp vaak relatief weinig aandacht in een datawarehouse project. Of krijgt het wel aandacht, maar niet in de mate die nodig is. Of niet met de diepgang die nodig is, of misschien soms weer té diepgaand, waardoor onbegrijpbaar voor de doelgroep waar het om gaat.

Voor alle duidelijkheid; metadata is datgene dat de gegevens in een informatiesysteem betekenis geeft, m.a.w.: de documentatie. Maar eigenlijk is het meer dan documentatie. Documentatie is statisch, maar metadata kan ook meer dynamisch van aard zijn. Metadata is eigenlijk alles wat een eindgebruiker moet weten, voordat de cijfers waar hij naar kijkt echt betekenis krijgen. Elke vraag die men kijkend naar een rapport kan stellen, zou door metadata beantwoord moeten worden. Vragen als: Wat is de definitie van het getal of dimensie categorie. Wanneer was de data voor het laatst ververst? Wat is de herkomst van de data? kan ik er vanuit gaan dat de data correct is, of zijn er op dit moment bepaalde data issues?

Waar ligt metadata opgeslagen?

Metadata ligt opgeslagen in een metadatarepository. In elke datawarehousedocumentatie komt wel ergens een plaatje voor van metadatarepository. Dit plaatje geeft iedereen het idee dat het wel snor zit met de metadata. In de praktijk gaat het in zo'n geval vaak slechts om een gedeelte van de metadata. Bijvoorbeeld om een metadata repository die onderdeel uitmaakt van een ETL tool. Zo'n repository bevat vaak echter alleen de gegevens, die betrekking hebben op ETL transformaties welke in die tool gemaakt zijn. Deze informatie kan vaak ook slechts op zo'n manier getoond worden, dat ze betekenis heeft voor een technisch persoon maar niet voor een eindgebruiker. Ook databases en rapportage tools hebben vaak functionaliteit in zich, waarmee metadata gerapporteerd kan worden. De uitdaging zit hem echter in het combineren van de verschillende soorten metadata en het presenteren hiervan in een begrijpbaar formaat.

In de praktijk bestaat het grootste deel van de metadata nog altijd uit handmatig vervaardigde Word documenten. Ook zijn metadata repositories vaak aanwezig in de hoofden van projectmedewerkers.

De toekomst van metadata

Als we naar de toekomst kijken, kunnen we een aantal zaken voorspellen. Met het belangrijker worden van informatiesystemen, zal ook het belang van goede metadata toenemen. In een bedrijf waar medewerkers worden afgerekend op het al dan niet halen van bepaalde targets, zou geen twijfel mogen bestaan over de juistheid van de cijfers. Bovendien zou helder moeten zijn hoe de cijfers tot stand zijn gekomen. Waar men beslissingen wil nemen op basis van bepaalde informatie, mag geen twijfel zijn over de juistheid van die informatie. Goede en beschikbare metadata is voor al deze zaken een vereiste.

Men ziet dat toolleveranciers steeds meer mogelijkheden in softwarepakketten opnemen voor metadata uitwisseling (denk aan open standaarden,zoals het Common Warehouse Metamodel (CWM)) en metadata te presenteren (denk aan Metadata Repository tools). Hierdoor zullen technische beperkingen steeds meer verdwijnen. Het verkrijgen van goede metadata is echter meer dan een technische uitdaging. De uitdaging ligt ook in meer business gerelateerde zaken, zoals de bereidheid om na te denken over definities, zich te verdiepen in issues m.b.t. data en beslissingen te willen nemen indien dit nodig is.

Labels