5-star Open Data: wat is het en waarom moet ik dat weten?

Tim Berners-Lee – jep, de uitvinder van het World Wide Web – is grote voorstander van het semantisch web en Linked Data. Hij bedacht een 5-sterren ranking systeem voor de kwaliteit van datasystemen. Wil je weten of jouw data 5 sterren waard is? Lees dan zeker verder!

Één ster

Je verdient één ster als je data beschikbaar is op het web via een open licentie, in eender welk formaat. Gebruikers kunnen in dit geval je data opzoeken, bekijken, opslaan en delen met wie ze maar willen.

Twee sterren

Om twee sterren te verkrijgen, bevat je data gestructureerde gegevens die leesbaar zijn door een computer. Dat doe je door bijvoorbeeld een Excel tabel te gebruiken in plaats van een afbeelding van een tabel. De meerwaarde in vergelijking met één ster, is dat gebruikers gegevens kunnen verwerken met software en kunnen exporteren naar andere formaten.

Drie sterren

Je kan drie sterren behalen als je data beschikbaar is in een niet-gepatenteerd open formaat zoals CSV in plaats van Excel. De gebruikers hebben dus geen specifiek softwarepakket zoals Excel nodig om de data te analyseren.

Vier sterren

Naast alle voorgaande vereisten, garanderen de vier sterren dat de data een unieke identificatie krijgt via een stabiele URI (uniform resources identifiers).

Vijf sterren

Dit is de holy grail van data management. Je behaalt 5 sterren als je je gegevens aan andere gegevens uit open gegevensbronnen kan koppelen. Daarvoor gebruik je open standaarden zoals RDF en vocabularies om de data te metadateren. Die data kan je vervolgens kan doorzoeken met Sparql. Dit is het type data waarover we het hebben in onze post over Linked Open Data.

5* Open Data: visueel voorgesteld

5* Open Data: visueel voorgesteld

In de praktijk

Met PwC als partner, werkten we samen met de mensen van de Vlaamse Overheid een datamodel uit voor de Vlaamse Codex. Met een Sparql database, een vernuftig indexeringssysteem en een sterke API, slaagden we erin om hun datasysteem van vier naar vijf sterren te brengen! De API vind je hier en de uitleg over de gebruikte vocabularies vind je hier.

Meerwaarde

Er is niet alleen een overload aan data te vinden op het internet, maar er zijn ook ontzettend veel duplicaten van data. Daardoor is er geen single version of truth meer. Hergebruik dus maximaal wat er al bestaat en laat anderen jouw data maximaal integreren. Resultaat? Je voorkomt fouten en moet niet steeds opnieuw data creëren. Niet investeren in openheid van je eigen data betekent dat anderen ook niet naar jou kunnen linken en dat je data dus misschien ook niet gevonden wordt.

Ga jij ook voor vijf sterren? Onze data management experts staan alvast voor je klaar via hello@novado.be.