Het opschonen en verrijken van je collectiegegevens is een belangrijke stap richting professioneel collectiebeheer. Het zorgt ervoor dat je collectie-informatie consistent, correct en vindbaar is, zowel binnen je erfgoedorganisatie als voor je publiek. In dit artikel lees je in grote lijnen wat de voordelen zijn van opschonen en verrijken van je data, en hoe je hiermee kunt beginnen.

Voor vrijwilligers en erfgoedmedewerkers betekent het opschonen en verrijken van je data niet alleen dat je de gegevens van je collectie controleert, maar ook dat je ze koppelt aan termenlijsten en digitale standaarden. Zo wordt je data NDE-compatibel. Dat betekent dat ze voldoen aan de afspraken die zijn gemaakt binnen het Netwerk Digitaal Erfgoed (NDE). Deze afspraken zijn gemaakt om erfgoedcollecties onderling op een nog betere manier met elkaar te kunnen verbinden.

Voordelen van opschonen en verrijken

  • Betrouwbaarheid: correcte data voorkomt fouten in registraties en publicaties
  • Vindbaarheid: consistente termen en formats verbeteren de zoekresultaten
  • NDE-compatibiliteit: verrijkte en gestandaardiseerde data kan gedeeld worden via Linked Open Data en het Datasetregister
  • Efficiënt beheer: overzichtelijke en consistente gegevens besparen tijd bij toekomstige projecten

Doe een datascan

Door een datascan krijg je zicht op de manier waarop je collectie op dit moment geregistreerd is. Een datascan van je collectie helpt je te begrijpen hoe de huidige data er precies uitzien en welke velden verbetering nodig hebben. Exporteer je gegevens naar Excel en bekijk welke velden inconsistente data bevatten. Belangrijke aandachtspunten hierbij zijn:

  • Welke velden gebruik je allemaal en zijn ze consequent ingevuld?
  • Welke velden wil je delen met het publiek?
  • Zijn de velden semantisch correct? Klopt de inhoud met het verwachte type informatie?
  • Zijn hoofdletters, datumnotaties en schrijfwijzen consistent?
  • Zijn termen gekoppeld via het Termennetwerk of een andere open data thesaurus-bron? Het Termennetwerk is een tool en zoekmachine waarmee je afzonderlijk of tegelijk makkelijk in verschillende terminologiebronnen en thesauri kunt zoeken. In een thesaurus of termijnlijst worden concepten hiërarchisch gerangschikt. Neem bijvoorbeeld het concept katoen. Dit is een nauwere (specifiekere) term van textiel. En een bredere (overkoepelende) term bij katoenfluweel, mousseline en voeringkatoen. Door bij het beschrijven van je collectie de termen te gebruiken die ook breder in het veld worden gebruikt, spreek je allemaal zo veel mogelijk eenzelfde taal.

Twee tools voor het opschonen en verrijken

1 OpenRefine: Dit is een krachtige, gratis te downloaden tool voor het opschonen en structureren van je dataset. De tip hierbij is om eerst te experimenteren met een kleine dataset. OpenRefine kan het volgende voor je betekenen:

  • Identificeer en corrigeer inconsistenties in velden en waarden automatisch
  • Normaliseer schrijfwijzen, hoofdletters en datumnotaties in bulk
  • Koppel velden aan open data thesauri of het Termennetwerk
  • Exporteer de geschoonde data naar je collectiebeheersysteem

2 Termennetwerk: Het gebruiken van termen uit een gecontroleerde thesaurus verhoogt de vindbaarheid van je objecten:

  • Kies termen uit het Termennetwerk die rechtstreeks, realtime doorzoekbaar zijn in verschillende terminologiebronnen
  • Koppel objecten aan relevante termen voor NDE-compatibiliteit
  • Gebruik gestandaardiseerde termen voor zowel publieksregistratie als interne data

Praktische tips van datacleaner Vivian

  • Begin met een kleine dataset om met het opschoonproces te oefenen en vertrouwd te raken
  • Werk stapsgewijs: eerst opschonen, daarna verrijken met nieuwe informatie
  • Documenteer alle beslissingen en wijzigingen zodat collega’s kunnen volgen wat is aangepast
  • Controleer regelmatig de NDE-compatibiliteit: termgebruik, datastandaarden en exportmogelijkheden

Verder lezen?

Hieronder een aantal handige bronnen op een rijtje:

Hulp nodig?

Het Spoorboekje digitalisering erfgoedcollecties biedt stap voor stap begeleiding. Je kunt ook contact opnemen met een medewerker van Datawerkplaats Overijssel.

Onze kennisbijeenkomsten

Binnen de Datawerkplaats Overijssel worden regelmatig kennisbijeenkomsten georganiseerd, ook over het opschonen en verrijken van je collectiedata. Houd ons actuele aanbod via onze agenda in de gaten. Heb jij behoefte aan een specifieke kennisbijeenkomst over een bepaald onderwerp op het gebied van digitalisering bij jou in de buurt? Laat dit dat weten aan digitaal erfgoedcoach Marjanne, door een mail te sturen naar info@erfgoedplatformoverijssel.nl. Bij voldoende animo kunnen we een dergelijke bijeenkomst (opnieuw) organiseren.

Dit kennisartikel is tot stand gekomen in het kader van de activiteiten van de Datawerkplaats Overijssel. Dit project wordt mede mogelijk gemaakt met steun van het Netwerk Digitaal Erfgoed.

Zoek hieronder naar handige tips voor vrijwilligers