Deze post is geschreven door Barbara Sierman

 

VPsAl enkele jaren praten we over “Verrijkte publicaties” in een poging greep te krijgen op publicaties die vergezeld worden van datasets, websites, audio, video etc. Er is indertijd binnen het Europese project Driver een datamodel ontworpen en enkele universitaire repositories in Nederland hebben dit geïmplementeerd. In het kader van de NCDD is vorig jaar een werkgroep gestart om te kijken hoe het in de praktijk staat met de duurzame toegang tot deze digitale objecten met bijbehorende context. Veelal wordt het object gescheiden van de context bewaard, namelijk bij een andere collectiehouder.
Een rapport met bevindingen is zojuist verschenen en te vinden op de website van de NCDD. Deze blog is een samenvatting van het rapport.

In de werkgroep zaten vertegenwoordigers van de Koninklijke Bibliotheek (KB), DANS, Beeld en Geluid, het Nationaal Archief (NA) en 3TU/TU Delft. Na een eerste inventarisatie op basis van de gevarieerde collecties in deze instellingen, zijn we tot de volgende tweedeling gekomen:
Groep 1: de groep digitale objecten die we bewaren en waarbij de context onlosmakelijk verbonden is met het object, doordat bijvoorbeeld de auteur van een proefschrift aangeeft op basis van welke dataset hij zijn onderzoek heeft gedaan.
Groep 2: de groep digitale objecten die context toegevoegd krijgt doordat de bewarende instelling verbanden legt tussen het object en bijvoorbeeld andere collecties, als een geste naar de gebruikers. Deze context is niet onlosmakelijk verbonden en kan in de loop der tijd wijzigen. Bijvoorbeeld verwijzingen naar ANP berichten (collectiehouder: KB) bij videomateriaal bij Beeld en Geluid.

We kozen de use case “proefschriften” om de praktijk van de duurzame bewaring van Groep 1 in kaart te brengen. Alle Nederlandse universiteitsbibliotheken horen een digitaal exemplaar van een proefschrift van de promovendus te ontvangen. Dit digitale exemplaar komt uiteindelijk bij de KB terecht. Bijbehorende datasets kunnen op verschillende plekken terecht komen, zoals bij DANS of 3TU. Maar we kwamen er achter dat wettelijke regelingen mogelijk ook een rol voor het NA zien. En hoewel de proefschriftreglementen vragen om een digitaal exemplaar, is er niet voorgeschreven dat er een verwijzing naar de bijbehorende dataset moet zijn opgenomen (via een persistent identifier) en vice versa. Voor de collectiehouders is dit een probleem: zij weten niet dat er “context” is en kunnen dat dus niet vastleggen. Handmatig uitzoeken is erg arbeidsintensief en eigenlijk te voorkomen als van meet af aan de connectie gelegd wordt.

Dit laatste – het leggen van verbanden via persistent identifiers – is dan ook een van de aanbevelingen die de werkgroep doet, naast een reeks van andere zaken. Zoals het afstemmen van duurzaamheidsbeleid tussen collectiehouders (om te voorkomen dat onverwacht context bijvoorbeeld minder lang bewaard blijft dan de bijbehorende publicatie). Maar ook door beter in kaart te brengen wie wat bewaart in Nederland, omdat dit nogal diffuus is.

De proefschriften case toont aan dat zelfs een praktijkgeval waarvan we denken dat het “geregeld” is, nog behoorlijk wat verbetering behoeft. We pleiten voor een fundamentele andere manier van denken. De onderzoeker moet zich realiseren dat zijn bronnen niet “vanzelf” duurzaam toegankelijk blijven. Collectiehouders (o.a. de bovengenoemde instellingen) moeten zich realiseren dat de context van de door hun bewaarde objecten mogelijk bij een collega collectiehouder duurzaam bewaard wordt. Onze klanten verwachten dat we dit voor hen regelen, zij willen immers meteen het object én de context kunnen zien.
Werk aan de winkel dus , via de NCDD en het Netwerk Digitaal Erfgoed!