18 juli 2024

Archiveren en het data-continuüm

Archiveren wordt vaak beschouwd als laatste stap in een lifecycle: ‘voor eeuwig’ opgeborgen. Maar in een volledig digitale wereld kan een gearchiveerd document makkelijk decennia of zelfs langer in gebruik blijven. Het idee van een groeiend data-continuüm (transforming data into wishdom) is een holistische benadering over een consistent en samenhangend regime van beheerprocessen, vanaf creatie tot eeuwig durend gebruik. De theorie van het ‘continuüm-model’ beschrijft vier dimensies – creëren, vastleggen, organiseren en pluraliseren – en vier assen: ‘wie’ deed ‘wat’, ‘welk bewijs’ bestaat hierover en ‘hoe’ kan dit worden teruggehaald uit documenten en archieven. Een nieuwe kijk op record-, document- en content-management. De levenscyclus van data en informatie heeft geen einde meer maar is de-facto eeuwigdurend.

Archiveren en het data-continuüm image

Geborgde informatie

De theorie wordt ook wel het ‘record continuüm’ genoemd, zie ook mijn blog ‘De databloem’. Het begrip ‘record’ betekent aantekening, vermelding of (officieel) document. Maar ook dossier, een collectie van data of archiefstuk. Het is vooral iets dat een bewijsstuk over het verleden vormt, een verslag dat op schrift of in een andere permanente vorm wordt gehouden. In de huidige wereld, met fakenews, deepfakes en ‘ongemerkte’ verandering van digitale content, wordt de kwaliteit van permanente vastlegging van het origineel steeds belangrijker. Hoe zekerder men weet dat de juiste versie correct en juist is vastgelegd, hoe geloofwaardiger informatie is. De ‘echte’ versie van informatie, hoe deze ooit is gemaakt en was bedoeld. Niet datgene wat anderen daarvan begrepen, overnamen of zelfs veranderden tijdens het gebruik.

Het continuümmodel is alleen geldig als die permanente vastlegging – het liefst zo dicht mogelijk bij de bron – bewezen heeft plaatsgevonden. Alleen dan heb je een stevig fundament waarop je een consistent en samenhangend regime van beheerprocessen kunt realiseren. Vanaf het directe moment dat informatie wordt aangemaakt, moet dus al duidelijk zijn hoe deze mag en/of moet worden bewaard en gebruikt. Onafhankelijk van de applicatie of het systeem om die informatie of content te genereren en te gebruiken. Het traditionele archiefbeheerdomein zal veel eerder in de lifecycle, actief moeten worden. Archiveren bij de bron wordt steeds belangrijker. Het liefst ook nog via hashing en timestamping, zie een eerdere blogs hierover zoals ‘Blockchain in business’ en ‘Blockchain als onuitwisbare inkt’.

Het continuümmodel

Het continuümmodel, ontwikkeld in Australië, is een ‘holistische’ benadering van het begrip archiveren. Het is ‘… een consistent en samenhangend regime van beheerprocessen vanaf het moment dat documenten worden aangemaakt, door het bewaren en gebruiken van documenten als archieven.’ Op deze wijze wordt archiveren zelfs het bronsysteem om digitale documenten eenduidig te classificeren, te beoordelen, te controleren en te onderhouden. Het model betoogt dat deze processen in de digitale wereld, zo met elkaar verbonden, overlappend en geïntegreerd zijn, dat het contraproductief is om nog enig onderscheid te handhaven.

De theorie van het continuümmodel gaat uit van op registratie gebaseerde activiteiten als een voortdurende beweging in en door vier dimensies en vier assen. De assen vertegenwoordigen de algemene elementen voor het aantonen van verantwoording: wie [identiteit] deed wat [transactionaliteit], welk bewijs hierover bestaat [evidentialiteit], en hoe dit kan worden teruggehaald uit documenten en archieven [gegevensopslag/containers]. Deze elementen vertegenwoordigen de algemene elementen voor het aantonen van verantwoording.

Continuüm versus levenscyclus

De levenscyclusbenadering beschouwt elke fase als lineair met en onafhankelijk van andere fasen. Terwijl in het continuümmodel het bijhouden van gegevens als een multidimensionaal proces wordt gezien. Het suggereert dat het beheer van documenten niet tijdsgebaseerd of opeenvolgend is. Echter datamanagement is vergelijkbaar met assetmanagement en acties met betrekking tot de documenten kunnen gelijktijdig plaatsvinden: een document kan tegelijkertijd worden benaderd voor actuele organisatorische als archiveringsdoeleinden, vooral als het in elektronische vorm beschikbaar is. Het is nuttig bewust te zijn van de aanwezigheid van dit continuüm. Zeker om het begrip van documentatie en archieven en de acties die daaromheen worden uitgevoerd, te vergroten.

Uitgangspunt van de theorie is dat als veel mensen tegelijkertijd gegevens gebruiken en (zelf) bijhouden, het in de loop van de tijd voor meerdere doeleinden wordt overgedragen (Pearce-Moses, 2005). Deze aanpak betekent dat een archiefstuk in wezen actief blijft en in de loop van de tijd zelfs groeiende bewijskracht en historische waarde bezit. Het concept stelt ons in staat archiefbewaarders te zien als bijdragers aan een voortdurend intellectueel proces dat wordt toegepast op de archiefstukken binnen de organisatie. Op die wijze wordt iedereen in een organisatie tot op zekere hoogte archiefbeheerder en moet de verantwoordelijkheid nemen voor de gezondheid van de archiefdocumenten die zij creëren, gebruiken, delen en bewaren.

Creëer, verifieer, archiveer en gebruik

Het idee van het data-continuüm verbindt het einde van een lifecycle weer met zijn begin. Of het begin van één of meer andere lifecycles. Net als de cirkel ‘plan-do-check-act’ een continue werkvolgorde waarmee je telkens, opeenvolgend of als in een spiraal, een hoger niveau bereikt. Net zoals de stelling ‘met geld kun je geld maken’, kun je stellen dat je met data (nieuwe) data kunt maken. Elke nieuwe informatie, in de vorm van een betekenisvolle dataset, kan de bron zijn voor nieuwe informatie. Maar ook een referentie of een bewijs zijn voor andere informatie. Als een stamboom met blijvende voorouders zich opsplitst in steeds verdere vertakkingen, sommige zonder nakomelingen lopen dood maar andere kunnen eeuwig voortgaan.

Als we document- of contentmanagement zien als lifecycle management van één enkele cycle, dan kun je archiefmanagement zien als lifecycles ‘opgerold’ in een data-continuüm. Net als de PDCA cirkel nu als een cirkel met ‘Creëer, Verifieer, Archiveer en Gebruik’. In feite de basis van configuratie en toepassingsbeheer bij producten (work, verify, release, use). Uit elk onderdeel kan óf een aangepast onderdeel voortkomen óf het kan in een andere samenstelling worden gebruikt. De huidige tijd van ‘hergebruik’ laat onderdelen zelfs een tweede of derde leven krijgen. Daarom is het steeds belangrijker de broninformatie over die eerste creatie te hebben. Dat is te garanderen door te archiveren bij de bron als onderdeel van datacentrisch werken.

Archiveren bij de bron

In eerder blogs heb ik het digitaal archiveren bij de bron al als een verrassende paradigma verandering beschreven in het huidige veld van de vele document- en contentmanagement systemen. Ieder gericht op zijn eigen werkgebied en ingericht om zelfstandige en eenmalige lifecycles te managen. Gebaseerd op de idee die we jaren tachtig en negentig hadden met een digitaliserende mindset: bestaande, losstaande processen digitaal maken. In plaats van het proces integraal in te richten ómdat je in een werkelijk digitale omgeving nu eenmaal totaal anders kunt en moet werken. Dat leidde tot het begrip van datacentrisch werken, echter met in het achterhoofd dat dan ook alles, ook proces, werkwijzen en architectuur op die volledig digitale omgeving is ingericht. We zitten nu in de overgangsfase van deels digitaal naar volledig digitaal. Bij volledig digitaal hoort digitaal archiveren bij de bron ook bij.

Door: Hans Timmerman (foto)

Dutch IT Security Day BW tm 15-10-2024 Gartner BW tm 02-11-2024
Huawei BN+BW 05-09-2024 tm 13-09-2024