09 oktober 2024

Bibliotheek of archief? Of beide?

Door bronarchivering vervaagt vervaagt het verschil tussen bibliotheek en archief. De termen “digitale bibliotheek” en “digitaal archief” verwijzen naar twee concepten in het domein van digitaal informatiebeheer, die elk een eigen doel en publiek dienen. Deelverzamelingen van informatie die elkaar overlappen. Bibliotheken bewaren vanouds gepubliceerde documenten die nog actief in gebruik zijn en door vele mensen worden ingezien. Archieven verzamelen daarnaast ook ongepubliceerde documenten ‘er omheen’ om de verantwoordingsplicht van een organisatie te waarborgen en het institutionele en culturele geheugen te behouden. Hoewel zowel digitale bibliotheken als digitale archieven toegang bieden tot digitale inhoud, richten digitale bibliotheken zich op brede toegang en een verscheidenheid aan bronnen voor actief gebruik, terwijl digitale archieven nadruk leggen op lange termijnopslag van historisch significante materialen in hun context.

Archiving & compliance Data Artificial intelligence

Digitale bibliotheken en archieven lopen in elkaar over

Een document start met de creatie ervan en bevat input van één of meer auteurs. Om het document in een proces te kunnen managen, wordt metadata (zoals naam auteur, datum, documenttype, reden van creatie) toegevoegd om het gedurende de levenscyclus te kunnen beheren. Zodra het document zijn eindversie bereikt, volgt controle, goedkeuring en formele vrijgifte voor gebruik. Vrijgegeven documenten worden in bibliotheken beschikbaar gesteld voor makkelijke toegang en bruikbaarheid. Digitale archieven zijn gericht op het bewaren en opslaan voor langetermijntoegang, inclusief bijbehorende historische en contextuele data. Hoe beter bij c.q. voor de creatie van een document álle metadata voor toekomstig gebruik – dus ook het archiveren – wordt aangemaakt, hoe makkelijker en sneller archivering gaat en zelfs automatiseerbaar wordt.

Bibliotheek en archief verschillen in die zin ‘slechts’ van inhoud, recentheid en gebruik. Een bibliotheek als verzameling van dagelijks bruikbare kennis en informatie. Archieven bieden vaak ook toegang tot ongepubliceerde procesinformatie om de verantwoordingsplicht van de overheid te waarborgen en het institutionele en historische geheugen te behouden. De context van en relaties tussen de verzamelde en opgeslagen digitale informatie. Historisch onderzoek wil immers graag informatie kunnen plaatsen in de tijdgeest en feitelijke situatie ten tijde van de creatie van die informatie. We zien dat voor parlementaire enquetes en internationale tribunalen ook die context van documenten, berichten, besluiten en gebeurtenissen nodig is. De verplichting voor chat-archivering zoals sms en whatsapp is hier een voorbeeld van.

Bronarchivering ondersteunt beide concepten

Een document dat wordt gecreëerd, is meestal ‘opgeslagen’ in een contentmanagement systeem zoals Opentext, Documentum of Filenet, of documentsysteem zoals Sharepoint, Office 365 of Google cloud. Hier creëert de auteur het document en wordt beschikbaar voor co-creatie, dossiervorming en vrijgifte voor publicatie. Zodra een document of dossier is vrijgegeven, kan het zowel in digitale bibliotheken als archieven worden geïmporteerd voor verder gebruik in de lifecycle. In het content- of documentsysteem bewaren heeft alleen zin als het vanuit dat systeem nog actief wordt gebruikt c.q. voor nieuwe documenten van belang is..

Om een document in zijn levenscyclus te kunnen managen – en dit proces te automatiseren – is het nodig dat alle minimale metadata van het document vóór de inhoudelijke creatie wordt gestart. Zonder die ‘verplichte minimale’ metadata mag immers geen enkel document worden vrijgegeven of gearchiveerd. In hoogwaardige engineering processen kan zonder volledige lifecycle metadata toevoeging, zelfs geen enkel digitaal document worden aangemaakt (ISO 10303 *). Verplichte metadatering vooraf, inclusief verificatie of auteur(s) – gezien rol en kwalificatie – überhaupt met het systeem zo’n type document mogen aanmaken en bewerken. De basis van procesgerichte kwaliteitsborging voor het verdere lifecycle beheer van die documenten of dossiers.

Op dat moment is bronarchivering mogelijk. Elk vrijgegeven document wordt niet alleen vrijgegeven voor gebruik maar ook direct formeel gearchiveerd. En geborgd beschikbaar voor elk digitaal gebruik in de rest van de levenscyclus die decennia of zelfs eeuwen kan zijn. De uitdaging van bronarchivering is dat zo’n archiefsysteem werkelijk alle digitale documenten en materialen moet kunnen importeren, metadateren en geborgd opbergen. En ook nog over alle bestaande en gebruikte content-, document- en zaaksystemen en applicaties heen.

Onder regie van de archivaris

Bronarchiveren vindt plaats onder regie van een archivaris, opdat gearchiveerde documenten of dossiers voldoen aan de archiefwet. Daarnaast is het interessant dat – potentieel publieke – documenten in het kader van privacywetgeving worden gedepersonaliseerd. Eventueel nog gepersonaliseerde versies blijven dan voor een beperkte groep gebruikers vertrouwelijk beschikbaar, zoals voor waarheidsvinding en strafrechtelijk onderzoek. Door een vrijgegeven document gelijk te depersonaliseren, is deze versie voor later ‘open gebruik’ beschikbaar en kan achteraf ‘zwartlakken’ worden voorkomen. Liefst ook direct een kleine ‘thumbnail’ versie van het document creëren ten behoeve van het makkelijk doorzoeken van het digitale archief.

Bronarchivering omzeilt nog een hindernis: het probleem dat documenten in verschillende silo’s van (departementale) organisaties zijn opgeslagen. Zowel systeemtechnisch als vanuit wet of privacy zijn op dit moment veel documenten ambtelijk niet makkelijk deelbaar en/of uitwisselbaar. Dit kwam naar boven in de toeslagenaffaire, waarbij behandelend ambtenaar en betreffende toeslag-ouder niet over een gedeeld dossier beschikten. Beiden wisten derhalve niet wat ze van elkaar wisten of (nog) niet wisten. Deze informatie-ongelijkheid was een belangrijke reden voor de vele rechtszaken, waarbij pas tijdens de rechtszaak het volledige dossier ‘op tafel’ kwam’. Als toen – naast bronarchivering – ook individuele dossierdeling tussen overheid en burgers had bestaan, was dit alles nooit in deze mate ontspoord.

Arqiver is ontstaan uit de toeslagenaffaire

Ernstige gebeurtenissen zijn vaak de reden voor het ontstaan van niet eerder bestaande oplossingen en producten. ArQiver is zo’n voorbeeld, dat nooit door één van de huidige leveranciers van contentmanagement- of documentsystemen had kunnen worden bedacht of ontwikkeld. Immers een generieke oplossing die als een ‘laag’ over een heel segment aan document-applicaties heen wordt gelegd, kan vanuit concurrentie aspecten nooit door één van die gebruikte aanbieders worden aangeboden. Dat maakt ArQiver al uniek.

Daarnaast is het als pure SaaS dienst – in combinatie met een zero-trust gebaseerde, mobiele app voor dossier-deling – enorm veilig, mede omdat het gebaseerd is op individuele, persoonlijke identificatie via mob.id voor zowel de betrokken burger als de betrokken ambtenaar. Hierdoor kan ook persoonlijke toestemming worden gegeven voor het delen van privacy-gevoelige informatie. Dat maakt ArQiver nog unieker.

De krachtige interne, op Clojure gebaseerde engine van ArQiver drijft de AI-ondersteunde templates aan voor het parametriseren van alle datastromen, functionele rollen en actieve metadatering die nodig zijn voor het (kunnen) automatiseren van vele miljoenen documenten en chats per dag. Terwijl na die archivering alle informatie beschikbaar is voor breed publiek gebruik, nieuwe dossiervorming en/of brononderzoek en waarheidsvinding.

Het een stap richting quantumveilige Web3 gebaseerde, decentrale toepassingen gericht om veilig peer-to-peer met elkaar kunnen communiceren en dossiers te delen. Passend in de wereld van open data, data act, data spaces en e-wallets voor passwordloze authenticatie, gebaseerd op biometrische, soevereine digitale identiteiten. Een logische stap voor een moderne en open overheid die zijn individuele contacten met zijn burgers op een superveilige wijze hoog op de agenda wil stellen . . .

*) ISO 10303

ISO 10303, ook bekend als STEP (Standard for the Exchange of Product model data), is een internationale norm voor de representatie en uitwisseling van productgegevens. De primaire focus is het bieden van een uitgebreide manier om de volledige productgegevens gedurende de levenscyclus te beschrijven. ISO 10303 richt zich voornamelijk op de uitwisseling van industriële gegevens, specifiek in de context van productie en engineering.

Met betrekking tot archivering definieert ISO 10303 normen voor de langdurige opslag van digitale productgegevens, zodat productinformatie kan worden gearchiveerd en teruggevonden zonder dat de integriteit, bruikbaarheid en relevantie ervan verloren gaat. Archivering onder ISO 10303 richt zich op het waarborgen dat gegevens met betrekking tot productontwerp, productie en engineering toegankelijk en herbruikbaar blijven, zelfs als de software of systemen die zijn gebruikt om de gegevens te maken verouderd raken.

De auteur heeft in de jaren 1996-2004 in het NATO-CALS project PLCS actief bijgedragen aan het ontstaan van deze standaard.

Door: Hans Timmerman (foto)

Tip de redactie

Bibliotheek of archief? Of beide?

Digitale bibliotheken en archieven lopen in elkaar over

Bronarchivering ondersteunt beide concepten

Onder regie van de archivaris

Arqiver is ontstaan uit de toeslagenaffaire

Meer van Data & Artificial Intelligence

Dutch IT events

Meer over Archiving & Compliance