Tao, data en de tuinarchitect
Stel dat we – heel filosofisch – data zouden vergelijken met Tao. De Tao als actieve bron waaruit we informatie maken. Data als Tao om uit chaos ordelijke boodschappen te creëren. Voor veel westerlingen is Tao alleen bij benadering te begrijpen. Tao geeft een actieve holistische weergave van de wereld. In tegenstelling tot de westerse metafysische wereld, die statisch en analytisch is opgebouwd. In de opgetekende tekst van Lao Zi: “De essentie van Tao is dat het niet uitgedrukt kan worden.” Tao is het beginsel, de bron, oorzaak of oorsprong van al het bestaande. Het is een cirkelgang en creëert gewenste ordelijke patronen in de chaos. Zoals de natuur uit atomen en moleculen elke keer weer nieuw leven, nieuwe patronen en nieuwe vormen creëert. Zoals we telkens weer nieuwe informatie en kennis creëren uit de intussen oneindige hoeveelheid data die er is.
Bron van het al
Als filosofisch begrip is Tao de alomvattende, uit zichzelf bestaande, oneindige, tijdloze kosmische eenheid. De bron van alles én de bestemming van alles zonder begin en zonder einde. Het benadrukt de fundamentele en werkelijke natuur van de wereld. De magische kracht die maakt dat alles groeit en bloeit. Een mini zaadje ontwikkelt zich en wordt een boom. Planten, bomen en dieren groeien uit zichzelf. We kunnen een plant niet dwingen hier een tak, daar een blaadje en daar een bloem te maken. De natuur laat zich lastig dwingen, zoals we in onze metafysische wereld zo graag willen. De mens die de natuur de baas is.
Maar de natuur laat zich wel leiden en zeker ook verleiden. Een jong plantje kunnen we leiden naar de vorm die we willen of mooi vinden. Ongewenste takken wegsnoeien of te verleiden in de gewenste richting en vorm te groeien. Dat is de basis van Tao: het levende met minimale inspanning de gewenste richting te laten kiezen. Als we dat idee los laten op de groeiende data-hoeveelheid die we met elkaar creëren, liggen interessante mogelijkheden te wachten. In grote big data lakes waar we verschillende soorten data bijeenbrengen, zien we wisselende ‘data-dichtheden’ ontstaan. Net als het oneindige heelal waar we wisselende massa-dichtheden zien in de vorm van miljoenen super nova’s en sterrenstelsels.
Data dichtheden en visualisatie
Er zijn vele technieken om data te visualiseren, om complexe datasets om te zetten in visuele weergaven. De meest bekende zijn grafieken en diagrammen. Maar hoe complexer de datasets worden, hoe lastiger het is data te visualiseren. Het nut van visualisatie is, dat onze menselijke hersenen beelden 60.000 keer sneller verwerken dan tekst. In de neurowetenschap maakt men visuele mappings van verschillende MRI-scans om anomalieën te ontdekken. En te ontdekken waar – mede door datagravity, de aantrekkingskracht van data – de data-dichtheid anders en intensiever is. Juist dat zijn de plaatsen waar iets gebeurt, waar het interessant is en waar wellicht iets nieuws te vinden is. Met een open blik omdat we – net als ons heelal – nooit alles kunnen weten en (over)zien.
‘Exploratory Data Analysis’ (EDA) helpt bij bijvoorbeeld bij kankeronderzoek in het voorspellen van overlevingskansen door patronen van data-dichtheden te ontrafelen, afwijkingen te identificeren en betekenisvolle inzichten te te extraheren. Of MRI’s van verschillende kankersoorten met elkaar te vergelijken en overeenkomsten en verschillen te ontdekken. Het gebruik van verschillende EDA-technieken blijkt van groot belang bij het bereiken van betekenisvolle inzichten die het ontstaan van kanker verhelderen. Ons inzicht in potentiële overlevingskansen vergroten. Op deze wijze staat data ons ter beschikking bij de kern van ons leven: onze gezondheid. En waarbij we ons als Tao volledig openstellen in wat data ons allemaal nog meer kan vertellen.
De tuin als dataverzameling
We hebben de architectuur van levende en dode materie. De architectuur van een gebouw of huishouding is meestal gebaseerd op onze metafysische westerse inzichten. We bouwen een huis en richten het daarbinnen in voor de geplande huishouding. Maar een landschap- of tuinarchitectuur heeft heel andere vertrekpunten. Hoe gaan we levende natuur in een vorm of toepassing krijgen, opdat ze voldoet aan wat we willen? En alle natuur heeft legacy: bestaande gebieden, bossen, grasland en zandvlaktes. Elke landschap- en tuinarchitectuur is eigenlijk altijd een transformatieproces. Hoe verander ik het bestaande in iets nieuws en doelmatigers?
Bij het inrichten van een tuin moet rekening worden gehouden met bestaande bomen, volwassen planten en bodemstructuur. Ook met het gegeven dat een nieuwe boom of struik niet morgen al tot volle wasdom komt. Het eindbeeld van de gewenste architectuur zal zich pas in de loop der jaren ontwikkelen. Met daarbij een plan hoe de natuur die vormen te laten krijgen door te snoeien en te (ver)leiden. Tuinarchitectuur is doorspekt met Taoïsme. In harmonie tot de groeiende, uitdijende natuur uiteindelijk de vorm en inrichting krijgt, die gewenst is. Met liefde leiden, verleiden, gericht snoeien en het gewenste in standhouden.
Taoïstisch data-omgevingen inrichten
Bovenstaande redenering verklaart tevens waarom data-architecturen vaak zo lastig zijn te realiseren. Ze kunnen niet op onze analytische westerse wijze met atomen en moleculen worden gebouwd, maar we moeten ze op een natuurlijke wijze laten groeien tot wat we willen. Dat vraag een ‘oosters tintje’ aan dit vakgebied: begrijpen hoe data groeit, hoe we liefdevol verleiden, soms dwingend leiden en gericht snoeien naar de omgeving die we willen. En het tijd gunnen om tot rijpheid en volwassenheid te komen. Inclusief regelmatig schoffelen en onderhoud om het niet te laten verwilderen. En ongewenst onkruid op tijd verwijderen.
Misschien is het woord ‘datatuin’ wel eens een mooi woord om over data-omgevingen te spreken en de architecten en inrichters te zien als tuinarchitect en tuinman of -vrouw. Het vormen en instandhouden van een levende omgeving, waaruit men de gewenste informatie kan creëren en uitwisselen. Datagroei is dan fijn en iets natuurlijks, want op die wijze kan men het in de meest gewenste vorm laten groeien. Mits men op tijd snoeit, schoffelt en oude takken en bladeren ook inderdaad opruimt. Elke tuin zonder onderhoud verwildert in korte tijd. Een niet onderhouden data-omgeving ook. Data zonder Tao eindigt in chaos.
Organiseren en structureren
In dit wat filosofisch blogje eindig ik natuurlijk, zoals altijd, bij het organiseren en structureren van data-omgevingen. Net als de tuinarchitect paden en vaste vormen creëert waar het geheel zich aan te houden heeft. Een kasplantje mag in eerste instantie vrij groeien, maar zodra deze een vaste plek en toepassing in de datatuin heeft gekregen, moet deze zich aan de geldende richtlijnen aldaar houden. Data – vers uit de kas – wordt eenduidig gearchiveerd en kan vervolgens levenslang door iedereen voor het ooit gewenste doel worden gebruikt.
Je kunt archiveren van data zien als het afsluiten van de initiële groei van een dataproduct dat daarmee formeel vastgelegde en vrijgeven informatie is geworden. Vrijgegeven voor het gewenste gebruik en vrij om zelfstandig verder te groeien. Vrijgegeven omdat het aan kwaliteitscriteria voldeed en de vrije wereld in mag. Vrijgegeven omdat het daarmee voor de toekomst is geborgd. Archiveren is het moment dat een plant, struik of boom de kwekerij kan en mag verlaten. Door een tuinarchitect op de geplande plek en positie kan worden gepland. Daar naar zijn toekomstige volwassenheid groeit. En een knipoog naar een wat meer Taoïstische kijk op datamanagement. Niet alles is maakbaar in dit leven. Soms moeten we het de tijd en de koesterende en liefdevolle verleiding geven om uiteindelijk tot volwassenheid te komen. Waarbij voortdurend snoeien, schoffelen en onkruid verwijderen een must blijft... 🙂
Door: Hans Timmerman (foto)