Redactie - 18 juli 2024

Microsoft wil AI-model inzichten uit spreadsheets laten destilleren

Spreadsheets bevatten heel veel data, maar zijn moeilijk te begrijpen voor een AI-model. De techgigant wil daar verandering in, maar dat blijkt ingewikkelder dan verwacht.

Microsoft wil AI-model inzichten uit spreadsheets laten destilleren image

Onderzoekers van Microsoft hebben een platform gebouwd dat het makkelijker moet maken voor large language models (LLM’s) om de inhoud van spreadsheets te analyseren. Het spreadsheet is dan wel het geprefereerde werkmodel van veel boekhoudkundigen, intuïtief in gebruik is het systeem niet. Dat merken onderzoekers nu ook wanneer ze er een LLM op loslaten.

Moeilijk leesbaar voor AI-model

In een rapport meldt Microsoft dat spreadsheets voor veel bedrijven enorme hoeveelheden data bevatten, maar dat ze moeilijk leesbaar zijn voor een AI-model. De grote hoeveelheid rijen en kolommen ‘voegen weinig toe om de layout en structuur van de data te begrijpen’, aldus de onderzoekers. Dat maakt het lastig voor generatieve AI om er aan uit te kunnen (en ook voor de meeste mensen, laten we eerlijk zijn).

Om daar wat aan te doen, komen de onderzoekers nu met een analysetool, SpreadsheetLLM, dat die data via AI moet catalogeren. Het neemt daarvoor onder meer het ‘celadres’ en andere contextdata mee, waardoor het large language model hopelijk de gegevens de juiste waarde toedicht.

Met die methode liep het onderzoek echter tegen een nieuw obstakel aan: de hoeveelheid tokens of hoeveelheden data die een LLM realistisch gezien kan bevatten. Daarom bouwden de onderzoekers nog met een tweede framework: SheetCompressor. Die tool moet de data eerst samenvoegen tot een kleinere vorm. Op die manier zouden de hoeveelheid tokens die uit een werkblad gehaald worden, gekrompen kunnen worden tot 96%.

Assistent voor spreadsheets bouwen

Bedoeling van het hele framework is om bedrijven uiteindelijk de optie te geven om met generatieve AI een assistent te bouwen die ook spreadsheets aankan. Die zou dan bijvoorbeeld gebruikers kunnen toelaten om via menselijke taal de data van een spreadsheet te bevragen en analyseren, zonder zich blind te staren op een muur van cijfertjes.

In samenwerking met Data News

DIC Awards BW tm 21-10-2024 Dutch IT Security Day BW tm 15-10-2024
DIC Awards BN tm 21-10-2024