OpenAI brengt AI-agent uit die zelfstandig online taken kan uitvoeren
OpenAI introduceert Operator, een AI-agent die zelfstandig taken op het web kan uitvoeren via een eigen browser. Operator kan websites bekijken en ermee interacteren door te typen, klikken en scrollen. Het systeem is bedoeld voor repetitieve taken zoals het invullen van formulieren en bestellen van producten.
De nieuwe assistent maakt gebruik van het Computer-Using Agent (CUA)-model, dat GPT-4o’s visuele capaciteiten combineert met geavanceerde redeneermogelijkheden. Hierdoor kan Operator werken met grafische gebruikersinterfaces (GUI’s) zoals knoppen, menu’s en tekstvelden. Het systeem is in staat om zelfstandig problemen op te lossen. Indien het daarbij vastloopt, bijvoorbeeld door inlogpagina's of CAPTCHA's, geeft het de controle terug aan de gebruiker.
Nog niet in Nederland beschikbaar
Operator is voorlopig beschikbaar voor Pro-gebruikers in de VS via operator.chatgpt.com. Het systeem stelt gebruikers in staat om workflows te personaliseren met aangepaste instructies en opgeslagen prompts, bijvoorbeeld voor herhaalde taken zoals boodschappen bestellen. Meerdere taken kunnen tegelijk worden uitgevoerd, zoals het boeken van een camping en het bestellen van een gepersonaliseerde mok.
Hoewel Operator nog in een vroeg stadium verkeert, meldt OpenAI dat het al hoge scores behaald in browserbenchmarks zoals WebArena en WebVoyager. Het AI-bedrijf plant verdere uitbreidingen naar andere gebruikersgroepen en een toekomstige integratie in ChatGPT. Ook wil het Operator op basis van feedback van gebruikers verbeteren. Meer informatie is hier beschikbaar.