Martijn Kregting - 16 april 2023

Databricks brengt open source taalmodel voor chatbots uit

Het Amerikaanse softwarebedrijf Databricks heeft Dolly 2.0 uitgebracht. Het zou het eerste open source taalmodel voor commercieel gebruik zijn en kan volgens Databricks de basis vormen voor gratis of open source-concurrenten van chatbots als ChatGPT.

Databricks brengt open source taalmodel voor chatbots uit image

Dolly 2.0 is een tekstgenerator, een ‘large language model’ (llm) dat chatbots kan aansturen en tekst kan samenvatten of zoekopdrachten uitvoeren. Qua functie lijkt ze sterk op andere llm’s die de afgelopen maanden zijn gelanceerd of aangekondigd - waarvan ChatGPT waarschijnlijk de bekendste is. Speciaal aan Dolly 2.0 zou dus zijn dat ze open source is, en dat onafhankelijke ontwikkelaars en bedrijven een gratis licentie op de dienst kunnen nemen om het in commerciële producten in te bouwen.

De AI-toepasssing is een doorontwikkeling op de eerste Dolly, die in maart dit jaar uitkwam. Het bedrijf achter de llm is Databricks, een enterprise softwarebedrijf dat gespecialiseerd is in Apache Sparks. "We willen meer open en transparante taalmodellen op de markt omdat we willen dat bedrijven met AI hun eigen chatbots en apps kunnen bouwen, trainen en bezitten, op basis van hun eigen datasets", stelt Ali Ghodsi, CEO van Databricks, tegenover techsite TechCrunch.

Geen restricties

Opvallend is dus dat Dolly 2.0 het eerste generatieve AI-model is dat zonder restricties op de markt wordt gebracht. Bedrijven die met ChatGPT willen werken, bijvoorbeeld, betalen voor de API en gaan vaak ook data moeten delen. Met een open source-model moet het systeem voor meer bedrijven bruikbaar worden.

Overigens lijkt Dolly 2.0 ook de nadelen te hebben die andere llm’s tonen. Zo zou het algoritme vooral Engels spreken, en heeft het de neiging feiten te verzinnen. Verder zouden antwoorden soms kwetsend overkomen.

Tegengas

De ontwikkeling van generatieve AI is de laatste maanden in een stroomversnelling terechtgekomen, met meerdere tech-bedrijven (zoals Microsoft, Alphabet en AWS) die zich op de markt proberen te positioneren. De taalmodellen krijgen echter ook tegengas. Zo zijn er vragen over de bronnen waarop deze modellen zijn getraind, en of de makers van die data daar toestemming voor hebben gegeven.

Internationale experts zijn een petitie begonnen waarin ze vragen de ontwikkeling een tijdlang te pauzeren. In Italië mag ChatGPT inmiddels geen gebruik meer maken van Italiaanse databronnen. In Europa en de VS worden vanuit diverse hoeken onderzoeken gestart om te bepalen of er nadere standaarden of raamwerken nodig zijn voor AI-gebaseerde chatbots.

Dit artikel is geschreven in samenwerking met Datanews.

Axians 12/11/2024 t/m 26/11/2024 BN+BW