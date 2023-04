Databricks heeft een dataset naar buiten gebracht die de training van AI-modellen moet steunen. Het softwarebedrijf hoopt de ontwikkeling van AI te promoten om zo nieuwe klanten te werven.

De data bestaat uit de antwoorden op 15.000 vragen die 5000 medewerkers van het bedrijf in 40 landen hebben gegeven. De gegevens zijn volgens het bedrijf goed doorspit om de kwaliteit te garanderen. Hoewel CEO Ali Ghodsi toegeeft dat de dataset niet perfect is, hoopt hij dat er concurrenten voor OpenAI’s succesvolle ChatGPT beschikbaar worden.

Promotie

Deze promotie van AI-training zal voor Databricks mogelijk goede marketing zijn. Het Amerikaanse bedrijf kent een divers aanbod aan services. Naast de lakehouse-producten die het blijft uitbreiden, is AI een groeiend onderdeel van diens services.

In tegenstelling tot een algemene generatieve AI zoals GPT-4, wil Databricks LLM’s inzetten voor specifieke doeleinden. Daarnaast houdt OpenAI de dataset waarop GPT-4 gebaseerd is geheim. Databricks probeert een andere aanpak te ondersteunen voor klanten die AI in een nauwere zin willen inzetten. Dit wordt inmiddels door veel verschillende bedrijven gedaan, waarvan GitHub’s Copilot X-diensten een voorbeeld zijn. Met diens onderzoeksmodel Dolly wil Databricks laten zien wat mogelijk is met LLM’s getraind op eigen datasets.