Stichting Brein heeft opnieuw een Nederlands taalmodel offline laten halen vanwege vermoedelijke auteursrechtschending. Het model, gebaseerd op Mistral-7B, zou zijn getraind op miljarden tokens aan Nederlandstalige content zonder duidelijke licenties. Het is niet bekend om welk model het gaat.
Een week na het offline halen van GEITje-7B heeft Brein wederom ingegrepen bij een AI-taalmodel dat mogelijk auteursrechtelijk beschermd materiaal gebruikte. De maker van het model gaf in de documentatie aan dat het getraind was op “vele miljarden tokens aan Nederlandstalige literatuur, nieuws en studieboeken”, zonder specificatie van bronnen of licenties.
Deze actie past in een bredere ontwikkeling waarbij auteursrechten een existentiële crisis veroorzaken voor generatieve AI. BREIN benadrukt niet tegen AI-ontwikkeling te zijn, maar stelt dat er wel toestemming en vergoeding nodig is voor het gebruik van beschermd materiaal.
“Uiteindelijk gaat het erom dat ook de tech-industrie zich aan de wet houdt en auteursrechten respecteert. Makers en producenten moeten een eerlijke boterham kunnen verdienen en (big) tech moet voor het gebruik van materiaal van anderen gewoon betalen, net zoals ieder ander”, legt Brein-directeur Bastiaan van Ramshorst uit.
Medewerking
De modelmaker besloot het taalmodel offline te halen na vragen van BREIN over de herkomst van de trainingsdata en of de maker wel een licentie had om de data op een dergelijke manier te verzamelen en verwerken. Als de rechten zouden ontbreken, moest het model offline – anders dreigde een rechtsgang. Brein stelt dat de maker zonder verdere inhoudelijke discussie besloot het taalmodel offline te halen.