Sites kunnen nu OpenAI-data scraping blokkeren, is dat verstandig?
OpenAI heeft onthuld hoe de eigen web crawler te identificeren is. Voortaan kunnen websites de GPTBot user agent blokkeren als ze dat willen. Daarmee kunnen ze mogelijk ervoor zorgen dat ze niet gebruikt worden ter training van een toekomstige LLM van OpenAI, maar is dat wel aan te raden?
In de ... Lees meer
Overture Maps komt met eerste wereldwijde dataset
De Overture Maps Foundation (OMF) heeft voor het eerst een dataset onthuld die de gehele wereld in kaart brengt. Versie 2023-07-26-alpha.0 komt met vier lagen aan open mapping-data: Places of Interest, Buildings, Transportation Network en Geopolitical Boundaries.
Het samenwerkingsverband tussen ... Lees meer
Databricks gaat met MosaicML-overname meer richten op custom AI
Databricks gaat MosaicML voor 1,3 miljard dollar (1,18 miljard euro) overnemen. Het heeft daarmee een veelbelovende speler op de AI-markt te pakken.
Databricks hoopt de deal in juli te voltooien en alle 64 MosaicML-medewerkers te verhuizen naar de eigen kantoren. Beide bedrijven bevinden zich in... Lees meer
SentinelOne introduceert dataplatform DataSet
SentinelOne heeft DataSet gelanceerd. Met het dataplatform kunnen bedrijven in real time grote hoeveelheden data verwerken, analyseren, beveiligen en beheren.
DataSet bouwt voort op de technologie van het overgenomen Scalyr en de technologie die afkomstig is uit het SentinelOne Singularity XDR-p... Lees meer
Microsoft komt met nieuwe Datasetshub binnen Power BI
Power BI wordt voorzien van een nieuwe Datasetshub. Dit heeft Microsoft aangekondigd. Het gaat om zowel Power BI als de app ervan binnen Teams. Met de nieuwe hub kun je snel datasets vinden en gebruiken.
Je kunt de datasets in verschillende situaties gebruiken. Zo kunnen de eigenaren van dataset... Lees meer
Salesforce bedenkt manier om AI-bias aan te pakken
Onderzoekers van Salesforce en de University of Virginia hebben een manier bedacht om gender bias (gendervooroordelen) te verminderen binnen zogeheten word embeddings. Word embeddings worden gebruikt om AI-modellen te trainen voor het samenvatten, vertalen en uitvoeren van andere voorspellingstaken... Lees meer
Adobe introduceert nieuwe AI services voor Experience Cloud
Adobe introduceert vijf nieuwe AI-services voor Experience Cloud. De services worden aangedreven door Adobe's eigen AI-tool Sensei en zijn bedoeld om bedrijven te helpen AI te gebruiken voor het voorspellen van datasets.
Adobe kondigde een set van vijf nieuwe diensten aan voor Experience... Lees meer
Techgiganten geven dataset voor onderzoek naar coronavirus vrij
Een groep Amerikaanse techbedrijven en organisaties hebben de dataset COVID-19 Open Research Dataset (CORD-19) gepubliceerd. Met de dataset krijgen onderzoekers toegang tot populaire wetenschappelijke bronnen rond het coronavirus, om hun gevecht tegen het virus te ondersteunen.
CORD-19 bestaat u... Lees meer
Google wil AI-ontwikkeling bevorderen met nieuwe Open Images-versie
Google heeft een nieuwe versie beschikbaar gemaakt van Open Images, de foto-dataset die helpt bij kunstmatige intelligentie (AI)-projecten. Er komen extra mogelijkheden bij voor het labellen van objecten en een feature die men omschrijft als 'localized narratives'.
Open Images stelt miljoen foto... Lees meer
IBM lanceert machine learning-dataset hub voor enterprises
IBM heeft een repository met gratis en open datasets voor machine learning gelanceerd, genaamd Data Asset eXchange (DAX). Volgens Big Blue is DAX specifiek samengesteld voor enterprise-organisaties.
DAX biedt alleen datasets van hoge kwaliteit en duidelijk gedefinieerde open data-licenties in g... Lees meer