Databricks optimaliseert uitrollen LLM's op Lakehouse-platform

Databricks heeft onlangs een preview uitgebracht van GPU- en LLM-optimalisatie voor Model Serving. Hierdoor wordt het uitrollen van grote AI-modellen op het Lakehouse Platform makkelijker.

De in preview getoonde GPU- en LLM-optimalisatiefunctionaliteit voor Model Serving biedt automatische optimalisatie voor zogenoemd LLM Serving en het afleveren van hoge prestaties hiervoor zonder menselijke configuratiehandelingen.

De functionaliteit is volgens Databricks de eerste serverless GPU die op een unified data- en AI-platform is gebouwd. Dit moet eindgebruikers in staat stellen vooral generatieve AI-oplossingen naadloos binnen een enkel platform te ontwikkelen, vanaf data-ingestie tot aan de uitrol van modellen en de monitoring ervan.

Met de functionaliteit kunnen gebruikers een veelvoud aan AI-modellen uitrollen. Denk daarbij aan natural language-modellen, computer vision-modellen, audio-modellen of tabel- of aangepaste modellen.

Hierbij maakt het volgens Databricks niet uit hoe ze zijn getraind en met welke soort gegevens.

Minder latency en kosten

Via Model Serving uitgerolde LLM-modellen zouden tot 3,5 keer minder latency hebben en eveneens minder kosten. Ook wordt tot 2,5 keer meer throughput bereikt.

In de preview optimaliseert Databricks Model Serving met de GPU- en LLM-optimalisatie nu automatisch MPT- en Llama 2-modellen. In de nabije toekomst worden hier de andere mogelijke modellen aan toegevoegd.

Lees meer: Databricks haalt in recente investeringsronde half miljard dollar op

Keuze van de redactie

Insight: IT in Healthcare

Lees meer over Data Management

PQR neemt data management-speler E-Storage over

PQR kondigt de overname aan van E-Storage, dat zich bezighoudt met data availability en cyber recovery. Met d...

Berry Zwets 26 juni 2025

Rubrik koopt agentic AI-platform Predibase

Rubrik neemt Predibase over om bedrijven te helpen bij de overgang van AI-prototypen naar productieklare toep...

Berry Zwets 26 juni 2025

Expert aan het woord

Soevereine cloud en data-eigenaarschap: weet u wie er toegang heeft tot uw metadata?

Cloud is niet zomaar cloud. Veel organisaties denken bij het woord "soevereiniteit" nog te snel aan wet- en r...

PQR 25 juni 2025

Tech calendar

Databricks optimaliseert uitrollen LLM’s op Lakehouse-platform

Minder latency en kosten

Blijf op de hoogte, abonneer!

SAP-CEO vindt massale AI-uitbouw EU niet nodig, is dat terecht?

Info Support doorbreekt legacy-impasse met AI

Ingram Micro al bijna dag onbereikbaar door storing

Siemens voegt AI-copilot en VR-functies toe aan NX-software

Kinderen met autisme maanden eerder behandeld dankzij process automation

Primeur: Nvidia-supercomputer in Nederland voor zorg-AI Juvoly

Uitdaging voor zorgorganisaties: Hoe haal je efficiënt waarde uit de explosieve groei van data?

AI-scanner spoort huidkanker vliegensvlug op

GITEX DIGI_HEALTH 5.0 - Thailand

IT Arena

Innovation Week 2025

Luxembourg Venture Days

Appdevcon

Webdevcon

Verbeter je digitale ervaringen met de Cisco AI Assistant

Ervaar gratis Synology’s nieuwste enterprise backup-oplossing

Versnel je AI-succes met NVIDIA AI Computing van HPE

Versterk je cybersecurity met DNS best practices