Search AI Lake van Elastic belooft snel de juiste data uit enorme 'data lakes' te vissen

Het is een geweldige klus om data in een data lake doorzoekbaar te maken en houden, helemaal zonder gekoppelde metadata via datatabellen. Het Amerikaans-Nederlandse bedrijf Elastic komt nu met een oplossing: Search AI Lake, een zoekmachine die zonder dergelijke tabellen grote hoeveelheden ongestructureerde data kan doorzoeken. Ideaal voor AI-training, maar ook voor security- en observability-workloads.

Search AI Lake kan zowel op traditionele wijze zoeken als via vectors. Elastic belooft daarnaast enorme schaalbaarheid door opslag los te koppelen van compute. Doordat op deze manier grote hoeveelheden data beter doorzoekbaar zijn, maakt dit het product bijzonder geschikt voor het trainen van LLM’s. Die hebben immers een niet te stillen datahonger, maar als gebruiker wil je ze liefst wel de juiste maaltjes voorschotelen.

Tip: De wisselwerking tussen vector databases en AI: LLM’s fine-tunen op een hoger niveau

De toepassing heeft weliswaar geen datatabellen nodig zoals bijvoorbeeld in gebruik in de data lake-toepassingen van Databricks of Snowflake, maar maakt wel gebruik van het eigen format Elastic Common Schema (ECS) format. Dit format is door Elastic gedoneerd aan de Cloud Native Computing Foundation (CNCF) in de hoop dat deze open standaard breder wordt opgepikt.

Search AI Lake maakt verder gebruik van de bestaande Elasticsearch Query Language, waardoor het mogelijk wordt data in Elastics-clusters federatief te doorzoeken, dus in verschillende bronnen en allerlei vormen en maten, en deze op een eenduidige wijze op te dienen.

Bijzonder geschikt in GenAI-training

In gesprek met VentureBeat meldt Elastic-CEO Ash Kulkarni dat Search AI Lake snel en in real-time grote hoeveelheden data kan doorzoeken en native ondersteuning biedt voor het doorzoeken van dense vectors, ofwel vectors waar de meeste elementen ‘non-zero’ zijn en dus relevante data bevatten.

Ook is de search engine geschikt voor hybrid search, faceted search (waarbij gebruikers filters of attributen kunnen toevoegen aan zoekresultaten) en ordening van informatie op basis van relevantie. Deze opties zijn volgens Kulkarni met name belangrijk voor toepassingen als GenAI-training en Retrieval Augmented Generation (RAG). Het prioriteren en ordenen van de broninformatie zorgt voor een efficienter leerproces voor AI’s.

Search AI Lake moet volgens Elastic dus hét dataplatform worden voor generatieve AI-modellen, die enorm kunnen profiteren van het schaalbaar doorzoeken van vector-databases. De toepassing is in preview standalone beschikbaar, of als applicatie binnen de eveneens nieuwe dienst Elastic Cloud Serverless, die voor verschillende use cases een gespecialiseerde interface biedt.

Real-time dataverwerking

Elastic is in 2012 opgericht in Amsterdam en verkreeg met name bekendheid met ElasticSearch, een open-source zoekmachine voor gedistribueerd zoeken en analyseren, en die in staat is grote hoeveelheden data in real-time te verwerken. Het is gebouwd op de Apache Lucene en biedt een RESTful API voor indexeren en doorzoeken van gegevens. Het is onder andere bruikbaar voor het doorzoeken van bedrijfsgegevens, big data-analyse, het verwerken van sensordata uit IoT-applicaties en het doorzoeken van logs uit onder meer security- en DevOps-operaties.

Het bedrijf nam vorig jaar al een voorschot op de toenemende search-workload die AI vereist met de lancering van de ElasticSearch Relevance Engine (ESRE), die traditioneel zoeken combineerde met vector search.

Lees ook: VAST Data en Superna houden samen enterprise AI-adoptie veilig

Lees meer over Analytics

Progress koopt AI- en dataplatform Domo voor 400 miljoen

Progress Software legt 400 miljoen dollar op tafel voor Domo. De overname moet de AI- en datamogelijkheden va...

Berry Zwets 24 juli 2026

Topartikel

DevRev daagt SaaS uit: AI data-integratie moet (en kan) beter

De 'SaaSpocalypse' zou wel eens vanuit de SaaS-laag zelf kunnen komen

Sander Almekinders 23 juli 2026

Topartikel

VS blokkeert AI-model Anthropic Fable: wat betekent dit voor Europa?

De Verenigde Staten hebben voor het eerst een geavanceerd AI-model geblokkeerd voor niet-Amerikaanse gebruike...

Coen van Eenbergen 23 juni 2026

Snowflake Cortex AI Gateway moet AI-agents in toom houden

Snowflake introduceert Cortex AI Gateway, een centrale laag waarmee bedrijven zowel eigen als externe AI-agen...

Berry Zwets 29 juli 2026

Expert aan het woord

Tech calendar

Search AI Lake van Elastic belooft snel de juiste data uit enorme ‘data lakes’ te vissen

Bijzonder geschikt in GenAI-training

Real-time dataverwerking

Blijf op de hoogte, abonneer!

DevRev daagt SaaS uit: AI data-integratie moet (en kan) beter

EU AI Act wordt menens op 2 augustus: wat verandert er?

AI is topprioriteit, maar AI SOC is nog ver weg

How Atlassian designs AI products that users can trust

AI security threats facing open source ecosystems in 2026

ServiceNow unveils Action Fabric AI platform architecture

Why enterprises are choosing HPE for private cloud AI

IMd Raadgevende Ingenieurs biedt werknemers cloudwerkplek met superzware reken- en tekenapplicaties

Je werkt je medewerkers in, doe je hetzelfde met je AI-agents?

AI in cybersecurity: van ondersteuning naar samenwerking

Een AI-agent die in negen seconden een productiedatabase wiste: vijf lessen

Dreamforce

GOTO Copenhagen 2026

NetApp INSIGHT 2026

Manhattan EMEA Exchange

Cyberrisico’s zetten bedrijfscontinuïteit het meest onder druk

Hoe bouw je veilig agentic AI-applicaties in enterprise-omgevingen?

De opkomst van de Managed Intelligence Provider

Hoe zet je AI veilig in binnen applicatieontwikkeling?