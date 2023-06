Snowflake houdt deze week de Summit 2023-conferentie, waar het innovaties uit de doeken doet voor ontwikkelaars en data-experts. Voor deze IT-professionals wil Snowflake de basis bieden voor data-apps. SVP of Product Christian Kleinerman legt aan ons uit welke features de komende tijd naar de Data Cloud komen.

Kleinerman wijst op de positie van de Data Cloud binnen enterprise-organisaties vandaag de dag. “Erg belangrijk voor ons is dat Snowflake een enkel product is”, aldus Kleinerman. Dat is iets waar bedrijven volgens hem naar op zoek zijn, in tegenstelling tot wat sommige techleveranciers bieden. Zij brengen losse producten voor allerlei gebruikstoepassingen op de markt, die misschien wel onder te brengen zijn in een product. Dat maakt het afnemen en gebruiken lastiger.

“Een verscheidenheid aan workloads is mogelijk door de enkele integratie, wat de algehele kosten voor de adoptie van Snowflake vermindert”, vervolgt Kleinerman. Hij noemt zaken waar Snowflake vaak mee in verband gebracht wordt, zoals datawarehousing, datalakes en BI. Ook data engineering en cybersecurity, waar recentelijk meer focus op ligt, zijn toepassingen waar je Snowflake voor kunt gebruiken.

De nieuwe features die Snowflake tijdens Summit 2023 onthult, zullen die toepassingen wat verder moeten ondersteunen. Daarom staan er drie innovatiethema’s centraal op de conferentie. Het gaat om Snowflake als een enkel platform, het distribueren van applicaties en datasets en tot slot het ondersteunen van programmeerbaarheid zonder security uit het oog te verliezen.

Apps bouwen met Native App Framework

Wat er wat ons betreft uitspringt als we kijken naar hoe Snowflake het invult, is de public preview van het Native App Framework op AWS. Hiermee krijgen ontwikkelaars tools in handen voor het bouwen van apps. “Ieder type data-applicatie vereist in het verleden dat klanten hun data verplaatsen of kopiëren en toevertrouwen aan externe leveranciers. Dit is vooral problematisch als klantgegevens zeer gevoelig zijn. Het Snowflake Native App Framework herdefinieert de status quo door ontwikkelaars in staat te stellen hun apps rechtstreeks naar de data van hun klanten te brengen, zonder dat die data ooit de omgeving van de klant hoeft te verlaten”, legt Kleinerman uit. “We maken het eenvoudiger, sneller en efficiënter voor ontwikkelaars om leidende apps op schaal te bouwen en leveren, zodat zij zich kunnen richten op het verdienen van inkomsten van enkele van de grootste bedrijven in de Data Cloud, waarbij Snowflake naadloos zorgt voor security-, privacy- en governance-zorgen.”

Het beschikbaar maken van het Native Application Framework hing, vanwege de private preview sinds medio vorig jaar, al even in de lucht. Het hele idee is dat de Data Cloud het eenvoudig maakt voor enterprise organisaties om gegevens te centraliseren. Hierdoor ontstaat een nieuw model voor applicatieontwikkeling en -deployment, claimt Snowflake, waarbij de ontwikkelaar meerdere apps op een centrale kopie van de data kan creëren.

Voor het bouwen van die apps zijn bijvoorbeeld User-Defined Functions (UDF’s) en opgeslagen procedures beschikbaar. Bedrijven kunnen de Native Apps dus publiceren in de Snowflake Marketplace. Volgens Snowflake zijn er nu meer dan 25 apps beschikbaar, terwijl er ook meer dan 100 providers momenteel apps creëren voor verschillende use cases. Een voorbeeld is zakenbank Goldman Sachs, die de Legend-app bouwde met het Native App Framework. De app combineert dataplatformen om businessinzichten te creëren voor klanten, bedrijfspartners en engineers. Hiervoor ondersteunt het het delen van datasets en het aansluiten van klanten met hun eigen data.

Ervaring van ontwikkelaars, data scientists en ML-engineers Door de hoeveelheid aankondigingen tijdens de Snowflake Summit dreigen de wat gerichtere functionaliteiten onderbelicht te raken. Voor data scientists en ML-engineers staat er bijvoorbeeld het nieuwe Snowpark Model Registry op het programma. Met deze unified repository voor modellen van bedrijven, wil Snowflake MLOps verder stroomlijnen. Snowpark Model Registry biedt gebruikers een centrale plek voor model publishing en discovery, waardoor het eenvoudiger moet worden om de modellen in productie te brengen. Daarnaast komt Snowflake voor data scientists en Python-ontwikkelaars met een nauwere integratie met Streamlit. Dit open-source app framework wordt gebruikt om data-apps te bouwen en delen. Door de integratie moet de doelgroep in staat zijn “de impact van hun werk te vergroten door apps te bouwen die de kloof tussen data en zakelijke acties overbruggen. Met Streamlit in Snowflake kunnen bouwers vertrouwde Python-code gebruiken om hun apps te bouwen, een idee om te zetten in een enterprise-ready app met slechts een paar regels code, en vervolgens snel en veilig deze apps deployen en delen in de Data Cloud.” Verder komt Snowflake binnenkort met een private preview van Iceberg Tables. Hiermee speelt Snowflake in op de populairiteit van Apache Iceberg als standaard voor open table formats. Door Iceberg Tables kunnen organisaties werken met data in hun eigen storagesysteem in het Apache Iceberg-format. Bedrijven kunnen hierdoor het Snowflake-platform inzetten, ongeacht in welk IT-systeem de data beheerd wordt. “Dit vereenvoudigt data management door het wegenemen van de noodzaak om gegevens tussen systemen te verplaatsen of kopiëren”, aldus Snowflake.

Meer infrastructuur- en programmeeropties

Een aankondiging die aansluit op Native App Framework, is de Snowpark Container Services. Deze feature, momenteel in private preview, maakt onderdeel uit van het Snowpark-ontwikkelframework. Data engineers gebruiken het framework om pipelines te migreren, maar het kan bijvoorbeeld ook nuttig zijn voor data scientists om modellen te bouwen en trainen. Snowpark Container Services moet meer workloads mogelijk maken, door gebruikers iedere programmeertaal te laten gebruiken en op meer infratructuurdeployopties te ondersteunen.

Om daar vaart mee te maken, kondigt Snowflake een rits (vernieuwde) samenwerkingen aan met verschillende software- en applicatieleveranciers. Zo is het mogelijk om “populaire AI-platform en ML-features te gebruiken van Alteryx, Dataiku en SAS voor geavanceerdere AI- en ML-processing en de data workflows te beheren met Astronomers platform aangedreven door Apache Airflow – allemaal volledig binnen Snowflake.” Onderstaande afbeelding biedt overzicht van de bijbehorende samenwerkingen.

Zoals je kunt zien is Nvidia een van de partijen waarmee Snowflake de samenwerkingen vernieuwt. Het richt zich op Nvidia accelerated computing en software-integraties voor Snowpark Container Services. Dit is een aanvulling op de nieuwe samenwerking van de twee partijen om samen generatieve AI-mogelijkheden naar enterprises te brengen. In een los artikel dat we later tijdens de conferentie publiceren, zullen we daar verder op ingaan.

Wat doet Snowflake verder op LLM-vlak?

Met het Nvidia-nieuws besteedt Snowflake tijdens Summit 2023 aandacht aan de large language model-trend. Met Document AI (private preview) is er echter nog een andere update die de kracht van LLM’s naar de Data Cloud moet brengen. Dit model ondersteunt het halen van informatie uit documenten, zoals factuurbedragen en contractuele voorwaarden, met behulp van natural language processing. Document AI is gebaseerd op de technologie van Applica, een Poolse bedrijf dat Snowflake eind vorig jaar heeft overgenomen.

Snowflake wil met Document AI vooral inspelen op de verwachte explosie aan ongestructureerde data uit documenten, afbeeldingen, video’s en audio. Volgens het bedrijf is het halen van waarde uit deze data nog te complex. Dit gaat namelijk gepaard met handmatige, foutgevoelige taken. Bovendien is er te weinig personeel met de juiste vaardigheden beschikbaar om daadwerkelijk waarde te halen uit deze data, meent Snowflake

Basis versterkt

Snowflake heeft met alle updates tijdens Summit 2023 laten zien fors in te zetten op innovatie. Ontwikkelaars, data scientists en data engineers kunnen op een hoop nieuwe functies rekenen, waar uiteindelijk de hele business van moet profiteren. Op die manier wordt Snowflake steeds relevanter in een tijd waarin data een crucialere rol inneemt.

