Snowflake lanceert Snowpark Connect om Spark-code native uit te voeren

Snowflake kondigt de publieke preview aan van Snowpark Connect voor Spark. De nieuwe architectuur maakt het mogelijk om Apache Spark-code direct in Snowflake-warehouses uit te voeren, zonder aparte Spark-clusters te onderhouden.

Tot nu toe kozen veel Snowflake-organisaties voor de Spark Connector om Snowflake-data met Spark-code te verwerken. Deze aanpak introduceerde echter datamovement, wat resulteerde in extra kosten, latentie en governance-complexiteit.

Snowpark Connect elimineert deze problemen door dataverwerking direct in Snowflake uit te voeren. Dit voorkomt datamovement en vermindert latentie, terwijl een uniform governance-framework wordt gehandhaafd.

De oplossing werkt met Apache Iceberg-tables, inclusief extern beheerde Iceberg-tables en catalog-linked databases. Organisaties kunnen de kracht van het Snowflake-platform benutten zonder data te verplaatsen of Spark-code te herschrijven.

Tip: Snowflake verder in open data via Apache Iceberg-updates

Spark Connect als basis

Met de introductie van Apache Spark 3.4 kwam Spark Connect beschikbaar, een client-server architectuur die de gebruikerscode loskoppelt van het Spark-cluster. Deze scheiding vormt de basis voor Snowpark Connect.

De nieuwe oplossing elimineert de complexiteit van het beheren van aparte Spark-omgevingen. Organisaties hoeven niet langer te worstelen met dependencies, versiecompatibiliteit en upgrades van Spark-infrastructuur.

Prestatie- en kostenvoordelen

Snowflake claimt aanzienlijke voordelen voor klanten die Snowpark Client gebruiken. Gemiddeld zouden zij 5,6 keer snellere prestaties zien vergeleken met managed Spark-oplossingen. Daarnaast realiseren zij 41 procent kostenbesparing.

Met Snowpark Connect krijgen organisaties deze voordelen zonder hun bestaande Spark-code te hoeven herschrijven. De oplossing ondersteunt moderne Spark DataFrame, Spark SQL en user-defined functions (UDF’s). De elastic compute runtime met virtual warehouses van Snowflake zorgt voor automatische performance tuning en scaling.

Huidige beperkingen

Snowpark Connect ondersteunt momenteel alleen Spark 3.5.x-versies en is beperkt tot Python-omgevingen. Java- en Scala-ondersteuning is in ontwikkeling.

Belangrijke Spark-functionaliteiten zoals RDD, Spark ML, MLlib, Streaming en Delta API’s maken nog geen deel uit van Snowpark Connect. Voor ondersteunde API’s kunnen semantische verschillen bestaan vergeleken met standaard Spark-implementaties.

De oplossing is beschikbaar via diverse clients, waaronder Snowflake Notebooks, Jupyter notebooks, Snowflake stored procedures, VSCode, Airflow en Snowpark Submit.

Lees meer over Analytics

Expert aan het woord

Tech calendar

Blijf op de hoogte, abonneer!

SAP opent platform met MCP: AI-agents kunnen met SAP praten

Cisco bestrijdt complexiteit branch-netwerken met Unified Branch

DataCore zet vrijheid, bescherming en langdurig data bewaren centraal

Nutanix CTO explains their VMware alternative and multi-cloud strategy

SAP Business Network: $6.5 trillion B2B collaboration platform

AI data centers: the road to 1 megawatt per rack explained

Workday CTO outlines bold AI agent strategy and major acquisitions

Van dreiging naar daadkracht: waarom jij thuishoort in een Security Operations Center

Dit moet jij regelen voor de overstap van Qlik naar Power BI in jouw AFAS-omgeving

BrickCon The Databricks Community Conference

Appdevcon

Webdevcon

Dutch PHP Conference

GITEX ASIA 2026

Het pakketprobleem in de logistiek; van claims naar kostenbesparing

Axis maakt met camerasensors de werkomgeving veiliger en efficiënter

Optimaliseer je datacenter voor AI-toepassingen

Optimaliseer je IT-Infrastructuur met HPE ProLiant Gen12