AWS lanceert query-taal PartiQL

Onderzoekers van Amazon Web Services (AWS) hebben de nieuwe SQL-compatibele query-taal PartiQL gelanceerd. Hiermee is het mogelijk om data efficiënt te ‘queryen’, ongeacht de locatie of het format.

De query-taal moet het mogelijk maken om gestructureerde data vanuit relationele databases te verwerken, schrijft Analytics India Magazine. PartiSQL belooft meer functies te hebben dan SQL, één van de oudste spelers binnen datamanagement. Deze taal maakte het ook al mogelijk om te werken met grote hoeveelheden data.

Probleem is echter dat data – zowel gestructureerd als ongestructureerd – in meerdere databases en data lakes opgeslagen wordt. Daarnaast hebben data analysts met SQL niet de complete controle over de databases. Daardoor ontstaan er problemen tussen de query-taal en het data format waarin het opgeslagen is.

Ontstaan PartiQL

De onderzoekers van AWS willen deze problemen oplossen met PartiQL. De voornaamste reden dat de onderzoekers de taal introduceren, is omdat ze uitdagingen tegenkomen bij het transformeren van SQL-tabelgegevens en semi-gestructureerde data die in verschillende formats en opslag-engines gevonden worden.

De onderzoekers van Amazon wilden niet alleen SQL gebruiken, maar de toegang ook uitbreiden tot de niet-relationele data van het data lake, terwijl er strikte backward compatibility met SQL behouden blijft.

Functies PartiQL

PartiQL behoudt dus comptabiliteit met SQL, wat betekent dat SQL-queries blijven werken in de SQL-query verwerkers die uitgebreid zijn om PartiQL te ondersteunen. Daardoor is het eenvoudiger voor ontwikkelaars om de nieuwe taal te gebruiken.

De taal is ontworpen om in te zetten bij database-engines die de aanwezigheid van een schema verwachten, maar ook voor database-engines die zonder schema’s werken.

PartiQL is verder onafhankelijk van ieder data format. Zo kan een query geschreven worden in bijvoorbeeld JSON, Parquet, ORC of CSV. Ook is de taal onafhankelijk van een onderliggende data store. Daarnaast voldoet het aan de eisen van NoSQL.