Versie 5.0 van de open-source NoSQL gedistribueerde database Apache Cassandra is algemeen beschikbaar. Deze nieuwe versie biedt gebruikers onder meer betere prestaties, integratie van GenAI-functionaliteit en een hogere data-efficiëntie.
De release van Apache Cassandra 5.0 is de eerste grote release sinds de introductie van versie 4.0 in 2021. De open-source database is een samenwerkingsproject van diverse stakeholders en wordt ondersteund door grote leveranciers, waaronder DataStax, en als beheerde database-oplossingen binnen grote (public) cloudomgevingen aangeboden.
De belangrijkste feature van Apache Cassandra is de grootschalig gedistribueerde NoSQL-database. Deze database biedt bedrijven volledig gesynchroniseerde nodes op verschillende locaties.
Deze gedistribueerde functionaliteit wordt met versie 5.0 sterk verbeterd door de introductie van een nieuwe manier van indexeren. Dankzij Storage Attached Indexes (SAI) zijn ontwikkelaars niet langer gebonden aan strikte datamodellen.
Vroeger moesten bedrijven zeer specifiek aangeven hoe het datamodel werd opgebouwd. In versie 5.0 van Apache Cassandra worden de voorwaarden met SAI losgelaten, waardoor ontwikkelaars een datamodel kunnen bouwen, wijzigen en eenvoudig een index kunnen toevoegen om het datamodel op een andere manier te laten werken.
De introductie van SAI vervangt bovendien de oorspronkelijke Secondary Index-functionaliteit in Apache Cassandra.
Vector- dataype- en index feature
In lijn met deze nieuwe feature is ook de introductie van vector datatype- en indexfunctionaliteit in Apache Cassandra 5.0. Deze functionaliteit is ontworpen voor zogenoemde Approximate Nearest Neighbor-zoekacties.
Volgens het open-sourceproject legt dit ook de basis voor de ontwikkeling van geavanceerde AI- en ML-applicaties. Ontwikkelaars kunnen voor deze toepassingen de schaal- en distributiefunctionaliteit van Apache Cassandra beter combineren met geavanceerde zoekmogelijkheden.
Dichtere data-intensiteit per node
Apache Cassandra 5.0 biedt daarnaast een nieuwe eigenschap: de ‘Unified Compaction’-strategie. Deze feature verhoogt de datadichtheid per node en past automatisch de datadichtheid aan naarmate clusters groeien, wat de operationele efficiëntie verbetert, met name bij grootschalige implementaties van de NoSQL-database.
Meer data per node betekent dat gebruikers uiteindelijk minder hardware nodig hebben voor een grootschalige uitrol van de open-source database, wat de operationele kosten verlaagt.
Overige updates
Verdere verbeteringen in Apache Cassandra 5.0 zijn onder meer de introductie van twee nieuwe datastructuren: trie memtables en trie SSTables. Deze zorgen ervoor dat datastructuren beter gesynchroniseerd worden, wat leidt tot snellere verwerking en betere algemene prestaties van de database.
Door datastructuren vanaf de eindgebruiker tot aan de (opslag)schijf te synchroniseren, voert de database minder onnodige taken uit, wat leidt tot betere prestaties.
Ondersteuning voor Java Development Kit (JDK) 17 moet in sommige gevallen tot 20 procent betere prestaties opleveren, vooral door verbeterd geheugenbeheer.
Apache Cassandra 5.0 is nu beschikbaar. Er wordt inmiddels gewerkt aan versie 5.1, die sinds november vorig jaar in ontwikkeling is. Ook staat de introductie van volledige Atomicity, Consistency, Isolation, Durability (ACID)-transacties op de planning voor de toekomst.
Lees ook: Cassandra 4.1 biedt pluggable storage en handvaten voor developers