2min

Google heeft onlangs zijn Google Magika-technologie opensource gemaakt. De technologie werkt op basis van AI en helpt securityspecialisten met het nauwkeurig identificeren van bestanden.

De Google Magika-technologie werkt met een zelfontwikkeld, zeer geoptimaliseerd deep-learningmodel, geeft de techgigant aan. Dit model is getraind met behulp van het zogenoemde Keras-framework of API. Keras zorgt onder meer voor het met hoge snelheid debuggen van code, een betere elegantie en bewustzijn van de code, beter onderhoud en uitrolbaarheid. Dit door XLA-compilatie met JAX en TensorFlow.

Daarnaast zijn met Keras ontwikkelde AI- of ML-modellen sneller naar verschillende (server, mobiele of browsergebaseerde) omgevingen uit te rollen. Dit vanwege ingebouwde componenten uit de TensorFlow- en PyTorch-ecosystemen.

Google Magika is verder slechts 1 MB in omvang en gebruikt Open Neural Network Exchange (ONNX) als een inference engine. Dit zorgt ervoor dat bestanden in milliseconden worden geïdentificeerd.

Snellere prestaties meest interessant

De techgigant benadrukt voornamelijk de snelheid van de tool, omdat dit het grootste voordeel is dat Magika oplevert. De tool zou beter presteren dan conventionele bestandsidentificatie met een meer dan 30 procent hogere accuratesse-boost. Ook zou de tool tot 95 procent meer precisie bieden voor traditioneel moeilijkere, en ook potentieel gevaarlijke, VBA-, JavaScript en Poweshell-bestanden.

Magia-prestatiegemiddelde typen fs-score.

Magika voor betere security

Zelf gebruikt Google de technologie om de gebruikers van Google-diensten meer security te bieden. De Magika-technologie routeert hiervoor Gmail-, Drive- en Safe Browsing-bestanden naar de juiste security- en content policy-scanners.

Google verbetert de bestandsidentificatie met 50 procent door Magika. Dit in vergelijking met een eerder gebruikt bestandidentificatiesysteem op basis van handgeschreven regels. Hierdoor is Google naar eigen zeggen in staat 11 procent meer bestanden te scannen en daarmee brengt het bedrijf het aantal niet-geïdentificeerde bestanden terug naar 3 procent.

Eerdere initiatieven

Google is al langer bezig met het implementeren van AI voor het scannen op kwaadaardige content in zijn oplossingen en toepassingen. In november vorig jaar werd al de Resilient and Efficient Text Vectorizer (RETVec)-technologie geïntroduceerd. Met dit zogenoemde multilingual text processing model kan de techgigant schadelijke content in Gmail ontdekken, waaronder spam en phishingberichten.

Google Magika is nu beschikbaar via GitHub.

Lees ook: Gmail krijgt grootste security-update in jaren