‘Machine learning modellen getraind op pre-corona data nutteloos’

Abonneer je gratis op Techzine!

Volgens Gartner heeft de ‘extreme disruptie’ in de nasleep van het coronavirus veel machine learning-modellen die getraind zijn op oudere data nutteloos gemaakt.

Organisaties die veel gebruikmaken van machine learning zouden er verstandig aan doen om hun aanpak te heroverwegen. Het opnieuw naar de modellen kijken vormt echter ook een uitdaging, want er is weinig ‘post-corona data’ beschikbaar om de modellen opnieuw te trainen. Daarnaast weten we niet hoe accuraat voorspellende modellen zijn aangezien het ‘nieuwe normaal’ nog steeds gevormd wordt.

Rita Sallam, research vice president bij Gartner, geeft aan dat het moeilijk is in te schatten of de data van voor of zelfs tijdens het coronavirus wel geldig is, vanwege de vele veranderingen. “Wat we in essentie zien is een volledige verschuiving in de verwachtingen van klanten en in hun koopgedrag. Modellen die gebaseerd zijn op veel historische data; elke vorm van planning gebaseerd op prestaties uit het verleden en, zelfs sommige modellen over het gedrag van klanten (zullen niet meer geldig zijn, red.) omdat de dingen significant zijn veranderd, en als gevolg gedragen klanten zich heel anders.”

Aanvullende technieken

Supervised machine learning moet volgens Sallam aangevuld worden met alternatieve technieken om organisaties sneller in staat te stellen zich aan te passen aan nieuw economisch gedrag. Hieronder valt bijvoorbeeld reinforcement learning, waarmee een model wordt getraind om beslissingen te nemen in een onzekere en complexe omgeving. Daarnaast kan er gedacht worden aan distributed learning technieken gebaseerd op multi-node machine learning algoritmes.

Volgens Sallam hebben maar weinig organisaties de kennis en data-infrastructuur om deze technieken in de praktijk toe te passen. De wereldwijde pandemie zorgt er waarschijnlijk voor dat organisaties versneld deze technieken onder de knie willen krijgen.

Voordelen machine learning

In het rapport Top 10 Trends in Data en Analytics, 2020 stelt Gartner dat organisaties die de toepassing van machine learning willen versnellen, ook hun data management en pipelines verbeteren. Volgens het analistenbureau zullen teams die active metadata, machine learning en data fabrics inzetten voor het verbinden, optimaliseren en automatiseren van data management-processen tegen 2023 de tijd voor het leveren van geïntegreerde data met 30 procent verlagen.

Ook zal augmented data management de afhankelijkheid van IT-specialisten voor makkelijke en herhalende data management taken verminderen, waardoor tot 20 procent van hun productieve tijd vrijkomt.

Tip: IT’er worstelt met coronagevolgen: met minder sneller innoveren