Machine learning uitgelegd: zo leert een computer van zichzelf

Machine learning is een technologie die steeds vaker een rol speelt in het dagelijks leven, ook al merk je dat niet altijd. Het zit verborgen in de muziek die Spotify voor je uitkiest, in de e-mails die automatisch als spam worden herkend en in de route die Google Maps voor je berekent. Een computer leert hierbij niet via vaste regels die mensen intypen, maar door zelf patronen te ontdekken in grote hoeveelheden gegevens. Dat klinkt ingewikkeld, maar het principe is eigenlijk vrij eenvoudig uit te leggen.

Hoe een computer leert zonder handleiding

Mensen leren van ervaring. Een kind dat één keer zijn hand brandt aan een hete pan, weet de volgende keer dat het voorzichtig moet zijn. Op een vergelijkbare manier werkt het leren van computersystemen. Een algoritme krijgt heel veel voorbeelden te zien en ontdekt daarin verbanden en wetmatigheden. Stel dat een systeem duizenden foto’s van katten en honden bekijkt, steeds met het juiste antwoord erbij. Na verloop van tijd herkent het systeem zelf wat een kat is en wat een hond, zonder dat iemand heeft uitgelegd waar het precies op moet letten. Dit proces heet trainen, en het model dat ontstaat is het eindresultaat van dat leerproces.

De drie manieren waarop systemen leren

Binnen de wereld van geautomatiseerd leren zijn er drie basisvormen. De eerste is gesuperviseerd leren, waarbij het systeem voorbeelden krijgt met de bijbehorende antwoorden. De computer leert zo van correcte voorbeelden. De tweede vorm is ongesuperviseerd leren. Daarbij krijgt het systeem alleen ruwe gegevens zonder labels of antwoorden, en moet het zelf structuur ontdekken. Dit wordt vaak gebruikt om klantgroepen te onderscheiden of om ongewone patronen op te sporen. De derde vorm is versterkend leren, waarbij een systeem door te oefenen leert wat werkt en wat niet. Het ontvangt een beloning bij een goed resultaat en leert zo stap voor stap beter presteren. Dit type leren wordt onder andere gebruikt bij computerspellen en robotica.

Waar je dit tegenkomt in de praktijk

Toepassingen van slimme lerende systemen zijn overal. Banken gebruiken ze om fraude op te sporen: als iemand plotseling in een ander land een grote aankoop doet, kan het systeem dat markeren als verdacht. Ziekenhuizen zetten ze in om op röntgenfoto’s ziektes eerder te herkennen dan een mens dat soms zou doen. Streamingdiensten zoals Netflix analyseren kijkgedrag om series en films aan te bevelen die goed passen bij jouw smaak. Ook in de landbouw worden modellen ingezet die op basis van satellietbeelden en weerdata voorspellen wanneer gewassen het best geoogst kunnen worden. De gemeenschappelijke factor in al deze gevallen is dat er enorme hoeveelheden data beschikbaar zijn, en dat het systeem die data gebruikt om steeds betere voorspellingen te doen.

De grenzen en risico’s van automatisch lerende systemen

Net als elk hulpmiddel heeft deze technologie ook beperkingen. Een model is alleen zo goed als de data waarmee het getraind is. Als die gegevens eenzijdig zijn, bijvoorbeeld alleen maar foto’s van mensen met een lichte huidskleur, dan presteert het systeem slechter voor mensen met een donkere huidskleur. Dat heet vooringenomenheid of bias, en het is een serieus probleem waar onderzoekers veel aandacht aan besteden. Daarnaast is het voor mensen vaak moeilijk te begrijpen waarom een systeem een bepaalde beslissing neemt. Dit gebrek aan transparantie maakt het lastiger om fouten te ontdekken of te corrigeren. Dat is de reden waarom er in Europa wetgeving wordt ontwikkeld die eisen stelt aan de betrouwbaarheid en uitlegbaarheid van geautomatiseerde beslissingen.

Veelgestelde vragen

Wat is het verschil tussen machine learning en gewone software?
Gewone software volgt vaste regels die een programmeur heeft geschreven. Bij lerende systemen stelt de computer zelf regels op, op basis van voorbeelden en gegevens. Het systeem wordt dus beter naarmate het meer data verwerkt, zonder dat iemand nieuwe instructies hoeft in te voeren.

Heeft machine learning altijd veel data nodig?
In de meeste gevallen zijn grote hoeveelheden gegevens nodig om een goed model te trainen. Hoe meer voorbeelden een systeem heeft gezien, hoe nauwkeuriger het wordt. Er zijn technieken waarbij minder data volstaat, maar die vragen vaak meer rekenkracht of geven minder betrouwbare resultaten.

Is machine learning hetzelfde als kunstmatige intelligentie?
Machine learning is een onderdeel van kunstmatige intelligentie, maar niet hetzelfde. Kunstmatige intelligentie is het bredere vakgebied dat gaat over slimme computersystemen. Lerende algoritmen zijn één manier om die intelligentie te bereiken, maar er zijn ook andere methoden die geen gebruik maken van data gedreven leren.

Kan een lerend systeem ook fouten maken?
Ja, lerende systemen maken regelmatig fouten, zeker als de situatie die ze tegenkomen sterk afwijkt van de voorbeelden waarop ze zijn getraind. Daarom is het belangrijk dat mensen het systeem blijven controleren, vooral als de beslissingen grote gevolgen hebben voor anderen.