Machine learning: methoden

Een machine trainen om verbanden te zien? Veel bedrijven, waaronder Facebook en bol.com, gebruiken al artificial intelligence om ons gedrag te voorspellen. En wat denk je van machine learning om fraude te ontdekken, aankomend onderhoud te voorspellen of apps te personaliseren? In 2 blogs zet ik, Sjon Post van Computrain, kort de verschillende methoden en algoritmes van machine learning voor je op een rij. Ik begin met de methoden van machine learning.

Machine learning gaat onder andere over patronen ontdekken in big data. Die patronen zijn de basis voor een algoritme waarmee computers gedrag, uitkomsten en trends kunnen voorspellen. Door steeds nieuwe data aan het algoritme toe te voegen, blijft het model leren, zonder daarvoor geprogrammeerd te zijn. Machine learning is dan ook een onderdeel van artificial intelligence. Er bestaat een aantal vormen van machine learning:

- Supervised learning
Bij supervised learning maakt een computer zelf associaties tussen input en output, maar de mens is een soort leraar. De computer krijgt voorbeeldinput én -output van een mens. Een voorbeeld is een foto het label ‘kat’ of ‘hond’ geven, of een bepaalde verkoopprijs toekennen aan een tweedehands auto. Door te vergelijken leert het algoritme zichzelf een regel voor de gewenste vertaling van de input. Wat het eerder leerde, kan het toepassen op nieuwe gegevens. Er ontstaan steeds minder fouten en uiteindelijk kan het systeem zelf de juiste output produceren.
 
- Unsupervised learning
Bij unsupervised machine learning hangen er geen labels aan de input van het leeralgoritme. Het systeem wordt dus niet gestuurd met voorbeelden. De verbanden en structuur ontdekt het algoritme zelf. Het doel van unsupervised learning is veelal om verbanden te vinden of om data zoals transactiegegevens te organiseren.
 
- Semi-supervised learning
Semi-supervised learning is een combinatie van supervised en unsupervised learning. Je kunt het voor dezelfde toepassingen gebruiken als supervised learning. Het verschil? De computer krijgt veel gelabelde en niet-gelabelde input en slechts een paar outputvoorbeelden of er ontbreekt bepaalde data. Semi-supervised learning is ook goedkoper, want niet-gelabelde data is minder duur en makkelijker te krijgen dan gelabelde data.

- Reinforcement 
Bij reinforcement learning komt het algoritme via trial and error tot de beste resultaten. Maakt het systeem een goede associatie tussen input en output, dan krijgt het lerende algoritme een beloningssignaal. Het algoritme past hierop zijn strategie weer aan. Reinforcement wordt vaak boven op een andere vorm van machine learning toegepast. Bijvoorbeeld voor de ontwikkeling van robotica, games, navigatie en voor Internet of Things-toepassingen.

Lees ook mijn artikel over de algoritmes van machine learning.

Training machine learning volgen?

Wil jij meer weten over data science, machine learning en algoritmes? Computrain helpt je graag op weg, bijvoorbeeld met het Data Science-programma.

Sjon Post
Programmamanager Computrain

Wellicht ook interessant