Machine learning: algoritmes

Een machine die zichzelf dingen aanleert en die taken steeds beter kan uitvoeren, zonder hulp van een mens? Dan heb je het over artificial intelligence en machine learning. In 2 blogs zet ik, Sjon Post van Computrain, kort de verschillende methoden en algoritmes van machine learning voor je op een rij. Dit keer vertel ik je over de algoritmes van machine learning.

Machine learning heeft onder andere te maken met patronen ontdekken in big data. De patronen zijn de basis voor een algoritme waarmee computers gedrag, uitkomsten en trends kunnen voorspellen. Machine learning wordt bijvoorbeeld toegepast voor aanbevelingen in webshops of om spam uit je e-mail te filteren. In mijn vorige blog  had ik het al over de verschillende methoden van machine learning: supervised learning, unsupervised learning, semi-supervised learning en reinforcement. Maar er is meer.

Welk algoritme kies je?

Binnen machine learning kun je nóg meer onderscheid maken tussen de algoritmes die ingedeeld zijn in verschillende categorieën, zoals: classification, regression, clustering en anomaly detection. Voor elk machine learning-probleem kies je een ander soort algoritme (in R of Python). Good to know: er bestaan verschillende cheat sheets, zoals deze van Microsoft, die je keuze vergemakkelijken.

- Classification
Moet de data geteld worden? Wil je input verdelen in twee of meerdere groepen kies dan voor two class of multi-class classification. Bijvoorbeeld wanneer je e-mailberichten wilt markeren als spam of geen spam.

- Linear regression
Moet de data gemeten worden? Als je waarden wilt voorspellen, kies je voor het algoritme regression. Bijvoorbeeld om een huizenprijs of temperatuur op een bepaald tijdstip te voorspellen.
 
- Clustering 
Wil je structuur aanbrengen in de data, dan kun je kiezen voor clustering. Door zo’n clusteranalyse groepeer je data op basis van een of meer kenmerken in groepen. Bijvoorbeeld om soortgelijke mensen te vinden op basis van hun demografische gegevens, of om zinnen over eenzelfde onderwerp te groeperen.
 
- Anomaly detection
Voor het opsporen van afwijkende data of afwijkend gedrag gebruik je het algoritme anomaly detection. Handig voor het signaleren van transactiefraude.

Lees ook mijn artikel over de methoden van machine learning.

Training machine learning volgen?

Wil jij meer weten over data science, machine learning en algoritmes? Computrain helpt je graag op weg, bijvoorbeeld met het Data Science-programma.

Sjon Post
Programmamanager Computrain

Wellicht ook interessant