Financiële instrumenten classificeren met machine learning
Concrete algoritmen die werken met echte marktdata, geen theoretische voorbeelden die je nooit gebruikt.
Stap voor stap het opzetten van een testomgeving, met aandacht voor veelgemaakte fouten zoals lookahead bias.
Positiegroottes, drawdown-limieten en stop-loss logica — de onderdelen die bepalen of een strategie lang meegaat.
Veel financiële teams werken nog steeds met handmatig opgestelde regelsets om instrumenten te categoriseren. Dat kost tijd en leidt tot inconsistenties zodra nieuwe producttypen opduiken.
Wat dit probleem concreet inhoudt
Stel: een portefeuille bevat 4.000 posities met gestructureerde producten, hybride obligaties en equity-linked notes. Handmatig labelen duurt dagen. Een goed getraind klassificatiemodel doet hetzelfde in seconden, met een foutmarge die vergelijkbaar is met een ervaren analist.
Tijdens deze workshop bouwen we samen een pipeline in Python met scikit-learn en pandas. We gebruiken echte ISIN-kenmerken zoals looptijd, couponstructuur en emissietype als features.
Onderwerpen die aan bod komen
- Feature engineering op basis van instrumentkenmerken
- Vergelijking van Random Forest, XGBoost en logistische regressie voor classificatietaken
- Omgaan met onevenwichtige klassen bij zeldzame instrumenttypen
- Validatie via cross-validatie en confusiematrices
We besteden ook aandacht aan interpretatie: hoe leg je aan een compliance-afdeling uit waarom een model een bepaalde categorie heeft gekozen? SHAP-waarden komen hierbij kort aan bod.
De sessie is bewust kleinschalig gehouden zodat iedereen vragen kan stellen en code kan testen op eigen datasets. Laptops zijn verplicht.
Programma
Wat je doorloopt, stap voor stapProgramma
-
Inleiding 30 min
-
Data voorbereiding en feature selectie 45 min
-
Modeltraining en vergelijking 60 min
-
Evaluatie en interpretatie 45 min
-
Vrije oefentijd en Q&A 30 min