Geavanceerde ML-technieken voor instrumentclassificatie in finance
Concrete algoritmen die werken met echte marktdata, geen theoretische voorbeelden die je nooit gebruikt.
Stap voor stap het opzetten van een testomgeving, met aandacht voor veelgemaakte fouten zoals lookahead bias.
Positiegroottes, drawdown-limieten en stop-loss logica — de onderdelen die bepalen of een strategie lang meegaat.
Als je al werkt met basisclassificatoren maar merkt dat de modellen haperen op exotische instrumenttypen of bij drift in marktregimes, dan zijn eenvoudige oplossingen vaak niet voldoende.
Waar gangbare pipelines tekort schieten
Random Forests presteren prima op stabiele datasets, maar financiële instrumentdata verandert. Nieuwe regelgeving introduceert nieuwe categorieën, emittenten passen hun structuren aan, en historische labels zijn niet altijd consistent. Een model dat vorig kwartaal 94% haalde, kan vandaag al significant slechter presteren zonder dat iemand het opmerkt.
We kijken naar monitoring van modeldrift, het herintrainen van modellen op rollende vensters, en hoe je labelruis aanpakt bij gestructureerde producten zonder duidelijke categoriegrens.
Technieken die centraal staan
- Gradient boosting met LightGBM op high-cardinality categorische features
- Tabular deep learning via PyTorch Tabular voor complexe instrumentstructuren
- Calibratie van waarschijnlijkheidsuitvoer voor risicorapportage
- Detectie van out-of-distribution instrumenten
Deelnemers werken aan een casusopdracht op basis van een geanonimiseerde dataset van 12.000 instrumenten uit een Belgische vermogensbeheerscontext. Resultaten worden plenair besproken.
Begeleider Wouter Desmedt heeft vijf jaar ervaring bij een Belgische custodian bank en deelt specifieke keuzes en afwegingen uit de praktijk. De sessie is in het Nederlands en gericht op collegiale uitwisseling.
Programma
Wat je doorloopt, stap voor stapProgramma
-
Analyse van bestaande pipelineproblemen 30 min
-
LightGBM en feature importance op financiële data 50 min
-
Tabular deep learning: wanneer zinvol 40 min
-
Modeldrift en monitoringstrategieën 35 min
-
Casusopdracht en plenaire bespreking 55 min