Showcase: Customer churn

Voor een grote klant heeft In Summa een verkenning gedaan om customer churn te voorspellen (de proportie van weggaande klanten binnen een bepaalde tijdsperiode). Dit is gerealiseerd door de inzet van Data Analytics en Machine Learning. De focus in dit project lag op het behouden van bestaande klanten. Het eindresultaat omvat een overzichtelijke applicatie waarin de top 100 van klanten met de grootste waarschijnlijkheid om te vertrekken wordt weergeven samen met hun contactgegevens. Hiermee kunnen de juiste klanten tijdig en gemakkelijk benaderd worden, waardoor klantbehoud toeneemt. 

Tools

Voor dit project heeft In Summa gebruik gemaakt van Azure Machine Learning Studio om de data te analyseren en verschillende Machine Learning algoritmen te trainen en te testen. Deze interactieve en visuele werkplaats van Microsoft wordt in de Cloud gedraaid en stelt de gebruiker in staat voorspellende (predictieve) modellen te bouwen en te vergelijken. Daarnaast kunnen R en Python scripts worden geïntegreerd en kunnen ontwikkelde modellen als web-service worden geïmplementeerd.

Databronnen

De benodigde data was reeds aanwezig en omvatte 18.000 (ex-) klanten met diverse klanteigenschappen (vb. leeftijd, aantal kinderen, burgerlijke staat), de omzetcijfers per kwartaal van de afgelopen 10 jaar, en de start- en eventuele einddatum van de contracten.

Machine Learning

De data is in twee delen gesplitst om de Machine Learning algoritmen te kunnen trainen en testen. In de trainingsfase leren algoritmen welke kenmerken tot customer churn leiden. In de testfase wordt gekeken hoe goed de getrainde algoritmen churn kunnen voorspellen op basis van alleen de klanteigenschappen. In de Azure Machine Learning Studio zijn verschillende algoritmen, zoals de two-class decision jungle en de two-class decision forest, tegelijkertijd getraind en getest. Op basis van verscheidene  criteria, zoals de ROC-curve en nauwkeurigheid, is vervolgens het meest geschikte algoritme gekozen. Het best functionerende algoritme is verder geoptimaliseerd door verscheidene input parameters aan te passen.

Resultaat

Het model met de hoogste evaluatiescore kon voor 80% van de klanten correct voorspellen of zij binnen een bepaalde periode zouden vertrekken. Door klanten te rangschikken op basis van de kans op churn kunnen de juiste klanten benaderd worden.

Customer Churn klantcase

Het Data Analytics team van In Summa kan aan de hand van klanteigenschappen voorspellen welke klanten dreigen weg te gaan en met welke zekerheid. Zo kunnen de juiste klanten tijdig worden benaderd waardoor klantbehoud toeneemt.