Customer Churn Prediction: Vorhersagen, wann Kunden kündigen

Customer Churn Prediction sagt mittels Machine Learning vorher, wann Kunden ihre Mitgliedschaft kündigen oder Stammkunden nicht mehr einkaufen. Diese Information verlässlich vorherzusagen ist so wertvoll wie herausfordernd. In diesem Artikel möchten wir Customer Churn Prediction definieren, die einsetzbaren Methoden vorstellen und Vorteile und Gefahren erläutern.

Inhaltsverzeichnis

Was ist Customer Churn Prediction? Eine Definition.

To churn, auf Deutsch so viel wie „umwälzen“, wird im Zusammenhang von Customer Churn auf die Abwanderung von Kunden bezogen. Folglich ist die Customer Churn Rate die Kundenabwanderungsrate. Als Beispiel nehme man ein beliebiges Unternehmen, das wiederkehrende Kundenbeziehungen pflegt: Netflix, Amazon oder jeder B2B-Händler. Sobald man Kunden hat die mehrmals beim Unternehmen eingekauft haben oder eine Mitgliedschaft aufrechterhalten, gelten sie als wiederkehrende oder loyale Kunden.

Wiederkehrende Kunden haben den Vorteil, dass man sie besser mit Marketingmaßnahmen bespielen kann und sie eine gewisse Verlässlichkeit der Verkaufsplanung, vor allem bei Abo-Modellen wie Netflix, mit sich bringen. Je nach Studie zeigt sich, dass wiederkehrende Kunden um einen bis zu 20 fachen Umsatz generieren als Einmalkunden. Daher ist es für Unternehmen wichtig zu wissen, wie viele dieser wiederkehrenden Kunden abwandern werden – einerseits auf einem makroskopischen Level um die Unternehmensprozesse zu steuern, andererseits auf einem mikroskopischen Level um Gegenmaßnahmen für jeden Kunden einzuleiten.

Customer Churn Prediction ist also auf Deutsch die Vorhersage der Abwanderung von Kunden. Dabei wird mittels statistischer Modellierung (Machine Learning auf Big Data) berechnet, wie viele Kunden im kommenden Zeitraum (z.B. Monat oder Quartal) in Gefahr sind, zu kündigen oder nicht wiederzukehren. In fortgeschritteneren Analysen werden auch genau die Kunden identifiziert, die in diese Kategorie fallen um sie beispielsweise durch Servicemitarbeiter kontaktieren zu lassen. Hat ein Unternehmen sogar Prescriptive Analytics etabliert, würden Algorithmen auch automatisch diese in Gefahr laufende Kunden identifizieren und ein passgenaues Angebot zur „Customer Retention“ ausspielen.

Welche Vorteile bietet Customer Churn Prediction?

Wie bereits skizziert, sind wiederkehrende Kunden bzw. treue Abonnenten sehr wertvoll für ein Unternehmen. Sie kosten kein Geld mehr in der Akquise (z.B. Werbung, AdWords, Gutscheine), man kann ihr Verhalten und somit ihre Vorlieben bereits analysieren (Personalisierung) und sie sorgen für eine verlässliche Planung von Umsatzzahlen durch oft zyklisches Einkaufsverhalten, vor allem bei monatlichen Bedarfen und/oder fixen Abrechnungszeiträumen.

Customer Churn Prediction setzt genau hier an. Durch den sehr hohen Wert von Stammkunden kann ein Unternehmen einerseits vorhersagen wie sich die gesamte Kundenabwanderungsrate verhalten wird (Customer Churn Rate), andererseits bezogen auf Einzelfallbasis vorhersagen ob ein Kunde abwandern oder einfach kündigen wird.

Der Fall der Customer Churn Rate ist ein wichtiges Thema in der Unternehmenssteuerung und der Organisation von Prozessen innerhalb eines Unternehmens. Wenn man vorhersagen kann, mit wie viel „Mindestumsatz“ ein Unternehmen in den nächsten Monaten rechnen kann, kann entsprechend gesteuert werden. Ob nun Lieferantenkonditionen, Service-Mitarbeiter oder Recruiting: Alle operativen Aspekte hängen an der Kette des Ab- und Umsatzes eines Unternehmens und sind somit bei Wissen über diese Daten besser zu planen.

Während die Customer Churn Rate ein wichtiges strategisches Instrument ist, kann die Customer Churn Prediction auf Einzelkundenbasis noch mehr Dienste leisten. Da man durch die Vorhersage kundengenau bestimmen kann, wer sich vom Unternehmen wahrscheinlich abwendet, kann diese Information genutzt werden, um Gegenmaßnahmen zu ergreifen. Ob nun ein Gutschein oder ein individuelles Angebot – die Möglichkeiten um die User Retention hoch zu halten können vielfältig sein.

Neben diesen Hauptvorteile gibt es zwei weitere Aspekte, die oft übersehen werden, wenn sich ein Unternehmen einem Churn Prediction Projekt annimmt. Der erste Faktor ist, dass – je nach eingesetzter KI – nicht nur das „Ob“ einer Kundenabwanderung vorhergesagt werden kann, sondern auch das „Wann“. Diese Information eignet sich hervorragend bei der Neukundenakquise oder im Customer Management: Wenn ich eine Wahrscheinlichkeit kenne, dass ein Kunde einen langen Zeitraum beim Unternehmen bleibt, kann ich entsprechend in diesen Kunden investieren. Im Umkehrschluss lohnt es sich gegebenenfalls ebenso, bei Kunden zu investieren, die gemäß Vorhersage nicht lange bleiben – falls sie nicht entsprechenden Service bekommen.

Der zweite sehr interessante Aspekt interagiert sehr stark mit den Konsequenzen des Wissens falls ein Kunde churnt. Denn – je nach Machine Learning Modell – kann man auch mittels der Algorithmen identifizieren, welche Faktoren einen großen Effekt auf den Customer Churn haben (z.B. Alter, Geschlecht, Anzahl an gekauften Produkten) und welche nicht (z.B. Ort, Jahreszeit). Mit diesem Wissen lässt sich dann möglichst zielgerichtete jede Maßnahme steuern und mit einem möglichst großen Effekt versehen – um Kunden lange zu binden.

Welche Methoden werden in der Churn Prediction eingesetzt?

Customer Churn Prediction ist ein Titel für einen Anwendungsfall innerhalb von Data Science bzw. im Machine Learning. Daher werden hierbei meist vor allem Supervised Machine Learning Methoden eingesetzt. Diese Methoden nutzen vorhandene Information (zum Beispiel die Information, welche Kunden bereits real abgewandert sind / nicht mehr kaufen / gekündigt haben) und errechnen darauf ein möglichst realitätsgetreues statistisches Modell.

Dabei gibt es zwei Arten von Supervised Machine Learning Algorithmen die bei Customer Churn oft zum Einsatz kommen. Möchte man nur das „Ob“, also die Customer Churn Rate vorhersagen oder ggf. eine binäre Vorhersage (Ja / Nein bzw. Wandert ab / wandert nicht ab) treffen, werden Klassifikationsalgorithmen eingesetzt. Diese Classifier (zum Beispiel logistische Regression, neuronale Netze / Deep Learning, Random Forests) ordnen neue Datensätze (zum Beispiel einen Kunden, der bisher Stammkunde ist) gemäß Modell in eine Kategorie („Abwanderer“ / „Stammkunde“).

Die andere Methodengruppe fällt in den Bereich der Regression. Die Regressionsalgorithmen sagen numerische Werte, also im Fall von Customer Churn Prediction die Dauer der Zugehörigkeit, vorher. Möchte man beispielsweise beim Abschluss eines Vertrags mit seinem Kunden bereits evaluieren, wie wahrscheinlich es ist, dass er lange Kunde bleibt – um ggf. entsprechende Konditionen anzubieten – kann eine Regression abschätzen, wie viele Monate oder Jahre er beim Unternehmen bleiben wird.

Während Supervised Machine Learning definitiv den Kern von Churn Prediction bildet, können natürlich auch andere Algorithmen und Datenanalysen zum Einsatz kommen. Angeführt von einfacher deskriptiver Datenanalyse zur explorativen Analyse über Unsupervised Machine Learning um Kundengruppen zu identifizieren bis hin zu Reinforcement Learning ist vieles möglich und nur der Wille zum Aufwand begrenzt die Kreativität.

Welche Daten kann man zur Customer Churn Prediction nutzen?

Es gibt eine ganze Bandbreite an Daten, die bei Customer Churn Prediction zum Einsatz kommen können. Die Empfehlung ist wie üblich im Machine Learning, sich erst einen Überblick zu verschaffen und dann mittels Feature Engineering und Feature Selection großzügig Datenquellen auszuschließen. Hier ein paar Anregungen, welche Daten zur Vorhersage von Customer Churn eingesetzt werden können:

  • Customer Management System (CMS)-Daten: Der hoffentlich beste Fundus an Daten für Customer Churn ist das CMS. Im Kundenverwaltungssystem sollten alle Stammdaten rund um einen Kunden gespeichert und seiner ID zugeordnet sein: Geschlecht, Alter, E-Mail-Provider, Dauer der Mitgliedschaft / Datum des Erstkaufs,
  • Transaktionsdaten: Doch die Kundenstammdaten alleine beinhalten meist nur einen Teil der Information, was einen Kunden ausmacht. Ein großer anderer Teil kommt üblicherweise aus Transaktionsdaten – ob nun E-Commerce-Shop, Enterprise Resource Planning (ERP) System oder andere: Welcher Kunde mit welchem Produkt oder Service interagiert und auf welche Art und Weise ist von hoher Relevanz für die Bindung von Kunden.
  • Produktdaten: Ob nun PIM oder MDM – die Information über die gekauften Produkte kann sehr gute Rückschlüsse zulassen, um welche Kundengruppe es sich handelt und ob eine langfristige Beziehung möglich ist.
  • Service Daten: Im Kundenservice laufen oft positive und auch negative Erlebnisse zusammen. So ist es nicht verwunderlich, dass oft kurz vor einer Abwanderung ein Servicekontakt zustande kam. Daher sind Service Daten in möglichst detaillierter Form ein großer Beitrag zur Genauigkeit des Modells.
  • Promotionsdaten: Wer seine Marketingdaten und somit alle Promotionen sauber in einem System erfasst, kann im Optimalfall auch Rückschlüsse ziehen welcher Kunde aufgrund welcher Promotion eine Geschäftsbeziehung einging. Oft sind es Einmalkunden, die nur durch eine besonders gute Promotion gekauft haben, dann aber sehr schwierig zu Stammkunden konvertieren.
  • Webanalytics: Sauberes Tracking im Webanalytics erlaubt es, das Verhalten der Kunden auf der Website, im E-Shop und weiteren wichtigen digitalen Produkten zu verfolgen. Dies wiederum ist ein sehr guter Input für viele Modelle, um die Vorhersage zu optimieren.
  • Newsletterdaten: Wer häufig positiv mit dem Unternehmen agiert, hat üblicherweise eine höhere Wahrscheinlichkeit der Organisation positiv gegenüber zu stehen. Folglich sind Newsletter-Interaktionen oft ein Signal für langfristige Kundenbeziehungen.
  • Geographische und Soziodemographische Daten: Wo die Kunden wohnen, wie alt sie sind und aus welcher Bevölkerungsschicht sie kommen lässt oft Rückschlüsse auf Wechselverhalten zu.
  • Bewegungsdaten: Reden wir von Kunden die sich auch in einem physischen Objekt wie einem Laden bewegen können, können wir hier Daten erfassen. Sicherlich nicht der Standard E-Commerce-Shop Datensatz, aber fast immer sehr interessant.

Selbstverständlich gibt es noch viele weitere, meist aber auch sehr individuelle Datenquellen, die die Genauigkeit von Customer Churn Prediction unterstützen. Daher gilt für jedes Unternehmen, eine umfassende Dateninventur zu vollziehen und somit das Potential für Churn Analysen zu definieren.

Welche Probleme und Herausforderungen gibt es bei Customer Churn Prediction?

Natürlich ist auch die Herangehensweise von Customer Churn Prediction kein Allheilmittel. Auch bei der besten Vorhersage gibt es Herausforderungen. Das einfachste Beispiel ist wohl eine schlechte Vorhersage: Versucht man Kunden zu „behalten“, die gar nicht in Absicht standen das Unternehmen zu verlassen, kann es sein dass man unnötige Ausgaben hat. Hierbei spielt auch Datenqualität eine große Rolle. Nur wenn die eingesetzten Daten von hoher Qualität sind, kann auch die Vorhersagequalität entsprechend hoch sein.

Interessant ist auch der Punkt, dass sich operative Customer-Retainment-Prozesse vor allem im Zeitalter des Internets schnell herumsprechen. Wurde ein Standardprozess etabliert, der uniform auf alle Kunden „in Gefahr“ angewandt wird (zum Beispiel 2 Monate Abo gratis), wird dieser schnell breit kommuniziert. Das hat zur Folge, dass viele Kunden diesen Prozess nutzen indem sie ihn gezielt auslösen, obwohl sie ggf. nicht einmal vor hatten zu wechseln. Ein einfaches Beispiel sind die Prozesse bei Telekommunikationsunternehmen, die zum Ende der 24 monatigen Laufzeit immer neue Angebote anbieten können, statt diese Ersparnisse einfach kohärent auf ihre Paketpreise umzulegen.

Als dritte sehr valide Kritik kann auch gelten, dass in dem Moment in dem ein potentieller Customer Churn detektiert wurde, es schon zu spät sein kann. Stehen alle Verhaltensanzeichen bereits auf dem Kurs der Kündigung bzw. des Abwanderns, kann es gegebenenfalls nicht mehr möglich sein, diese Kunden zu besänftigen. Folglich wären alle Aufwände, die in diese Aktivitäten fließen, auch umsonst – also ein unnötiger Kostenfaktor.

Diesen Nachteilen zum Trotz sehen wir Customer Churn Prediction dennoch als sehr wertvolles Werkzeug um datenbasiert Wissen über seine Kunden aufzubauen. Wie dieses Werkzeug dann eingesetzt wird, muss sehr penibel – aber auch kreativ – mit den jeweiligen Fachabteilungen erarbeitet werden.

Zusammenfassung

Die schönste Metapher für eine hohe Customer Churn Rate finde ich den Eimer, der Löcher hat. Man schüttet immer weiter oben Wasser rein, aber egal wie sehr man es versucht, der Eimer wird immer schnell leer. Die Customer Churn Prediction versucht nun dieses Problem anzugehen, indem es untersucht, wie groß die Löcher sind und wo sie liegen – reparieren muss man sie allerdings dann noch immer.

Von daher ist Customer Churn Prediction ein klassischer Use Case für die Anwendung von Künstlicher Intelligenz, welcher als sehr wertvolles, direkt effizientes Werkzeug eingesetzt werden kann. Denn Stammkunden sind treue Kunden. Und treue Kunden erlauben es einem Unternehmen, langfristig erfolgreich zu sein.

Customer Churn Prediction durchführen

Bleibt die Frage: Wie kann man Customer Churn Prediction durchführen? Durch die Verfügbarkeit von Self-Service KI-Produkten bietet Kobold AI eine sehr einfache Möglichkeit für Nicht-Experten, eine Vorhersage der Kundenabwanderung durchzuführen. Einfach das Produkt Auswählen, Daten hochladen und Ergebnisse automatisch geliefert bekommen. Weitere Infos direkt hier: