Logo de Keley Consulting
Menu burger à 3 traitsCroix blanche de fermeture du menu
EXPERTISE + LIBERTÉ
= OPINIONS
Filtrer

Le churn pour la starup Koober - E02

© Crédits photos –
Keley & Koober

Épisode 2 : comment et pourquoi identifier les abonnés « dormants » ?

Koober est une startup française proposant des livres au format condensé destinés à être lus ou écoutés en moins de 20 minutes, avec des abonnements annuels ou mensuels. Dans le premier épisode de cette série, nous avons identifié quatre comportements d’utilisateurs de l’application : les désengagés, les abonnés actifs, les inactifs ou dormants et les potentiels churneurs.


Les inactifs ou dormants renouvellent leur abonnement chaque mois, par prélèvement automatique, sans avoir une utilisation active de l’application et c’est à eux que nous nous intéressons dans cet épisode. Pourquoi consacrer un article entier à ce profil spécifique ? Traiter la problématique des dormants est primordiale pour deux raisons :

  • Technique : ne pas identifier et isoler les dormants biaise l’apprentissage de notre modèle de prédiction du churn
  • Stratégique : identifier les dormants et prédire les futurs dormants, permet à Koober d’ajuster son plan d’actions pour réactiver ces clients.

À partir des données mises à disposition par Koober (les historiques de connexions et de lectures de chaque utilisateur du 1er Octobre 2019 au 1er Aout 2020), nous avons déjà supprimé les abonnés annuels et les abonnés mensuels ayant moins de 35 jours d’abonnement (voir article 1).

L’identification des dormants est complexe, tant la question peut être floue et demeure peu étudiée dans la littérature. Trois questions doivent être traitées :

  • Existe-t-il effectivement des utilisateurs de Koober dormants ?
  • Quels sont les critères qui les caractériseraient ?
  • Pour quelle valeur de ces critères peut-on considérer un utilisateur comme dormant ?

Pour répondre à ces questions, nous avons écarté les churneurs de l’étude pour entraîner un modèle de détection des dormants. Une fois le modèle établi, nous l’avons appliqué sur l’ensemble de la population pour comparer les proportions de dormants vs non-dormants qui churnent ou pas.

La récence : une variable clé

Pour déterminer que certains utilisateurs de Koober sont des dormants et spécifier une séparation claire entre les dormants et les non-dormants basée sur le comportement des utilisateurs, nous avons construit plusieurs variables d’intérêt dont trois se montrent particulièrement efficaces pour caractériser cette délimitation.

La récence est la variable la plus naturelle. Elle mesure le nombre de jours écoulés depuis la dernière connexion. Plus elle est importante, plus l’utilisateur est inactif depuis longtemps ce qui peut indiquer qu’il est dormant.

Courbe de recence Koober - article Keley

70% des clients non churneurs ont une récence inférieure à 2 mois, et 82% inférieure à 3 mois.
Cependant, la récence doit être relativisée. Il serait prématuré de considérer un abonné comme dormant s’il arrête d’utiliser l’application un laps de temps, alors qu’il témoignait auparavant d’une utilisation active. De la même manière, un abonné qui se connecte très sporadiquement, ne peut pas être considéré inactif lors d’une absence prolongée.

Récence / durée d’abonnement : la récence rapportée à l’ancienneté de l’abonnement de l’utilisateur : si ce ratio est proche de 100%, c’est que l’utilisateur ne s’est pas connecté depuis sa date d’abonnement, il est d’autant plus certainement un dormant.

Récence / interconnexion maximale : la récence rapportée à l’interconnexion maximale, ou le nombre maximum de jours écoulés entre deux connexions successives de l’utilisateur. Un ratio inférieur à 1 signifie que l’utilisateur a déjà eu par le passé une période d’inactivité plus longue ; il est donc encore susceptible de redevenir actif, ce n’est alors pas un dormant.

Lire des contenus similaires :

Définition de la délimitation entre dormants et non-dormants

Pour caractériser cette délimitation entre dormants et non-dormants, un algorithme de clustering a été utilisé pour générer des groupes d’utilisateurs basés sur les valeurs des trois variables (récence, récence par durée d’abonnement et récence par interconnexion maximale). Trois clusters sont identifiés :

  • Cluster 1 « cas extrême des dormants » avec en moyenne : une récence de 128 jours représentant 69% de la durée d’abonnement et près de 9 fois plus longue que l’interconnexion maximale.
Cluster 1 cas extrêmement dormants - article Keley

  • Cluster 2 « dormants » avec en moyenne : une récence de 132 jours représentant 62% de la durée d’abonnement et plus de 3 fois plus longue que l’interconnexion maximale.
Cluster 2 cas dormants - article Keley

  • Cluster 3 « actifs » avec en moyenne : une récence de 17 jours représentant 15% de la durée d’abonnement et plus courte que l’interconnexion maximale.
Cluster 3 actifs - article Keley


Les deux premiers clusters ont des valeurs proches, et surtout très éloignées de celle du troisième cluster : nous étiquetons les utilisateurs appartenant à ces deux premiers clusters comme dormants, et ceux du troisième cluster comme non-dormants.

Ci-dessous, nous voyons clairement la répartition des dormants et des non-dormants en fonction des trois variables crées pour l’étude.

Récence par interconnexion maximale - article Keley
Récence par interconnexion maximale

Récence par durée d'abonnement - article Keley
Récence par durée d'abonnement


Cette séparation permet une détection fine des dormants, en tenant compte de l’historique de comportement des utilisateurs.

Cela permet d’obtenir un modèle d’apprentissage supervisé (régression logistique) pour prédire si un utilisateur est dormant ou non. L’entraînement s’effectue à partir de l’échantillon fourni pour le clustering, et sur les trois variables récence, récence par durée d’abonnement et récence par maximum d’interconnexion, avec la variable dormant comme valeur cible (0 ou 1, selon l’étiquetage résultant du clustering préalable).

Le sujet vous intéresse ? Découvrez-en plus sur :

Une fois le modèle entraîné, nous pouvons l’appliquer sur tous les utilisateurs à chaque mise à jour des variables liées à la récence : le modèle prédira alors si l’utilisateur est un potentiel dormant ou non.
La fonction logistique pour prédire les dormants s’exprime ainsi :


p(X) est la probabilité qu’un utilisateur soit dormant,
X_Récence : la valeur de la récence (en jours) de l’utilisateur
X_(Récence/DuréeAbo) : la valeur de la récence sur la durée d’abonnement
X_(Récence/MaxInterco) : la valeur de la récence sur le maximum d’interconnexion

On peut donc prédire que l’utilisateur est dormant ou va le devenir si sa p(X) est supérieure à 50%.

Une autre approche, plus simple à interpréter, consiste à utiliser un modèle basé sur des règles de décisions. Cette approche a donné le résultat suivant :

Modèle de détermination de profils dormants - article Keley

Nous avons donc désormais à notre disposition deux outils convergents permettant de classifier un utilisateur comme étant un dormant ou non.

Les dormants peuvent-ils être des churneurs ?

Sur la base de cette classification, il est intéressant de se demander de quel côté se trouvaient les churneurs avant leur désabonnement. À l’aide du modèle supervisé établi ci-dessus, nous avons déterminé, parmi les utilisateurs, churneurs ou non, s’ils sont dormants ou non. Nous obtenons alors la matrice suivante :

Churner Non Churneur
Dormant 2,09% 6,86%
Non Dormant 42,02% 49,03%
44,11% 55,89%

Peu de churneurs sont prédits dormants avant leur résiliation (moins de 5%). Et, moins de 24% des dormants churnent, soit près de deux fois moins que pour les non-dormants.

Conclusion

Dans cet article, nous avons mis au point deux modèles permettant de prédire efficacement si un utilisateur est dormant, sans qu’il soit sur le point de churner. L’identification de ces profils peut permettre à Koober de réactiver un client avant qu’il devienne dormant à travers des actions adaptées, par exemple en lui recommandant des livres qui correspondent à ses préférences.

Les utilisateurs aux profils singuliers ayant été identifiés, nous pouvons désormais étudier les conditions conduisant au churn, et prédire les potentiels churneurs. Dans le troisième et dernier article de cette série, nous détaillerons les variables – liées aux historiques de connexion et de lecture des utilisateurs – et le modèle permettant de prédire quels sont les clients au bord du churn.

Rendez-vous dans notre épisode 3 pour lire les résultats de nos modèles de prédiction !

Cette série d'articles a été écrite avec la participation de Vincent Talbo, Imane Bouzid, Hatime Araki et les équipes Koober.

Oussama Raboun

Ingénieur en recherche chez Keley Data

Diplômé d’un Doctorat en informatique obtenu à l’Université Paris-Dauphine, d’un Master de recherche Paris-Dauphine et Mines ParisTech et d’un diplôme d’ingénieur en ingénierie mathématique, Oussama a rejoint Keley Data afin de construire de nouveaux modèles d'aide à la décision pour nos clients.

Partager cet article :

Vous avez un projet digital ? Nous pouvons vous aider à définir et concrétiser rapidement votre stratégie.

Contactez-nous
Filtrer

Inscrivez-vous à la newsletter Keley

Recevez tous les mois nos paroles d'experts et l'actualité du digital dans notre newsletter.

Merci ! Votre message a bien été envoyé.
Désolé ! Votre message n'a pu être envoyé.

La collecte des informations demandées est nécessaire au traitement de votre demande par Keley, unique entité habilitée au traitement. Elle vous permettra de recevoir chaque mois la newsletter Keley, mais aussi de recevoir en avant-première des invitations à nos événements et de donner votre avis lors d'enquêtes. Pour tout autre type de contact, votre consentement sera au préalable recueilli. Vous disposez d’un droit d’accès, de rectification, d’opposition et de suppression des données vous concernant. Pour l'exercer, merci de nous en faire la demande par email à  communication@keley-consulting.com.