La prédiction à l’aide des séries temporelles : un outil simple et efficace

Catégorie :

Data Science

Savoir-faire :

Data & Digital Performance

Publié le :

6

September

2019

Temps de lecture :

3 minutes

#
Article
#
Séries temporelles
#
DataScience
Photo d'une personnes regardant des données graphiques sur son ordinateur
Article mis à jour le

Les mutations profondes que connaît le secteur du commerce aujourd’hui appellent les différents acteurs de la chaîne de valeur à devenir de plus en plus orientés données (data driven), afin de rationaliser les processus (gestion des stocks, des commandes, etc.) et prendre des décisions éclairées, dans un contexte où l’environnement est de plus en plus complexe.

Les techniques de prédiction exploitant les séries temporelles constituent alors un outil incontournable à double titre. D’une part, l’analyse des séries temporelles est une technologie assez mature, qui a déjà fait ses preuves puisqu’elle remonte aux années 80 (même s’il existe des techniques plus récentes, basées sur le deep learning). D’autre part, les données temporelles sont omniprésentes dans la mesure où celles-ci sont souvent collectées à travers le temps.

D’un point de vue métier, le prédictif sur des séries temporelles peut être utilisé de deux manières :

• Le prédictif permet d’aligner, en temps réel, l’offre et la demande à travers la gestion des stocks et des commandes. Cela est encore plus vrai dans le secteur alimentaire, où les éléments destinés à la vente sont périssables. La prédiction des ventes permet également à l’entreprise d’adapter sa politique commerciale et sa stratégie marketing : si les ventes sont amenées à baisser, par exemple, une offre promotionnelle peut alors être mise en place afin d’enrayer cette spirale négative.

• Le prédictif est également utile a posteriori comme outil de pilotage : la différence entre le chiffre d’affaires effectivement réalisé et le chiffre d’affaires prédit est un indicateur de la pertinence de la stratégie adoptée. Un chiffre d’affaires effectif inférieur à celui prédit, par exemple, peut constituer une alerte permettant aux responsables management de chercher les causes de la mauvaise performance et rectifier éventuellement la stratégie adoptée.

Dans la suite, nous allons considérer un cas d’usage en e-commerce : il s’agit des commandes en ligne d’un magasin appartenant à une chaîne de grande distribution.

Qu’est-ce qu’une série temporelle ?

Une série temporelle est tout simplement une suite d’observations numériques représentant l’évolution d’une grandeur au cours du temps. Dans la figure ci-dessous, on peut voir une série temporelle représentant les données de ventes du magasin en question sur plus de 700 jours. Les pics et les creux correspondent à une saisonnalité hebdomadaire (le jeudi pour les pics et le dimanche pour les creux, qui sont encore plus prononcés pendant les périodes de Noël et Pâques). On peut y voir également de longues périodes creuses, correspondant à une saisonnalité annuelle : les vacances d’été. La droite bleue tracée sur le graphique donne une tendance linéaire de l’évolution du chiffre d’affaires e-commerce sur la période considérée : celui-ci a connu globalement une légère progression entre mars 2017 et mars 2019. Ainsi, en visualisant les données à travers le temps, et à l’aide d’une simple régression linéaire, on peut avoir une intuition du profil temporel des ventes.

Représentation graphique d'une série temporelle

La prédiction avec des séries temporelles

Nous allons maintenant explorer deux techniques de prédiction avec des séries temporelles.

La première est basé sur le lissage exponentiel de Holt-Winters. C’est une méthode de prévision à court terme qui utilise une moyenne pondérée des valeurs passées pour prédire les valeurs futures.

La deuxième méthode est basée sur l’identification des fluctuations quotidiennes, de la tendance ainsi que des saisonnalités. Autrement dit, un modèle SARIMA.

Résultats des prédictions à moyen terme

Ici, les deux modèles sont entraînés ici sur un historique de données allant du 1er mars 2017 jusqu’au 28 février 2019. Les prédictions, quant à elles, sont réalisées sur les quatre premières semaines de mars 2019. L’erreur de prédiction est mesurée en considérant l’erreur relative moyenne (MAPE).

Les résultats obtenus sont illustrés dans le graphique suivant, où les prédictions obtenues à l’aide des deux méthodes (Holt-Winters en vert et SARIMA en bleu) sont comparées aux données réelles (en rouge). Comme on peut l’observer, les deux approches parviennent à capturer le profil de l’évolution des ventes. Plus quantitativement, le modèle SARIMA se révèle meilleur :  celui-ci affiche en effet une erreur relative moyenne de 8% alors qu’elle est de 10% pour le Holt-Winters. Les deux approches sont cependant très largement satisfaisantes d’un point de vue métier.

Représentation d'un série temporelle selon différentes méthodes d'analyse de la donnée

En conclusion, à l’aide de techniques assez simples, il est possible de disposer d’un outil prédictif assez puissant, qui apporte une réelle valeur ajoutée à l’organisation. Il s’agissait, dans l’exemple que nous avons considéré, de prédire le chiffre d’affaires sur une base journalière pour atteindre une gestion optimale des ressources. Quant aux autres cas d’usages qui exigent une meilleure précision dans les prédictions ou encore de tenir en compte de paramètres exogènes, il existe d’autres techniques de prédiction, notamment basées sur le deep learning, qui prennent en charge de tels besoins.

Bibliographie

https://www.rocq.inria.fr/axis/modulad/numero-35/Tutoriel-melard-35/Melard-35.pdf

https://journals.sagepub.com/doi/full/10.1177/1847979018808673

https://www.researchgate.net/

http://ressources.aunege.fr/nuxeo/site/esupversions/6649e19c-1113-4060-a809-0deb3959ffd5/res/publication_papier_prevision_130104.pdf

https://a-little-book-of-r-for-time-series.readthedocs.io/en/latest/src/timeseries.html

https://www.fevad.com/bilan-e-commerce-ventes-internet/

Keley est un partenaire de co-création parmi les meilleurs acteurs du marché, notamment via son expertise des parcours clients.

Yann Ruello

Content Innovation Director, chez Orange

Derek Aubert
Derek Aubert

Ancien Consultant Data Keley, Inspecteur Data chez La Banque Postale

Passionné par la Data Science, Derek a notamment travaillé pour Système U.

Envie de partager cet article ?
Button Text
UN PROJET DE TRANSFORMATION DIGITALE ?

Il est temps de se rencontrer ! Il vous suffit de remplir ce formulaire pour nous contacter.

La collecte des informations demandées est nécessaire au traitement de votre demande par Keley, unique entité habilitée au traitement. Elle vous permettra en premier lieu de recevoir une réponse à ce message. En cas de contact ultérieur de la part de Keley, votre consentement sera au préalable recueilli. Vous disposez d’un droit d’accès, de rectification, d’opposition et de suppression des données vous concernant. Pour l'exercer, merci de nous en faire la demande par email à l’adresse communication@keley.com.

Pictogramme blanc et jaune d'une enveloppe

Comment pouvons-nous vous aider ?

Merci pour votre message !
Oops ! On dirait qu'il y a eu un problème...

La collecte des informations demandées est nécessaire au traitement de votre demande par Keley, unique entité habilitée au traitement. Elle vous permettra en premier lieu de recevoir une réponse à ce message. En cas de contact ultérieur de la part de Keley, votre consentement sera au préalable recueilli. Vous disposez d’un droit d’accès, de rectification, d’opposition et de suppression des données vous concernant. Pour l'exercer, merci de nous en faire la demande par email à l’adresse communication@keley-consulting.com.