Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Sleiman Rita DLE

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 173

Détection de tendances et prévision de la demande

d’articles de mode par les données massives et


l’intelligence artificielle
Rita Sleiman

To cite this version:


Rita Sleiman. Détection de tendances et prévision de la demande d’articles de mode par les données
massives et l’intelligence artificielle. Automatique. Centrale Lille Institut, 2022. Français. �NNT :
2022CLIL0031�. �tel-04082597�

HAL Id: tel-04082597


https://theses.hal.science/tel-04082597
Submitted on 26 Apr 2023

HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est


archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents
entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non,
lished or not. The documents may come from émanant des établissements d’enseignement et de
teaching and research institutions in France or recherche français ou étrangers, des laboratoires
abroad, or from public or private research centers. publics ou privés.
THESE

Présentée en vue d’obtenir


le grade de

DOCTEUR
En
Automatique, Génie Informatique et Traitement du Signal et des Images
Par
Rita SLEIMAN

DOCTORAT DELIVRE PAR CENTRALE LILLE

Titre de la thèse :
Détection de tendances et prévision de la demande d’articles de
mode par les données massives et l’intelligence artificielle
Soutenue le 15 décembre 2022, devant le jury d’examen :

Président Abdessamad KOBI, Professeur des universités, Université d’Angers

Rapporteur Imed KACEM, Professeur des universités, Université de Lorraine


Rapporteur Thi Le Hoa VO, Maîtresse de conférences HDR, IGR-IAE Université de Rennes 1
Examinateur Abdessamad KOBI, Professeur des universités, Université d’Angers
Examinateur Denis HAMAD, Professeur des universités, Université Littorale Côte d’Opale
Invité Eric STANIEK, DRESS - Région Hauts de France
Invité Marie-Claire BILBAULT, Université de Lille
Directeur de thèse Sébastien THOMASSEY, Maître de conférences HDR, Université de Lille
Codirecteur de thèse Kim-Phuc TRAN, Maître de conférences HDR, Université de Lille

Thèse préparée dans le laboratoire GEMTEX


Ecole Doctorale MADIS 631
Remerciements

Tout d’abord, je rends grâce à DIEU Tout-Puissant, Maître de toute chose, qui m’a donné la force,
la patience et l’audace pour surmonter toutes les difficultés.

Je tiens particulièrement à remercier la Région Hauts-de-France, l’I-SITE ULNE et Camaieu pour


le soutien financier qu’ils ont apporté rendant ainsi possible cette recherche.

Je souhaite exprimer ma profonde gratitude à mes directeurs de recherche, Monsieur Sébastien


THOMASSEY et Monsieur Kim-Phuc TRAN, pour m’avoir accompagnée, aidée et soutenue tout
au long de ce doctorat, tant au niveau personnel que professionnel.

Je tiens également à remercier très sincèrement Monsieur Imed KACEM et Madame Thi Le Hoa
VO pour avoir accepté d’être rapporteurs de ce travail, Monsieur Abdessamad KOBI et Monsieur
Denis HAMAD, pour avoir accepté d’être examinateurs, ainsi que Monsieur Eric STANIEK et
Madame Marie-Claire BILBAULT pour avoir accepté de participer à mon jury de thèse.

Je suis reconnaissante envers mes parents, René et Claudette, qui me poussent toujours à aller aussi
loin que possible et à poursuivre mes ambitions. Leur amour, leur soutien et leurs encouragements
constants me permettent de rester motivée et confiante. Mes réalisations et mes succès sont dus au
fait qu’ils ont toujours cru en moi.

Enfin, je tiens à remercier toutes les personnes qui ont indirectement contribué à la réalisation de
ce travail, en particulier mes collègues du laboratoire, ainsi que mes amis Joelle, Ghadie, Zeinab,
Grêce, Rima, Dina, Michel et Joy. Merci de m’avoir encouragée, soutenue et motivée à chaque
fois que j’en avais besoin.

1
Table des matières
REMERCIEMENTS .................................................................................................................... 1
INTRODUCTION GÉNÉRALE ................................................................................................. 9
CHAPITRE I PRÉVISION DE LA DEMANDE DANS L’INDUSTRIE DE MODE....... 15
I. 1 INTRODUCTION ..................................................................................................................... 15
I. 2 CONTEXTE ............................................................................................................................ 15
I. 2. 1 Caractéristiques de l’industrie de la mode ................................................................. 17
I. 2. 2 Cycle de vie d’un produit de mode .............................................................................. 18
I. 2. 3 La mode éphémère : Fast Fashion .............................................................................. 20
I. 2. 4 Prévision de la demande pour la gestion de la chaîne d’approvisionnement ............ 22
I. 3 ETUDE BIBLIOGRAPHIQUE SUR LA PRÉVISION DES VENTES ................................................... 24
I. 3. 1 Méthodes utilisées pour la prévision des ventes ......................................................... 24
I. 3. 1. 1 Méthodes classiques pour la prévision des ventes dans le secteur la mode ...................... 24
I. 3. 1. 2 Méthodes d’Intelligence Artificielle ................................................................................. 26
I. 3. 1. 3 Méthodes hybrides ............................................................................................................ 29
I. 3. 2 Evaluation de la performance du système de prévision .............................................. 31
I. 4 BIG DATA : L’ACCÉLÉRATEUR D’INNOVATION DANS L’INDUSTRIE DE MODE ........................ 32
I. 4. 1 Concept de Big Data ................................................................................................... 32
I. 4. 2 L'utilité du Big Data dans l'industrie de la mode........................................................ 33
I. 4. 2. 1 Les réseaux sociaux comme source de Big Data de la mode ou Fashion Big Data ......... 34
I. 4. 2. 2 Valorisation du contenu et des données générées par l’utilisateur ................................... 35
I. 4. 2. 3 Applications diverses pour le secteur de la mode ............................................................. 36
I. 4. 3 Détection des tendances de la mode à l’ère de Big Data............................................ 37
I. 4. 3. 1 Pratiques liées à la prévision des tendances de la mode ................................................... 37
I. 4. 3. 2 Etude bibliographique sur la prévision des tendances ...................................................... 39
I. 5 PROCESSUS DE PRÉDICTION DE LA DEMANDE DE LA MODE ................................................... 42
I. 6 CONCLUSION ........................................................................................................................ 44
CHAPITRE II TECHNIQUES D’INTELLIGENCE ARTIFICIELLE ............................. 47
II. 1 INTRODUCTION ................................................................................................................... 47
II. 2 RÉSEAUX DE NEURONES ARTIFICIELS .................................................................................. 49
II. 2. 1 Réseaux de neurones classiques ................................................................................ 49
II. 2. 1. 1 Evaluation des neurones .................................................................................................. 50
II. 2. 1. 2 Processus d’apprentissage ............................................................................................... 50
II. 2. 2 Réseaux de neurones convolutifs ............................................................................... 51
II. 2. 3 Transformateurs ......................................................................................................... 55
II. 2. 3. 1 Architecture d’un transformateur .................................................................................... 55
II. 2. 3. 2 Self-Attention .................................................................................................................. 58
II. 2. 3. 3 Multi-head attention ........................................................................................................ 59
II. 3 RANDOM FOREST ................................................................................................................ 59
II. 4 K-MOYENNES ...................................................................................................................... 61
II. 5 ANALYSE DU TEXTE ET TRAITEMENT AUTOMATIQUE DU LANGAGE NATUREL..................... 62

2
II. 5. 1 BERT .......................................................................................................................... 64
II. 5. 2 CamemBERT .............................................................................................................. 66
II. 6 ALGORITHME GÉNÉTIQUE ................................................................................................... 67
II. 6. 1 Opérateurs génétiques ............................................................................................... 68
II. 6. 2 Processus général ...................................................................................................... 69
II. 7 EXPLICABILITÉ DES MODÈLES D'APPRENTISSAGE AUTOMATIQUE ........................................ 70
II. 8 CONCLUSION ....................................................................................................................... 71
CHAPITRE III DÉTECTION DES TENDANCES DE MODE ET PRÉDICTION DES
PRÉFÉRENCES CLIENTS ....................................................................................................... 72
III. 1 INTRODUCTION .................................................................................................................. 72
III. 2 DÉTECTION DES TENDANCES À PARTIR DES RÉSEAUX SOCIAUX ......................................... 73
III. 2. 1 Méthodologie générale ............................................................................................. 74
III. 2. 2 Extraction des données ............................................................................................. 75
III. 2. 3 Extraction d’information utiles et structurées .......................................................... 76
III. 2. 3. 1 Agrégation des blogs ...................................................................................................... 78
III. 2. 3. 2 Préparation et nettoyage des données ............................................................................ 78
III. 2. 3. 3 Extraction de mots et de combinaisons de mots ............................................................ 78
III. 2. 3. 4 Développement d’un dictionnaire de mode ................................................................... 79
III. 2. 3. 5 Filtrage des expressions liées à la mode et classification des mots ............................... 80
III. 2. 4 Obtention des connaissances sur les tendances de la mode ..................................... 81
III. 2. 5 Résultats du système de détection des tendances ..................................................... 81
III. 2. 5. 1 Détection des tendances ................................................................................................. 81
III. 2. 5. 2 Evolution des tendances ................................................................................................. 84
III. 3 PRÉDICTION DES PRÉFÉRENCES DES CLIENTS ..................................................................... 89
III. 3. 1 Méthodologie générale ............................................................................................. 89
III. 3. 2 Données utilisées ...................................................................................................... 90
III. 3. 3 Extraction d’information et définition de nouveaux attributs .................................. 92
III. 3. 3. 1 Traitement du texte ........................................................................................................ 92
III. 3. 3. 2 Clustering des images .................................................................................................... 92
III. 3. 3. 3 Analyse des actions historiques ..................................................................................... 93
III. 3. 3. 4 Clustering des utilisateurs selon leurs préférences de styles .......................................... 95
III. 3. 4 Modèle de prédiction ................................................................................................ 96
III. 3. 5 Résultats de la prédiction des préférences clients .................................................... 97
III. 3. 5. 1 Clusters des images ........................................................................................................ 97
III. 3. 5. 2 Clusters des styles .......................................................................................................... 98
III. 3. 5. 3 Base de données structurée .......................................................................................... 101
III. 3. 5. 4 Prédiction des préférences clients ................................................................................ 102
III. 3. 5. 5 Interprétation des résultats ........................................................................................... 103
III. 4 CONCLUSION ................................................................................................................... 105
CHAPITRE IV PRÉVISION DES VENTES ET DE LA DEMANDE DE MODE .......... 107
IV. 1 INTRODUCTION ................................................................................................................ 107
IV. 2 PRÉDICTION DES VENTES PAR ARTICLE DANS LE CONTEXTE EXCEPTIONNEL DE LA COVID-19
................................................................................................................................................. 108

3
IV. 2. 1 Description du problème ........................................................................................ 108
IV. 2. 2 Méthodologie générale ........................................................................................... 111
IV. 2. 2. 1 Profils de ventes historiques ........................................................................................ 113
IV. 2. 2. 2 Prédiction des profils de ventes ................................................................................... 113
IV. 2. 2. 3 Correction des ventes prédites ..................................................................................... 116
IV. 2. 3 Application sur des données réelles........................................................................ 118
IV. 2. 3. 1 Description des données .............................................................................................. 118
IV. 2. 3. 2 Prétraitement des données ........................................................................................... 119
IV. 2. 3. 3 Comparaison avec l'état de l'art ................................................................................... 120
IV. 2. 4 Résultats et discussion ............................................................................................ 121
IV. 2. 4. 1 Prédiction des profils de ventes dans un contexte normal ........................................... 121
IV. 2. 4. 2 Correction des profils de ventes................................................................................... 126
IV. 3 PRÉVISION DES VENTES À LONG TERME PAR FAMILLE DE PRODUITS INTÉGRANT LES IMPACTS
DES VARIABLES EXPLICATIVES ................................................................................................. 129
IV. 3. 1 Modèle Basé sur un Système de Capture d’Influence MBSCI ................................ 130
IV. 3. 1. 1 Système de prévision global ........................................................................................ 131
IV. 3. 1. 2 Processus d’apprentissage du MBSCI ......................................................................... 132
IV. 3. 2 Résultats des prévisions du modèle MBSCI ............................................................ 134
IV. 3. 2. 1 Description des données .............................................................................................. 134
IV. 3. 2. 2 Résultats de prédictions de ventes en utilisant les variables explicatives liées aux soldes
...................................................................................................................................................... 136
IV. 4 PRÉVISION DES VENTES EN INTÉGRANT LES TENDANCES DU MARCHÉ .............................. 140
IV. 4. 1 Systèmes proposés pour la prévision de ventes avec les tendances de mode ......... 140
IV. 4. 2 Données utilisées pour la prévision de ventes avec tendances de mode ................ 141
IV. 4. 3 Résultats de la prévision de ventes avec tendance de mode ................................... 146
IV. 5 CONCLUSION ................................................................................................................... 149
CONCLUSION GÉNÉRALE ET PERSPECTIVES ............................................................ 150
RÉFÉRENCES .......................................................................................................................... 157
PUBLICATIONS ...................................................................................................................... 169
RÉSUMÉ / ABSTRACT .......................................................................................................... 170

4
Liste des figures
Figure I-1 : Planning de production d'une collection de mode ................................................................................... 17
Figure I-2 : Caractéristiques de l'industrie de la mode moderne [11] ........................................................................ 18
Figure I-3 : Courbes du cycle de vie des produits de mode [15] ................................................................................ 19
Figure I-4 : Principe du processus du modèle de prévision proposé par [36] ............................................................ 43
Figure I-5 : Structure d'agrégation des données [154] ............................................................................................... 44
Figure I-6 : Méthodologie globale proposée de la prévision de la demande .............................................................. 46
Figure II-1 : Domaines d'application de l'IA............................................................................................................... 48
Figure II-2 : Structures possibles d'un réseau de neurones ........................................................................................ 50
Figure II-3 : Exemple d'une architecture CNN pour une classification d'images ....................................................... 52
Figure II-4 : Composants d'un transformateur ........................................................................................................... 56
Figure II-5 : Couches d'un encodeur/Décodeur .......................................................................................................... 56
Figure II-6 : Architecture d'un transformateur [165] ................................................................................................. 57
Figure II-7 : Fonctionnement d'un RF......................................................................................................................... 61
Figure II-8 : Organigramme de l'AG .......................................................................................................................... 70
Figure III-1 : Le Modèle « DIKW » [179] ................................................................................................................... 73
Figure III-2 : Méthodologie globale du système de détection des tendances .............................................................. 75
Figure III-3 : Méthodologie proposée pour l'extraction des expressions liées à la mode à partir des blogues .......... 77
Figure III-4 : Exemple d’extraction des expressions de mode .................................................................................... 80
Figure III-5 : Exemple du système de détection des tendances appliqué sur un seul blogue ...................................... 82
Figure III-6 : Quelques tendances détectées pour différentes familles de produitsdans les blogs de mode entre août
2019 et février 2020 ..................................................................................................................................................... 84
Figure III-7 : Quelques tendances détectées pour la famille de produits des vestes dans les blogs de mode entre
novembre 2018 et décembre 2018 ............................................................................................................................... 84
Figure III-8 : Comparaison de l'évolution de la tendance "Matière = Cachemire" par mois détectée par le système
proposé et celle fournie par Google Trends ................................................................................................................ 86
Figure III-9 : Comparaison de l'évolution de la tendance "Motif = Carreaux" par mois détectée par le système
proposé et celle fournie par Google Trends ................................................................................................................ 86
Figure III-10 : Exemple d'évolution des tendances de quelques sous-catégories de la famille des vestes par an ...... 87
Figure III-11 : Exemple d'évolution des tendances des couleurs par an ..................................................................... 87
Figure III-12 : Exemple d'évolution des tendances des matières par an ..................................................................... 88
Figure III-13 : Exemple d'évolution des tendances des motifs par an ......................................................................... 88
Figure III-14 : Méthodologie proposée pour la prédiction des préférences clients .................................................... 89
Figure III-15 : Exemple d'un produit de mode tel que présenté dans l'application Matchmarket .............................. 91
Figure III-16 : Processus du clustering des images .................................................................................................... 93
Figure III-17 : Structure du vecteur binaire représentant le profil de style initial d'un utilisateur ............................ 95
Figure III-18 : Echantillons des clusters des images .................................................................................................. 98
Figure III-19 : Matrice de similarité Jaccard des distances entre les 15 styles selon tous les utilisateurs ................. 99
Figure III-20 : Structure du vecteur binaire représentant le profil de style d'un utilisateur après une réduction de
dimensionnalité............................................................................................................................................................ 99
Figure III-21 : Matrice de similarité Jaccard des préférences de style des utilisateurs et les centres des 8 clusters
................................................................................................................................................................................... 100
Figure III-22 : Matrice de confusion ......................................................................................................................... 103
Figure III-23 : L'importance des caractéristiques en utilisant MDI ......................................................................... 104
Figure III-24 : Exemple de diagramme de décision pour un ensemble donné de caractéristiques ........................... 105
Figure IV-1 : Comparaison des ventes en ligne entre les années 2019 et 2020 pour l’enseigne de mode considérée
................................................................................................................................................................................... 110
Figure IV-2 : Aperçu de la méthodologie proposée .................................................................................................. 111
Figure IV-3 : Représentation schématique du système de prévision des ventes proposé .......................................... 112
Figure IV-4 : Clustering des profils de vente ........................................................................................................... 115
Figure IV-5 : Classification Random Forest ............................................................................................................. 115

5
Figure IV-6 : Quelques exemples de profils de ventes dans le cas de ventes normalisées (à gauche) et de ventes
normalisées cumulées (à droite) ................................................................................................................................ 120
Figure IV-7 : Erreur quadratique moyenne obtenue par validation croisée en fonction du nombre de clusters. ..... 122
Figure IV-8 : Clusters obtenus à partir des profils de vente de la famille des robes ................................................ 122
Figure IV-9 : Erreurs quadratiques moyennes lors de l'utilisation des méthodes de clustering K-moyennes et SOM-
K-moyennes. .............................................................................................................................................................. 123
Figure IV-10 : Erreurs quadratiques moyennes lors de l'application de la méthodologie proposée aux ventes
normalisées et cumulées normalisées. ....................................................................................................................... 123
Figure IV-11 : Importance des caractéristiques pour l'ensemble de données « Pantalon ». .................................... 125
Figure IV-12 : L'agrégation des ventes cumulées de la famille des chemisiers, pour l'année 2020, sans et avec
l'impact de la crise sanitaire...................................................................................................................................... 128
Figure IV-13 : Système de prévision global .............................................................................................................. 131
Figure IV-14 : Réseau de neurones utilisé (Perceptron) et le chromosome correspondant ...................................... 132
Figure IV-15 : Processus d'apprentissage ................................................................................................................. 133
Figure IV-16 : Ventes des T-shirts par semaine et variables explicatives correspondantes ..................................... 135
Figure IV-17 : Evolution de la fonction de fitness et de RMSE de l'année 2018 de validation lors du process
d'apprentissage pour la famille des T-shirts .............................................................................................................. 137
Figure IV-18 : Ventes corrigées (courbe V) et prédiction finale (en haut), coefficient de correction (en bas) ......... 139
Figure IV-19 : Prévisions de ventes de l’année 2019 ................................................................................................ 139
Figure IV-20 : Méthodologie d'application des différents modèles pour la prévision de ventes en intégrant les
tendances de la mode ................................................................................................................................................. 142
Figure IV-21 : Courbes d’évolution des tendances liées aux Pulls, brutes et lissées ................................................ 143
Figure IV-22 : Données -- pente et moyenne -- calculées à partir des tendances Pull ............................................ 143
Figure IV-23 : Ventes de la famille des Pulls et la courbe tendance correspondante ............................................... 144
Figure IV-24 : Ventes de la famille des Vestes et la courbe tendance correspondante ............................................. 145
Figure IV-25 : Ventes de la famille des Robes et la courbe tendance correspondante ............................................. 145
Figure IV-26 : Ventes de la famille des T-shirts et la courbe tendance correspondante........................................... 146
Figure P-1 : Proposition d'un système de prévision de ventes par article intégrant les tendances du marché ......... 156

6
Liste des tables
Table II-1 : Comparaison entre BERTBASE et BERTLARGE ............................................................................................ 65
Table III-1: Dictionnaire de mode développé .............................................................................................................. 79
Table III-2 : Exemple de la base de données obtenue après le traitement des textes (descriptions) des produits ...... 92
Table III-3 : Description des 8 clusters des utilisateurs par rapport aux 8 styles ..................................................... 101
Table III-4 : Types des attributs et nombre correspondant de valeurs distinctes ...................................................... 101
Table III-5 : Précision de la classification par famille de produits ........................................................................... 103
Table IV-1 : Nombre d'articles pour chaque famille de produits dans les collections 2019 et 2020 ........................ 119
Table IV-2 : Paramètres optimaux du modèle Random Forest pour les quatre ensembles de données. ................... 124
Table IV-3 : Précisions de classification des différents classificateurs .................................................................... 125
Table IV-4 : Erreurs quadratiques moyennes en cas d'utilisation de différents classificateurs. ............................... 125
Table IV-5 : Erreurs quadratiques moyennes calculées sur les données de validation pour la famille des chemisiers
................................................................................................................................................................................... 127
Table IV-6 : Erreurs quadratiques moyennes entre les ventes réelles et prédites (initiales et corrigées) ................. 129
Table IV-7 : Erreurs obtenues sur les données de test 2019 pour la famille des T-shirts. ........................................ 138
Table IV-8 : RMSE des prévisions avec et sans l’utilisation des tendances des 4 familles de produits pour les 3
modèles RF, LSTM et MBSCI .................................................................................................................................... 147
Table IV-9 : RMSE de validation et de test pour les 4 familles de produits en appliquant la méthodologie proposée
................................................................................................................................................................................... 148

7
Liste des abréviations
Intelligence Artificielle : IA
Machine Learning : ML
Réseau de Neurones : RN
Algorithme Génétique : AG
Auto-Regressive Integrated Moving Average : ARIMA
Seasonal Auto-Regressive Integrated Moving Average : SARIMA
Extreme Learning Machine : ELM
Unité de Gestion de Stock : UGC
Natural Language Processing : NLP
Random Forest : RF
K-Nearest Neighbors : KNN
Support Vector Machines : SVM
Convolutional Neural Networks : CNN
Natural Language Processing : NLP
Naïve Bayes : NB

8
Introduction générale

Au cours des dernières années, l'industrie de la mode a connu de profondes mutations. Le


développement rapide des technologies du « Big Data », ou données massives, et de l'Intelligence
Artificielle (IA) a conduit à une révolution dans l’industrie de la mode, et plus précisément
l’industrie de l’habillement, affectant d’une manière significative les comportements des clients et
les opérations des entreprises dans le secteur de la mode. L'industrie de la mode est une industrie
dynamique, caractérisée principalement par des produits ayant des cycles de vie courts et une
demande volatile et imprévisible résultant de la forte variation des tendances de la mode et des
comportements de consommation. L’émergence du Big Data et de l’Internet a intensifié ces
caractéristiques. Parmi les changements primordiaux de cette révolution, le Big Data permet aux
consommateurs d’accéder plus directement à la mode et son évolution ; auparavant, les enseignes
de mode étaient les seules à détenir les informations sur les tendances de mode des futures
collections et à maitriser leurs communications avec les clients. Ceci a radicalement changé ces
dernières années avec le développement technologique permettant de communiquer facilement et
directement aux consommateurs les dernières tendances de mode. Par conséquent, les attentes et
les demandes des consommateurs évoluent rapidement, et les consommateurs sont devenus de plus
en plus difficiles à satisfaire. Il est donc devenu crucial pour les enseignes de mode de rechercher
des moyens efficaces pour optimiser l'assortiment des nouvelles collections et les quantités à
acheter par produit.

Pour l’industrie de la mode, la prévision de la demande restera toujours l'un des éléments
les plus importants de son système d'aide à la décision. Compte tenu des délais
d’approvisionnement souvent longs et de la durée de ventes des produits généralement courte, il
est crucial de proposer le bon produit au bon moment et au bon endroit. L'arrivée de l'ère du Big
Data entraîne un grand bouleversement dans les techniques de prévision de la demande de mode
et constitue non seulement un grand défi mais aussi une opportunité pour le secteur. En plus des
données quantitatives telles que les données de ventes historiques, la météo, etc., des données
qualitatives reflétant les tendances de mode peuvent être utilisées par les enseignes de mode afin
d’améliorer leurs prévisions. En effet, à l'ère du Big Data, les réseaux sociaux, les applications
mobiles et les diverses technologies de communication récentes permettent de collecter des

9
quantités massives de données en temps réel à faible coût. Par conséquent, la maîtrise de ces « Big
Data », ou « Fashion Big Data », collectées à partir de différentes sources, et sous différents
formats, ainsi que l’exploitation du potentiel des récentes techniques d'IA permettent aux
enseignes de mode d’extraire des informations cruciales pour les différentes prises de décision.
Ceci peut leur permettre de stimuler les ventes, réduire le nombre d'invendus et améliorer
continuellement la satisfaction des clients.

La prévision de la demande des clients est l’un des problèmes largement abordé par les
chercheurs dans la littérature. Plusieurs approches efficaces pour la prévision des ventes ont été
proposées et examinées. Ces méthodes de prévision prennent en compte différents facteurs
influençant la demande, telles que l'effet saisonnier et d'autres variables exogènes perturbant les
ventes, notamment le prix, les soldes de fin de saison et la promotion des ventes. Toutes ces
contraintes rendent les méthodes de prévision de la demande pour les produits de la mode très
spécifiques et complexes, d'où la nécessité de continuellement développer des systèmes de
prévision des ventes plus efficaces qui reflètent mieux la demande potentielle réelle des
consommateurs, insensibles aux variations éventuelles de tels facteurs exogènes.

Outre les contraintes prises en compte dans les méthodes traditionnelles de prévision de la
demande, l’émergence du Big Data offre la possibilité de bénéficier également des données
reflétant les tendances de la mode afin de compléter les résultats de prévision. Cependant, la
détection des tendances du marché, effectuée généralement par les experts de mode, présente deux
inconvénients principaux : (i) les tendances détectées sont souvent basées sur une analyse
qualitative et consistent ensemble d'idées suggestives, (ii) les prévisionnistes essaient de parcourir
tous les défilés de mode, les photos sur les réseaux sociaux, ainsi que les influenceuses et les
bloggeuses du monde entier afin de repérer la prochaine grande tendance, ce qui exige un temps
énorme. Par conséquent, les résultats de la prévision ne peuvent pas garantir la précision et
l’objectivité. D’où, la nécessité pour les entreprises de savoir comment améliorer les performances
de la détection des tendances en bénéficiant des technologies avancées et des méthodes d’IA, afin
d’assurer l’objectivité et la rapidité des résultats obtenus et d’obtenir une vision globale des
évolutions de ces tendances avec le temps.

A cette fin, l’exploitation des données massives, issues des systèmes d’information internes
des entreprises et des réseaux sociaux, permettra d’extraire des informations cruciales pour

10
l’optimisation de l’assortiment des collections et des quantités à acheter et à approvisionner par
produits. Par ailleurs, un meilleur ciblage des besoins et attentes des consommateurs réduira les
phénomènes de surproduction et d’invendus.

Cette thèse, menée en partenariat avec un distributeur de mode Française, contribue à la


littérature existante en examinant comment une enseigne pourrait améliorer les prévisions de la
demande des consommateurs à l’ère de Big Data en détectant les tendances du marché de la mode.
En d’autres termes, cette thèse aborde la question de l’exploitation et de l’analyse des quantités
massives des données hétérogènes, structurées et non-structurées, quantitatives et qualitatives, en
utilisant les techniques de l’IA, afin d’extraire des informations cruciales pour les différentes
prises de décision. Ainsi, la méthodologie globale proposée consiste à traiter les trois
problématiques suivantes :

i. Comment détecter les tendances du marché de mode et anticiper les préférences


des clients ?
ii. Comment obtenir des prévisions de ventes par article de mode et par famille de
produits en intégrant des facteurs exogènes de différentes natures ?
iii. Comment exploiter les tendances de mode détectées afin d’améliorer la précision
des prévisions de ventes ?

Suite à une étude bibliographique approfondie, quatre approches sont proposées afin de
traiter ces différentes problématiques. Les deux premières approches sont destinées à (i) détecter
les tendances de mode en appliquant des techniques d’analyse du texte avancées sur les données
textuelles des blogs extraits des sites de mode en ligne, et (ii) révéler les préférences des clients en
termes de produits de mode en utilisant des données collectées à partir d’une application mobile.
Ensuite, différentes approches sont proposées pour développer des systèmes de prévisions de
ventes, utilisant différentes méthodes de classification, de clustering et d’optimisation, dans le but
de prédire les ventes par article et par famille de produits dans contextes spécifiques. Dans un
premier temps, un système est développé dans le cadre de la pandémie Covid-19, pendant laquelle
les systèmes de prévision de ventes classiques ne sont plus applicables. Dans un second temps, des
systèmes de prévision de vente à court terme intégrant des variables explicatives telles que les
actions commerciales ou les tendances de mode sont proposé afin d’améliorer les résultats de
prévision. À notre connaissance, ce travail est le premier à tester la combinaison des données de

11
ventes, issues du système d’information interne à l’entreprise, et des données reflétant les
tendances du marché, issues de sources externes à l’entreprise, dans un seul système de prévision
de la demande.

Le présent manuscrit est structuré en quatre chapitres suivis d’une conclusion générale :

 Chapitre I : Prévision de la demande dans l’industrie de mode.


 Chapitre II : Techniques d’intelligence artificielle.
 Chapitre III : Détection des tendances de mode et prédiction des préférences clients.
 Chapitre IV : Prévision des ventes et de la demande de mode.

Dans le chapitre I, une analyse détaillée de la littérature sur les différentes méthodes de
prévision de la demande de mode à l'ère du Big Data est réalisée. Afin de définir des systèmes de
prévision des ventes adaptés au contexte, la première section du chapitre offre un bref aperçu de
l'industrie de la mode ainsi que ses caractéristiques, des différents cycles de vie des produits et de
la mode éphémère. La gestion de la chaîne d’approvisionnement dans l’industrie de la mode est
également abordée dans la première section. Ensuite, une étude bibliographique sur la prédiction
des ventes est présentée dans la deuxième section en présentant les méthodes statistiques et
hybrides existantes dans la littérature. La troisième section introduit le concept des données
massives, ou Big Data, qui constitue un accélérateur d’innovation dans l’industrie de la mode.
Dans cette section, l’utilité de l’exploitation des Big Data dans l’industrie de la mode est discutée,
et plus précisément, pour la détection des tendances de la mode. Enfin, les motivations et objectifs
de cette thèse sont présentés, ainsi que de la méthodologie globale proposée pour la prédiction de
la demande.

Le chapitre II présente un aperçu général des techniques d’intelligence artificielle utilisées


dans cette thèse. En effet, le traitement des données hétérogènes, structurées ou non, nécessite
l’utilisation des différentes techniques d’intelligence artificielle. En premier lieu, les
méthodologies proposées pour la prévision des ventes sont basées sur des données structurées
collectées à partir du système d’information de l’enseigne partenaire, telles que les données de
ventes historiques, les opérations commerciales, les caractéristiques des produits, etc. Ces
méthodologies reposent essentiellement sur des tâches de classification, de clustering, de
régression et d’optimisation et s’appuient sur différentes méthodes d’IA telles que le Random

12
Forest (RF) (ou forêt d’arbres de décision), K-moyennes et l’Algorithme Génétique (AG). Le
choix des différentes méthodes est justifié dans le Chapitre II. Par ailleurs, des méthodes
d’analyse du texte – Natural Langage Processing (NLP) – et d’apprentissage profond –
Convolutional Neural Networks (CNN) – sont également utilisées durant cette thèse afin de traiter
des données non-structurées telles que des données textuelles issues des réseaux sociaux et des
images de produits de mode.

Dans le chapitre III, nous proposons deux méthodologies utilisant des données issues des
magazines de mode en ligne et d’une application mobile, qui peuvent aider les entreprises à mieux
prédire les attentes des consommateurs. La première méthodologie, détaillée dans la première
section du chapitre III, vise à détecter les tendances de mode en traitant les blogs francophones
publiés en ligne par des experts et influenceurs de mode, ayant une notoriété reconnue dans le
milieu de la mode. Les données non structurées provenant du texte contenu dans ces sources
doivent être prétraité afin d'extraire des informations utiles telles que la couleur, la matière, le
motif, le style, etc., qui reflètent les tendances de la mode sur une période donnée. Tout d’abord,
les blogs et les magazines de mode en ligne sont identifiés et leurs données sont extraites. Une
base de données structurée contenant, pour chaque blog, son titre, sa date et son contenu est ensuite
construite à partir des données extraites. En utilisant des techniques de NLP, et en développant un
dictionnaire de mode en français, un système de détection des tendances est construit pour extraire
des informations pertinentes des blogs en termes de mots, de combinaisons de mots et de taux de
récurrence. La deuxième méthodologie, présentée dans la deuxième section du chapitre III, a
comme but de prédire les préférences des clients. Ceci est fait en utilisant des données brutes non
structurées collectées à partir d’une application mobile sur les produits de mode (images et
descriptions textuelles) et les consommateurs (préférences stylistiques et actions historiques).
Différentes techniques telles que le traitement de texte, le clustering et l'analyse de données sont
utilisées pour transformer ces données en informations utiles - attributs descriptifs structurés,
groupes d’images et de styles, etc. En se basant sur les données ainsi obtenues, un modèle de
prédiction est ensuite construit pour prédire les opinions des consommateurs sur des nouveaux
produits.

Le chapitre IV présente les deux méthodologies proposées dans cette thèse pour la
prédiction de ventes et de la demande des consommateurs, et associe les tendances de mode et des

13
ventes historique pour effectuer des prévisions de ventes à court terme. La première méthodologie,
présentée dans la première section, vise à prédire les ventes par article dans un contexte
exceptionnel : la Covid-19. La méthodologie proposée commence par un système de prévision des
ventes à moyen terme, basé sur des données historiques, qui définit le profil des ventes de chaque
article, notamment dans un environnement de marché assez stable, comme s'il n'y avait pas de
crise sanitaire. Ensuite, un modèle correctif des ventes est développé à partir de la comparaison et
de l'analyse des comportements d’achats en ligne des consommateurs, avant et pendant la période
du confinement. Le deuxième modèle (Modèle Basé sur un Système de Capture d’Influence,
MBSCI), proposé dans la deuxième section du chapitre III, consiste en un outil de prévision de
ventes par famille de produits à long terme. Il s’agit d’un système conçu pour corriger les ventes
historiques de l’influence des variables exogènes afin d’obtenir une courbe de ventes potentielles.
Cette courbe de ventes potentielles est ensuite utilisée pour effectuer les prévisions qui seront
ensuite complétées par les influences des variables exogènes correspondantes. Cette méthodologie
est appliquée en premier lieu en utilisant comme variables exogènes des données des opérations
commerciales de l’entreprise. Ensuite, dans la troisième section de ce chapitre, les tendances de
mode, détectées dans le chapitre III à partir des weblogs et magazines de mode en ligne, sont
ajoutées aux variables exogènes déjà utilisées dans le but d’effectuer des prévisions de ventes à
court termes par famille de produits. Trois modèles sont ainsi appliqués afin de tester la
contribution des tendances pour la prévision des ventes.

Une conclusion générale est finalement présentée à la fin du manuscrit, ainsi que des
perspectives de travaux futurs.

14
Chapitre I Prévision de la demande dans l’industrie de
mode
I. 1 Introduction

Pour l’industrie de la mode, la prévision de la demande des produits avec une grande
précision a longtemps été particulièrement difficile par rapport à d’autres industries. C’est l’un des
problèmes largement abordés par les chercheurs dans la littérature qui visent toujours à améliorer
les résultats de la prévision en s’appuyant sur les dernières avancées technologiques. Plus
précisément, l’émergence de l’Internet, des données massives et des différentes plateformes des
réseaux sociaux, combinés avec les avancées dans le domaine de l’intelligence artificielle, ont
provoqué une révolution dans l’industrie de la mode, en offrant aux entreprises diverses
opportunités pour prédire la demande de leurs clients.

La première section de ce chapitre est dédiée à la présentation de l’industrie de la mode, en


discutant ses caractéristiques, les différents cycles de vie d’un produit de mode, la mode éphémère,
ainsi que la gestion de la chaîne d’approvisionnement dans l’industrie de la mode. La seconde
section offre une étude bibliographique sur la prévision des ventes en présentant diverses méthodes
classiques et hybrides appliquées dans la littérature. La troisième section introduit le concept des
données massives, ou Big Data, discute son utilité dans l’industrie de la mode et présente une étude
bibliographique sur la prédiction des tendances de mode. Enfin, les deux dernières sections
présentent le processus de prévision de la demande en général, ainsi que les objectifs de cette thèse
et la méthodologie de prévision globale proposée.

I. 2 Contexte

La mode est un moyen pour un individu de se révéler [1], [2]. Il s'agit d'un terme large qui
englobe généralement tout produit ou marché où il existe un élément de style susceptible d'être
éphémère [3]. La mode se définit simplement par les styles de vêtements et d'accessoires portés à
un moment donné par des groupes de personnes. Il s’agit d’une manière qui reflète l'évolution de
la vie sociale, économique, politique, et culturelle. Les individus et la société utilisent la mode
pour communiquer leurs goûts et leur style de vie. Ces différents styles de vie émergents sont
interprétés par les stylistes en concepts de mode, puis traduits en produits de mode [4].

15
L'industrie de la mode, également appelée industrie de l’habillement, englobe la
conception, la fabrication, la distribution, le marketing, la vente, la publicité et la promotion de
tous les types de vêtements, des vêtements de haute couture les plus chers aux vêtements de prêt à
porter de tous les jours. Bien que l'industrie de la mode se soit d'abord développée en Europe et en
Amérique, il s'agit aujourd'hui d'une industrie hautement mondialisée, les vêtements étant souvent
conçus, fabriqués et vendus dans des pays, voire des continents, différents [5]. L'industrie de la
mode est depuis longtemps l'un des plus gros employeurs, et constitue encore au 21ème siècle un
secteur important de la production économique mondiale.

Les revenus générés par le marché global de l'habillement ont régulièrement augmenté au
cours de la dernière décennie, jusqu'en 2020, date à laquelle la pandémie de coronavirus (Covid-
19) a fortement impacté le secteur du commerce de détail. En 2021, les revenus de ce marché
s'élevaient à environ 1,55 billion de dollars américains. Selon le Consumer Market Outlook, cette
valeur atteindra près de 2 billion de dollars américains d'ici 2026 [6].

L'épidémie de coronavirus (Covid-19) a constitué une contrainte massive pour le marché


de la mode en 2020, avec notamment une forte et soudaine diminution de la consommation en
raison des confinements imposées par les gouvernements dans le monde entier. Les mesures prises
par les gouvernements nationaux pour contrôler la pandémie ont également entraîné l'arrêt des
activités de fabrication et d’approvisionnement, impactant ainsi le secteur tout au long des années
2020 et 2021 [7], [8]. Cependant, vu qu’il s'agit d'un événement qui n'est pas lié à des faiblesses
permanentes ou fondamentales du marché ou de l'économie mondiale, le marché de la mode a
commencé de se remette du choc dès 2021.

Afin de comprendre les enjeux et les problématiques actuelles de l’industrie de la mode,


cette section vise à identifier ses principales caractéristiques, notamment les différents types de
cycle de vie des produits de mode, le concept de la mode éphémère (Fast Fashion), et l’importance
de la prévision de la demande pour la gestion de la chaine d’approvisionnement. En effet, afin
d’obtenir des prévisions plus précise de la demande, les systèmes de prévision doivent être conçus
en prenant en compte les spécificités du secteur de la mode.

16
I. 2. 1 Caractéristiques de l’industrie de la mode

L'industrie de la mode est un secteur très concurrentiel et dynamique. La réactivité, en tant


que moyen de concurrence, est considérée l’un des facteurs les plus importants pour le succès
d’une enseigne de mode. Il faut être capable de répondre aux demandes des clients avec des délais
de production toujours plus courts, et s'assurer que l'offre peut être synchronisée pour répondre
aux pics et aux chutes de la demande. En fait, le problème fondamental des industries de la mode
est que le temps nécessaire à la conception et la production d’une nouvelle collection, notamment
l'approvisionnement en matières premières, leur transformation en produits finis et leur mise sur
le marché, est généralement significativement plus long que la période de vente des produits de la
collection. Ceci constitue un facteur qui accroît la pression que subissent les enseignes pour
prendre des décisions plus rapidement. Un schéma qui illustre le processus de planning de la
production d’une nouvelle collection de mode est présenté dans la Figure I-1. Une enseigne doit
donc avoir une estimation précise à moyen terme (un an) des ventes attendues pour la saison
suivante afin de passer des commandes aux fournisseurs. Connues pour être longue, complexe et
non flexible [9], [10], la structure actuelle des chaînes d’approvisionnement donne lieu à de longs
cycles d'achat, qui sont devenu insatisfaisants compte tenu des exigences des consommateurs et
des enjeux actuels de l'industrie de la mode (réduction des invendus et des impacts
environnementaux, meilleur traçabilités des produits, etc.).

Figure I-1 : Planning de production d'une collection de mode

17
Les auteurs dans [11] identifient plusieurs caractéristiques de l'industrie de la mode
moderne (voir Figure I-2). L’association de ces caractéristiques rend l’industrie de la mode très
singulière ce qui nécessite l’emploi de méthodes et techniques spécifiques pour la gestion de sa
chaîne logistique.

Figure I-2 : Caractéristiques de l'industrie de la mode moderne [11]

I. 2. 2 Cycle de vie d’un produit de mode

Avant l’émergence de la Fast Fashion, L'industrie de la mode fonctionnait principalement


sur deux saisons (ou collections) : l'hiver et l'été. Cependant, le nombre de saisons de production
a augmenté avec le temps. Les grandes marques de mode lancent presque tous les mois de
nouvelles collections sur le marché [12]. Ainsi, les tendances changent rapidement et les produits
ont un cycle de vie court. Cette évolution rapide de la mode pousse les clients à renouveler leurs
vêtements très fréquemment.

Le concept de cycle de vie d’un produit repose sur l’idée que les ventes d’un produit suivent
un « cycle » de durée limité et composé de différentes phases telles que la croissance, la maturité
et la décroissance. Le cycle de vie d'un produit de mode, qui peut durer une ou plusieurs saisons,
ressemble le plus à la courbe en forme de cloche (plus ou moins symétrique en fonction du style)
couramment utilisée pour décrire l’approche du cycle de vie des produits [13]. Au début d'une
tendance, seules quelques personnes s'enthousiasment pour un style, une méthode, une idée ou une
pratique qui reçoit une appréciation favorable dans la société. Avec le temps, de plus en plus de
18
personnes sont prêtes à suivre le même style jusqu'à ce qu'il devienne démodé et qu'une nouvelle
mode apparaisse.

Les produits d'habillement peuvent être classés en fonction de la longueur de leur cycle de
vie. Wasson [14] a distingué trois cycles de vie des produits : les cycles de vie des produits de
mode (fashion products), les produits de fantaisie (fads), et les produits de base (basics). Ils
peuvent être distingués en fonction de leur période de développement sur le marché et de la durée
de leur acceptation. Les courbes du cycle de vie des produits de base, des produits de mode et des
produits de fantaisie sont illustrées dans la Figure I-3.

Figure I-3 : Courbes du cycle de vie des produits de mode [15]

 Les produits de base, ou classiques, tels que les T-shirts et les jeans sont vendus pendant
des années avec peu de changements de style. Il s’agit de produits qui ne se démodent
jamais. Les entreprises qui vendent des produits de base peuvent compter sur un long cycle
de vie du produit.
 Les cycles de vie des produits de mode durent moins longtemps que ceux des produits de
base. Par définition, la mode est un style du moment. Un grand nombre de personnes
adoptent un style à un moment donné. Lorsqu'il n'est plus adopté par un grand nombre de
personnes, le cycle de vie d'un produit de mode prend fin. Les produits de mode connaissent
un déclin brutal une fois qu'ils ont atteint leur plus haut niveau de vente.

19
 Un produit de fantaisie a le cycle de vie le plus court. Il s'agit généralement d'un style qui
est adopté par une sous-culture particulière ou un groupe de personnes pendant une courte
période. Un tel produit devient très populaire, mais seulement pendant une courte période.

Les ventes globales des produits de base sont les plus élevées des trois types de produits,
et leur cycle de vie est généralement le plus long. Certaines entreprises conçoivent leurs collections
d’une manière à inclure des produits de base, des produits de mode et des produits de fantaisie afin
de maximiser les ventes. Par exemple, dans le cas d'une gamme de pulls par exemple, une
entreprise peut proposer quatre modèles de style et de couleurs classiques qui sont toujours dans
la collection. Quatre autres styles peuvent être modifiés tous les deux ans pour inclure des
changements de silhouette, de longueur et de col en fonction de la mode et de la tendance actuelle.
Un ou deux styles de mode à cycle court ou de mode fantaisiste basés sur les nouvelles tendances
peuvent être introduits une ou deux fois par an. Les styles portés par une célébrité populaire ou un
héros sportif sont des exemples de styles de mode et de fantaisie.

I. 2. 3 La mode éphémère : Fast Fashion

Le marché de la mode éphémère, connue sous le nom de Fast Fashion, est basé sur le
renouvellement permanent des collections de vêtements en fonction des tendances de mode les
plus récentes. La taille du marché mondial de la Fast Fashion est passée de 91,23 milliards de
dollars en 2021 à presque 99,23 milliards de dollars en 2022, à un Taux de Croissance Annuel
Composé (TCAC) de 8,8%. Le marché de la Fast Fashion devrait atteindre 133,43 milliards de
dollars en 2026 à un TCAC de 7,7% [16]. L'adoption croissante de vêtements abordables par la
population jeune a stimulé le marché de la Fast Fashion. La population jeune est attirée par des
vêtements uniques, tendances et abordables. Les enseignes de mode visent donc à offrir des
vêtements de mode issus des dernières tendances à des prix minimes.

L'augmentation de la demande d'achats en ligne contribue de plus en plus à la croissance


du marché de la mode. Les enseignes peuvent désormais vendre leurs produits sur une plateforme
plus large qu'auparavant, ce qui augmente leur gamme de clients sur le plan géographique et
stimule la croissance du marché de la mode. En outre, les consommateurs se sentent de plus en
plus à l'aise d’acheter leurs vêtements à partir de leurs ordinateurs et de leurs appareils portables.

20
La réalité virtuelle et la réalité augmentée sont de plus en plus utilisées dans le secteur du
e-commerce – ventes en ligne – de la Fast Fashion [16]. Ceci vise à combler les lacunes entre les
expériences d’achat en ligne et dans les magasins. Ces technologies permettent par exemple au
client d'essayer le produit et de voir à quoi il ressemble lorsqu'il essaie les vêtements sur lui en
utilisant des miroirs de réalité virtuelle ou des caméras dans leurs smartphones. Par exemple, des
applications telles que DressingRoom utilisent la technologie de la réalité augmentée pour
permettre aux acheteurs d'essayer des tenues sur un avatar [17].

Enfin, la forte émergence de l’Internet dans notre vie quotidienne avec ses différentes
plateformes des réseaux sociaux, comme Facebook et Instagram, joue un rôle crucial dans la
croissance du marché de la Fast Fashion. Les réseaux sociaux ont augmenté la sensibilité du
consommateur envers la mode, et ont modifié la façon dont les entreprises interagissent avec leurs
clients. En effet, l'utilisation d'influenceurs affecte la façon dont les entreprises vendent leurs
produits et tentent d'augmenter leurs ventes, ce qui stimule la demande du produit sur le marché.

Cependant, divers problèmes ont surgi ces dernières années, avec l'émergence de la Fast
Fashion : conditions de travail indignes, pollution de l'air et de l'eau, impact environnemental
négatif [18], etc. En effet, compte tenu de la croissance mondiale de la Fast Fashion et du volume
d'articles produits et gaspillés, l'industrie de la mode représente une menace environnementale
majeure. Chaque étape de la production a un impact sur l'environnement en termes de la
consommation d'eau, d'énergie et de produits chimiques, et des émissions de CO2. En plus, les
pratiques actuelles de consommation de la mode, grâce à la Fast Fashion, entraînent de grandes
quantités de déchets textiles notamment de produits finis invendus. Il est pourtant essentiel que
l'industrie dans son ensemble assume la responsabilité de ses impacts environnementaux, et agisse
de manière à les réduire. Pour y parvenir, l’une des stratégies que les enseignes de mode doivent
mettre en œuvre est une bonne gestion des stocks et de la chaîne d’approvisionnement. En effet,
une gestion efficace et correcte des stocks permet aux enseignes de mieux adapter l'offre à la
demande. Ceci permet donc la diminution des problèmes de sur-stockage et de gaspillage des
produits.

21
I. 2. 4 Prévision de la demande pour la gestion de la chaîne d’approvisionnement

La gestion de la chaîne d’approvisionnement est un élément fondamental des opérations


de ventes au détail et plus particulièrement des produits de mode. Une bonne gestion des
approvisionnements permet de concilier des stocks faibles et un taux de service client élevé. Cela
repose en grande partie sur une prévision précise de la demande future (Figure I-1). En fait, la
prévision de la demande consiste à combiner la prévision des ventes futures et l’influence des
différents les facteurs qui affectent cette demande. Il s'agit d'une tâche importante mais très difficile
à accomplir.

Pour l’industrie de l’habillement, les prévisions peuvent être considérées comme un outil
qui représente l'ensemble des méthodes analytiques permettant aux entreprises de prendre les
meilleures décisions pour anticiper l'avenir. Un bon système de prévision peut contribuer à éviter
les phénomènes de sous-stockage ou de sur-stockage, ce qui a des implications sur d'autres
opérations critiques de la chaîne d'approvisionnement, telles que la gestion des délais, la
planification de la production et la détermination des prix, ainsi que sur l’augmentation de la
satisfaction des clients. Afin d'atteindre la viabilité économique dans un environnement hautement
concurrentiel, une entreprise doit adopter une stratégie opérationnelle axée en premier lieu sur la
demande des consommateurs, ce qui signifie que la prévision devient une tâche d'une importance
primordiale.

Par rapport à d'autres secteurs de services de vente au détail, on peut affirmer que la
prévision des ventes est une tâche particulièrement difficile dans le secteur de la mode, car la
demande de produits de mode est très volatile, les goûts des consommateurs changent
constamment et le cycle de vie des produits de mode est très court. En outre, les ventes de produits
de mode sont fortement affectées de manière « stochastique » par des facteurs saisonniers, des
facteurs liés aux tendances de la mode et de nombreuses variables imprévisibles (par exemple, la
météo, la stratégie marketing, le contexte politique, et les divers facteurs socio-économiques, etc.).
Ces facteurs, auxquels s'ajoute le fait que les enseignes de mode gèrent un grand nombre d'Unités
de Gestion des Stocks (UGS) avec des données limitées sur les ventes historiques, rendent la
prévision des ventes difficile et exigent des outils analytiques spécifiques.

22
Dans l’industrie de la mode, il existe deux types différents de stocks dont la gestion
nécessite des méthodes de prévision différentes :

 Le stock centralisé en plate-forme, géré généralement en flux poussés par les prévisions
long/moyen terme des enseignes : Le profit cible associé à chaque saison est un facteur
essentiel pris en considération lors de la gestion du stock centralisé. L’enseigne doit
commander une quantité suffisante de stocks afin d'atteindre l'objectif de profits. En outre,
la demande potentielle des consommateurs doit encore être prise en compte lors de la
planification du stock. Ceci nécessite des prévisions à long terme des quantités à acheter
par produit.

 Les stocks magasin, gérés généralement en hybride en flux tirés par les commandes des
consommateurs et flux poussés par les prévisions court terme des enseignes : La demande
des consommateurs pour les articles de mode, influencée par les tendances du marché, la
météo, etc., varie continuellement. Ceci nécessite des prévisions de ventes à court termes
afin d’approvisionner les magasins par les bons produits, et par conséquent, garantir la
satisfaction des clients. En outre, l'emplacement du magasin physique doit être pris en
compte dans la planification des stocks magasins. Il est plus probable qu'un magasin
physique situé au centre d'une grande ville reçoive plus de visiteurs et de clients que celui
situé dans une petite ville.

En tant que distributeur de mode, l'un des plus grands défis consiste à déterminer le bon
équilibre d'approvisionnement pour éviter à la fois les ruptures de stock qui peuvent résulter de
prévisions pessimistes et le sur-stockage, résultant de prévisions optimistes. Ainsi, il est crucial de
développer des méthodes de prévision assez robustes et efficaces afin de prédire la demande des
clients avec précision, et par conséquent gérer les stocks d’une manière plus efficace, que ça soit
le stock centralisé en plate-forme (nécessitant des prévisions à long termes) ou les stocks magasins
(nécessitant des prévisions à cours termes). Une étude bibliographique détaillée sur la prévision
de ventes est ainsi présentée dans la section suivante afin de mettre en relief les principales
méthodologies de prévision de ventes proposées dans la littérature.

23
I. 3 Etude bibliographique sur la prévision des ventes

La prévision des ventes est un processus d'une importance cruciale pour l'élaboration de
stratégies efficaces, permettant aux entreprises de prendre des décisions sur différents aspects,
financières et opérationnelles. Les entreprises emploient diverses méthodes pour produire de telles
prévisions - pour analyser les données, estimer les tendances et bénéficier des intuitions des experts
afin d'obtenir une prévision précise de l'évolution des ventes dans le futur. Dans cette section, les
différentes méthodes de prévision de ventes qui se trouvent dans la littérature, ainsi que les
méthodes d’évaluation d’un système de prévision sont présentées.

I. 3. 1 Méthodes utilisées pour la prévision des ventes

Pour réaliser des prévisions de la demande, l'approche classique commence par analyser
les caractéristiques du produit [19]. Ensuite, la méthode de prévision la plus adaptée doit être
choisie. La littérature propose l’utilisation de plusieurs méthodes statistiques traditionnelles pour
effectuer des prévisions de ventes, telles que l'approche bayésienne, l'auto-régression, le lissage
exponentiel, le modèle de Holt-Winters, Auto-Regressive Integrated Moving Average (ARIMA),
et Seasonal Auto-Regressive Integrated Moving Average (SARIMA). Ces méthodes traditionnelles
sont peu ou pas utilisées par les enseignes de modes, excepté pour donner des courbes de vie de
base des produits. En effet, compte tenu des spécificités des ventes de produits mode, les enseignes
privilégient souvent une approche plus subjective basée sur la définition de courbes de vie
génériques affinées ensuite produits par produits par des experts. Ces dernières années, avec
l’émergences des données massives, de plus en plus d’enseignes s’orientent vers les techniques
d’IA, telles que les Réseaux de Neurones (RN), pour exploiter ces données.

I. 3. 1. 1 Méthodes classiques pour la prévision des ventes dans le secteur la mode

Les méthodes statistiques sont largement utilisées pour la prévision de la demande dans la
littérature pour trois raisons principales. Premièrement, elles sont faciles à exploiter et à mettre en
œuvre. Deuxièmement, elles fonctionnent rapidement pour prédire et obtenir des résultats. Enfin,
elles se basent sur des expressions mathématiques bien définies (closed-form expressions),
permettant aux utilisateurs d’identifier les différentes caractéristiques (tendance, saisonnalité) qui
peuvent être appliquées aux estimations des ventes futures. La capacité d'isoler les tendances
temporelles permet à de nombreuses entreprises d'avoir une vision claire de l'historique de leurs

24
performances de vente et renforce la confiance dans le fait que les cycles de vente futurs
présenteront des tendances similaires. Pour les enseignes de mode, les méthodes statistiques
pourraient convenir plus particulièrement aux produits dont la demande est stable, comme par
exemple les produits basiques.

En effet, la réalisation de prévisions à l'aide de méthodes statistiques repose principalement


sur la régression de la tendance de la série temporelle à partir des données historiques des ventes.
Ce type de méthodes permet d'obtenir des résultats acceptables pour la prévision de produits de
base dont la demande est stable. Cependant, la demande de la mode, surtout des produits tendances,
est irrégulière et volatile sur une courte période de temps, affectée par de multiples facteurs tels
que la météo, les soldes et les tendances de la mode qui présentent un modèle très irrégulier [20],
[21]. Cela conduit à ce que les méthodes statistiques traditionnelles deviennent généralement
inefficaces malgré leur simplicité et leur rapidité [22].

Ainsi, diffèrent travaux ont été proposés pour développer des méthodes spécifiques aux
contraintes du secteur de la mode. L'étude la plus ancienne sur la prédiction de la demande de
mode est celle de Green et Harrison [23]. Green et Harrison [23] explorent une prévision de la
demande de robes féminines par une approche bayésienne. Les auteurs dans [24] ont également
examiné la possibilité d'appliquer un modèle de prévision bayésien à la prévision de la demande
de mode. Il s'avère que l'approche bayésienne hiérarchique proposée donne des résultats
quantitatifs supérieurs à ceux de nombreuses autres méthodes. Ren et al. [25] réalisent un modèle
de prévision pour prédire les ventes hebdomadaires de sept articles de mode. Ils suggèrent qu’un
modèle de prévision basé sur des données de panel est plus performant que les modèles
traditionnels de séries temporelles. En outre, ils ont constaté que la méthode proposée donne de
meilleurs résultats pour la prévision des ventes par article que pour la prévision des ventes par
couleur. Thomassey et al. [26] examinent la précision de la prévision des ventes des articles de
mode en utilisant un système global composé de deux différents modèles de prédiction. Le premier
modèle effectue une prévision des ventes par famille à moyen terme, basée sur un système
d'inférence floue. Le principe du second modèle, qui réalise la prévision des ventes d'articles à
moyen terme, repose sur la distribution des prévisions par familles des articles correspondants, et
sur l'estimation de la courbe de vie à partir d'une méthode de classification d’articles. Leur étude
montre qu'un grand nombre de familles d'articles et des critères de classification pertinents sont

25
nécessaires afin d'obtenir une précision de prévision performante. Ils concluent que la prévision
agrégée (par famille de produit) est plus précise que la prédiction par article. Afin de développer
un système de gestion des stocks et de logistique efficace et performant pour les enseignes de
mode, il est nécessaire de prédire et de déterminer plus précisément la demande par UGS fortement
fluctuante et intermittente, pour chaque magasin et par jour. En prenant en compte cette
problématique, Li et Lim [27] proposent une méthode de décomposition et agrégation basée sur
une base de données réelle de demande UGS-magasin-jour d'une enseigne de mode en Singapour.
Ce nouveau cadre de prévision hiérarchique présente des performances nettement supérieures à
celles d'autres méthodes de prévision de la demande intermittente largement utilisées, telles que la
méthode de Croston [28], la méthode d'approximation Syntetos-Boylan (SBA) [29] et la méthode
TSB [30].

I. 3. 1. 2 Méthodes d’Intelligence Artificielle

Comme expliqué dans la section I.3.1.1, les modèles statistiques présentent des lacunes
dans la réalisation de prévisions des ventes des articles de mode. Les méthodes d'IA, émergeant
avec les progrès de la technologie informatique, offrent de nouvelles opportunités pour améliorer
la précision de ces prévisions. En fait, les modèles d'IA se montrent capables de capter les non-
linéarités qui se trouvent dans les données, et d’élaborer efficacement et automatiquement des
fonctions d'approximation correspondantes.

Des méthodes populaires telles que les RN et les modèles de logique floue sont utilisées
dans la littérature et constituent les premiers types de modèles employés pour la prévision des
ventes pour les articles de mode. Sztandera et al. [31] construisent un modèle flou multivarié basé
sur plusieurs caractéristiques importantes de produit telles que la couleur et la taille. Comparé à
plusieurs modèles statistiques, un RN et des modèles de prévision uni-variés, le modèle proposé
se montre le plus efficace. Plus tard, Hui et al. [32] explorent le problème de la prédiction de la
demande de mode en termes de prévision des couleurs. Ils proposent d'utiliser un système flou qui
intègre des connaissances préalables sur la prédiction des couleurs pour faciliter la conception
d’articles de mode. On constate que les performances du système proposé sont meilleures que
celles de l'approche traditionnelle.

Frank et al. [33] explorent l'utilisation d’un modèle basé sur un RN pour effectuer les
prévisions des ventes d’articles de mode. En le comparant à deux autres méthodes statistiques en

26
termes de précision de prévision, on constate que le RN présente les meilleures performances.
L’utilisation des réseaux de neurones à propagation avant pour la prédiction des ventes est encore
testée par les auteurs dans [34], qui ont constaté qu’ils sont capables de produire des résultats très
précis. La seule condition préalable est que le problème de la prévision de la demande doit être
proprement modélisé. Tous les facteurs susceptibles d'affecter la demande doivent être pris en
compte et doivent être indépendants les uns des autres dans la mesure du possible. Ensuite, un
Réseau de Neurones Evolutionnaire (RNE), une méthode de recherche globale pour la sélection
des modèles et des caractéristiques (entrées considérées du modèle), a été utilisé pour la prévision
des ventes d'articles de mode. A titre d’exemple, Au et al. [35] utilisent le modèle RNE pour
rechercher la structure du système la plus idéale pour un système de prévision, puis la structure du
RN idéale pour la prévision des ventes d'articles de mode est développée. Ils indiquent que les
performances du modèle RNE qu'ils proposent sont meilleures que celles du modèle SARIMA
traditionnel.

Récemment, une approche d'apprentissage profond a été explorée par Loureiro et al. [36]
pour prévoir les ventes de nouveaux produits dans l'industrie de la mode en fonction des
caractéristiques des produits et de l'opinion des experts du domaine. Les résultats ont montré que
même si un modèle d'apprentissage profond peut avoir de bonnes performances de prédiction, il
ne surpasse pas de manière significative l'algorithme de Random Forest dont le processus
d'apprentissage est beaucoup plus simple. Dans un autre article, Cheriyan et al. [37] ont étudié
l'utilisation de différentes techniques d'apprentissage automatique pour la prédiction des courbes
de ventes, en les appliquant à un ensemble de données sur des ventes de mode en ligne. Les
résultats sont résumés en termes de fiabilité et de précision des techniques utilisées pour la
prédiction. Les études ont montré que le modèle le mieux adapté est l'algorithme du Gradient
Boost, qui fournit une précision maximale de 98 % dans la prédiction des ventes futures, suivi par
l’arbre de décision, avec une précision de près de 71 % sur les données considérées. En utilisant
les données réelles d'une marque de mode vietnamienne, plusieurs méthodes statistiques et d’IA
ont été appliquées dans [38] pour la prédiction de ventes. Dans l'ensemble, on constate que les
méthodes d’IA donnent de meilleurs résultats. La méthode Random Forest produit
systématiquement le taux d'erreur le plus faible, suivie de près par XGBoost. Une autre étude a
formulé le problème de prévision comme une tâche de classification dans laquelle l'objectif est de
prévoir la quantité de vente de nouveaux produits en appliquant cinq modèles d'apprentissage

27
automatique différents - régression logistique, classification par vecteur de support, voisins les
plus proches, XGBoost et réseaux de neurones. Les résultats montrent que le modèle XGBoost
surpasse les autres modèles dans tous les paramètres d'évaluation [39].

Le modèle de prédiction de ventes proposé dans [40] combine les informations historiques
des produits avec les caractéristiques de leurs images en utilisant l'apprentissage profond et prédit
les ventes futures. Les images de vêtements sont converties en vecteurs de caractéristiques à l'aide
du modèle pré-entraîné « inception v3 », puis sont fusionnées avec les données historiques des
ventes pour former un modèle capable de prédire les ventes d’un nouveau produit en utilisant un
RN à propagation avant. Les résultats obtenus ont montré que le modèle est assez performant
malgré la petite taille de l'ensemble de données. Une méthodologie similaire proposée dans [41]
prédit les ventes hebdomadaires de nouveaux produits de mode. L’algorithme K-moyennes est
appliqué sur les données historiques des produits existants : données de ventes du produit et
caractéristiques des images extraites en utilisant le modèle « inception v3 » de l’apprentissage
profond. Le modèle prédit le cluster correspondant à un nouveau produit et prédit ses ventes
hebdomadaires en trouvant sa meilleure correspondance dans son cluster en utilisant la méthode
des K plus proches voisins (K-Nearest Neighbors KNN). Les résultats obtenus se sont avérés être
efficaces et prometteurs pour prédire les ventes d'un nouveau produit de mode.

Cependant, les approches KNN présentent plusieurs inconvénients : (i) l'extensibilité, car
elle exige le stockage de tous les embeddings de produits et de leurs courbes de ventes
correspondantes, qui sont utilisés au moment de l'estimation, (ii) l'incapacité à modéliser des
relations non linéaires complexes entre l'image, les ventes et les caractéristiques exogènes, (iii)
l'incapacité de fusionner plusieurs signaux distincts supplémentaires aux données de ventes. Pour
surmonter ces difficultés, la modélisation des séquences codeur-décodeur peut être utilisée. Ainsi,
les auteurs dans [42] examinent différentes architectures de modélisation de séquence codeur-
décodeur (modèles standards, approches basées sur l'attention et une approche multimodale
explicable) pour une prévision de nouveaux produits basée sur l'image, tous les attributs
disponibles du produit et les facteurs externes tels que les vacances, les événements, la météo et
les remises. Les résultats obtenus ont montré des améliorations au niveau de la précision obtenue
et de l'interprétabilité du modèle par rapport aux approches de base existantes basées sur les KNNs.

28
Pour résumer, plusieurs méthodes d’IA sont proposées dans la littérature. Cependant, les
performances de ces modèles reposent fortement sur l’ensemble de données considérées et plus
particulièrement sur sa qualité et sa pertinence. Pour limiter ce problème, des modèles hybrides
sont développés dans la littérature pour améliorer la prévision des ventes dans le secteur de la
mode en combinant les avantages des méthodes statistiques et d’IA.

I. 3. 1. 3 Méthodes hybrides

Les méthodes de prévision hybrides sont généralement développées sous l’hypothèse


qu'elles peuvent combiner les avantages de différents modèles pour former une nouvelle méthode
de prévision. À ce titre, elles sont considérées comme plus efficaces et plus performantes que les
modèles statistiques et les modèles d'IA. Les méthodes hybrides utilisées dans la littérature sur la
prévision de la mode combinent souvent différents modèles tels que les modèles flous, les RN,
ELM, et les différents modèles de l’apprentissage automatique avec d'autres techniques telles que
les modèles statistiques [43]–[55].

Thomassey et Happiette [56] développent un schéma hybride de classification et de


clustering pour la prévision des ventes de nouveaux articles de mode. Leur modèle peut augmenter
la précision des prévisions à moyen terme par rapport au modèle de prévision du profil moyen des
ventes. Une approche similaire a été appliquée par Chae et al. qui ont utilisé un modèle hybride de
clustering et d'arbre de décision pour prévoir les modèles de vente de nouveaux produits [57]. Les
auteurs de [58] présentent une nouvelle méthode de prévision de la demande, appelée
DemandForest, qui combine K-moyennes, Random Forest et Quantile Regression Forest
(régression quantile de forêts) afin de mieux comprendre la distribution de la valeur prédite. Cette
approche basée sur l'apprentissage automatique combine les données de ventes historiques des
produits précédemment introduits et les caractéristiques des produits existants et nouveaux pour
faire des prévisions avant le lancement et soutenir les décisions de gestion des stocks pour les
nouveaux produits. DemandForest regroupe et prédit les profils de vente et prédit les intervalles
de la demande totale pendant une période de lancement. Comparé à plusieurs méthodes de
benchmark, DemandForest fournit les prédictions les plus précises. Aksoy et al. [59] combinent la
méthode de la logique floue et les réseaux de neurones pour former un nouveau système appelé
système d'inférence floue basé sur un réseau adaptatif. Le système qu'ils proposent combine les

29
avantages des deux systèmes, à savoir la capacité d'apprentissage des RNs et la capacité de
généralisation de la technique de la logique floue, et établit un système hybride puissant.

L'ELM est rapide pour effectuer des prévisions [60]. Bien qu'il ne reste pas parfait en raison
de sa nature instable, sa « rapidité » le rend un très bon modèle pour un système hybride plus
avancé de prévision de la mode. Xia et al. [61] examinent un modèle de prévision basé sur un
modèle d'ELM avec des métriques adaptatives. Ils ont montré que leur modèle permet de réduire
l'effet de sur-apprentissage des RNs. Yu et al. [62] utilisent l'ELM et l'analyse relationnelle grise
(GRA) pour développer une méthode hybride de prévision des couleurs de la mode. Leurs résultats
avec des données empiriques réelles prouvent que le modèle proposé surpasse plusieurs autres
modèles concurrents dans la prévision des couleurs de la mode.

Un autre système de prévision des ventes de produits de mode a été proposé par Fallah
Tehrani et Ahrens [63] qui ont utilisé une approche probabiliste pour classer les articles de mode
en termes de ventes, suivie d'un modèle « kernel machine approach » pour prédire le nombre de
ventes. L'application de leur approche à des données réelles provenant d'un détaillant de vêtements
en Allemagne a donné des résultats plus robustes et plus fiables. Un outil précis et évolutif de
prévision des ventes de nouveaux produits a également été développé par Baardman et al. [64]. Il
considère le regroupement des produits en groupes en utilisant la régression logistique
multinomiale basée sur les attributs de chaque article. Ensuite, la régression linéaire multiple, les
machines à vecteurs de support et les RN ont été utilisés pour générer des prévisions de ventes
pour chaque groupe. Leurs tests sur des données réelles ont donné des résultats prometteurs et
robustes sur différentes catégories et industries. Shanshan [65] a proposé un nouveau modèle
hybride pour prévoir la demande de nouveaux produits et l'a appliqué à une application réelle de
The Body Shop. Le modèle proposé combine un modèle linéaire qui capture l'effet des variables
exogènes variant dans le temps, et des modèles de choix pour incorporer la cannibalisation avec
des données limitées. Les techniques avancées utilisées dans ces modèles permettent de prendre
en compte les incertitudes et les données manquantes dans les prévisions. Cependant, les résultats
obtenus dépendent fortement de la fiabilité des données d'apprentissage et plus particulièrement
de la stabilité de l'environnement du marché. Chen et Lu [66] intègrent la méthode de clustering
K-moyennes (KM), les ELM et la régression par vecteur de support (SVR) pour construire des
modèles KM-ELM et KM-SVR basés sur le clustering pour la prévision de la demande dans

30
l'industrie de la mode. Les résultats de la recherche ont montré que les modèles KM-ELM et KM-
SVR sont supérieurs aux modèles simples ELM et SVR. Ils ont une meilleure précision de
prédiction, ce qui indique que l'intégration de l'analyse de clustering peut aider à améliorer les
prédictions.

Dans [67], une méthodologie est proposée pour prévoir la demande de produits à cycle de
vie court en utilisant des courbes de ventes de produits similaires. Des techniques de régression
linéaire et de clustering sont utilisées pour la sélection et la pondération d'analogies appropriées.
En comparant la méthodologie proposée avec sept méthodes de prévision basées sur les analogies,
y compris deux implémentations de méthodes de régression non linéaires, cette méthodologie a
permis d'obtenir des prévisions plus précises avec des temps de traitement courts par rapport aux
méthodes les plus récentes. Un modèle à deux étapes est proposé dans [68] pour prédire les ventes
totales de nouveaux produits. Tout d’abord, la demande est estimée par une régression linéaire.
Ensuite, les ventes sont modélisées en fonction non seulement de la demande, mais aussi des
stocks. La méthodologie utilise différentes techniques d’IA : la méthode d'arbre de décision
gradient boosting est utilisée pour la sélection des caractéristiques, k-moyennes est appliqué pour
le clustering des produits et un algorithme génétique pour l'estimation des paramètres dans chaque
cluster. Le modèle est testé sur des données réelles d'une entreprise de Singapour, et les résultats
montrent que dans la plupart des cas le modèle proposé surpasse d’autres techniques telles que la
régression linéaire, gradient boosting, la régression par vecteur de support (SVR) et le réseau de
neurones.

I. 3. 2 Evaluation de la performance du système de prévision

Dans la prévision de la demande, les mesures de performance jouent un rôle essentiel. La


plupart des études évaluent la performance de la prévision en utilisant l'Erreur Quadratique
Moyenne (EQM), le Pourcentage de l'Erreur Absolue Moyenne (PEAM) et l'Erreur Absolue
Moyenne (EAM). En outre, Aburto et Weber [43] utilisent une EQM normalisée pour la
comparaison. La mesure de la performance de toutes les études se concentre sur la précision de la
prévision.

Cependant, dans les cas réels, la précision des prévisions n'est pas la seule préoccupation
des experts de l'industrie de la mode et des opérateurs de la chaîne d'approvisionnement. C'est
pourquoi Ren et al. [69] évaluent les performances de certaines méthodes de prévision populaires
31
sous différents aspects, notamment la précision, la rapidité, la quantité de données requise, la
fiabilité, la facilité d'utilisation et d'autres paramètres associés.

I. 4 Big Data : l’accélérateur d’innovation dans l’industrie de mode

Le développement technologique émergent du Big Data, ou données massives, est reconnu


comme l'un des domaines les plus importants des futures technologies de l'information et évolue à
une vitesse rapide, stimulé en partie par les réseaux sociaux et le phénomène de l'Internet des objets
(IoT). Les développements technologiques en termes d'infrastructure, d'analyse et de services de
Big Data permettent aux entreprises de se transformer en organisations pilotées par les données.
En vue du potentiel du Big Data, chaque entreprise doit renforcer ses capacités à maîtriser le Big
Data afin de rester compétitive. Cette section introduit le concept de Big Data, discute l’utilité du
Big Data dans l’industrie de la mode, et présente une étude bibliographique détaillée sur la
prédiction des tendances de mode en l’ère de Big Data.

I. 4. 1 Concept de Big Data

Le concept de Big Data a considérablement évolué au cours des 20 dernières années [70].
Initialement, Laney a suggéré que le Volume, la Variété et la Vélocité (3Vs) sont les trois
dimensions du Big Data [71]. Ensuite, la Véracité s’est révélée être encore l’une des propriétés
les plus cruciales du Big Data. Ces différentes caractéristiques peuvent illustrer à la fois les défis
et les avantages des initiatives de Big Data :

 Volume : Le volume est probablement la caractéristique la plus connue du Big Data ; ce


n'est pas surprenant, étant donné que plus de 90% de toutes les données actuelles ont été
créées au cours des deux dernières années.
 Variété : Lorsqu'il s'agit de Big Data, les données à traiter peuvent être structurées
(fichiers Excel, bases de données relationnelles), mais aussi non structurées (fichiers
audio, images, vidéos, et textes issues des réseaux sociaux).
 Vélocité : La vélocité fait référence à la vitesse à laquelle les données sont générées,
produites, créées ou rafraîchies. À titre d’exemple, Google traite en moyenne plus de
40000 requêtes de recherche par seconde, ce qui correspond approximativement à plus
de 3,5 milliards de recherches par jour.

32
 Véracité : C'est l'une des caractéristiques désavantageuses du Big Data. La véracité – la
confiance dans les données – diminue avec le temps, et fait également référence à la
provenance ou à la fiabilité de la source de données, à son contexte et à la signification
de l'analyse qui en résulte.

Au fil du temps, cette définition a évolué vers la réalisation de 5Vs, 7Vs et 10Vs. Selon
George Firican, le directeur de la gestion des données et de la Business Intelligence à l'Université
de la Colombie Britannique, le Big Data va au-delà du simplement volume, de la variété, vélocité,
et véracité [72]. Il introduit plusieurs caractéristiques importantes décrivant le Big Data ; celles-ci
incluent la Variabilité, la Validité, la Vulnérabilité, la Volatilité, la Visualisation et la Valeur.

Dans le cadre de l'émergence du Big Data, le besoin d'analyse des données s'est accru. Ceci
désigne les technologies et les architectures capables d’exploiter la richesse du Big Data, structurés
et non structurés, en permettant la détection et l'analyse d’information automatiquement et
rapidement. Selon l'enquête "Management Tools & Trends" réalisée par le cabinet de conseil en
management Bain & Company, les entreprises du monde entier ont, ces dernières années,
largement adopté et intégré des outils numériques tels que l'analyse avancée pour améliorer leurs
opérations et, au final, leur rentabilité [73].

I. 4. 2 L'utilité du Big Data dans l'industrie de la mode

Les secteurs d’activités utilisant traditionnellement les données numériques tels que la
finance, l'assurance ou la santé ont été les premiers et les plus enthousiastes à adopter le Big Data
[74]. Dans l'industrie de la mode, de nombreux professionnels s'appuyaient traditionnellement sur
l'intuition et la créativité pour prendre des décisions importantes concernant, par exemple, la
conception, l'achat et la vente. Toutefois, ce secteur commence à s'appuyer de plus en plus sur le
Big Data pour obtenir des informations avec des analyses en temps réel [75], [76]. Bien que
l'industrie de la mode ne soit pas étrangère à l'analyse des données, étant donné qu'elle repose
depuis longtemps sur l’analyse des informations des ventes, le plus grand changement se situe au
niveau de la taille et de la croissance des données non structurées qui doivent être analysées [77].
En conséquence, les détaillants de mode s'appuient désormais sur la science des données avec des
modèles d’analyses prédictifs et prescriptives pour planifier leurs opérations [78], [79].

33
D'autre part, un nombre croissant d'outils d'analyse de Big Data dédiés au secteur de la
mode, tels que EDITED et Trendalytics, sont lancés sur le marché. Ces outils, en général,
permettent aux entreprises de mode d'exploiter plus efficacement les données collectées à partir de
sources multiples, telles que les réseaux sociaux et les sites de commerce électronique, pour
améliorer leurs prises de décision en matière d'assortiment de produits et de tarification [80], [81].

I. 4. 2. 1 Les réseaux sociaux comme source de Big Data de la mode ou Fashion Big Data

L'émergence et la croissance des réseaux sociaux au cours de la dernière décennie ont été
une source de bouleversement pour l'industrie de la mode. L'utilisation de l'Internet s'accélère dans
le monde entier, les individus utilisant les réseaux sociaux – comme Instagram, Pinterest,
Snapchat, Facebook, et Twitter – pour exprimer leurs points de vue et leurs opinions [82],
contribuant ainsi rapidement à la croissance continue du Big Data.

Les réseaux sociaux sont considérés comme une source de Big Data dans le secteur de la
mode, et des recherches récentes ont montré que d’énormes quantités de connaissances sur la mode
peuvent être récoltées et extraites des réseaux sociaux [83]. Poorthuis et al. [84] soutiennent ce
point de vue, car ils qualifient l'industrie de la mode en tant qu’une économie fondée sur
« l'attention » et soulignent l'importance des réseaux sociaux en tant qu'espace unique au sein
duquel les connaissances sur la mode sont créées et partagées. Parallèlement, Hsiao et al. [85]
discutent de l'importance du marketing des réseaux sociaux dans le secteur de la mode, tandis que
Cabiddu et al. [86] étudient les stratégies de communication sur les réseaux sociaux dans l'industrie
de la mode.

Les réseaux sociaux ont été classés comme le premier facteur d'influence des achats de
mode pour les femmes âgées de 18 à 24 ans aux États-Unis [87], et Instagram est largement
reconnu comme la plateforme principale pour la découverte de produits de mode [88]. En
conséquence, les célébrités, les blogueurs de mode et les passionnés de mode sont désormais
devenus des influenceurs clés des tendances de la mode dans le monde entier. Les réseaux sociaux
sont devenus célèbres pour permettre aux enseignes d’identifier plus facilement les dernières
tendances de la mode, et la pandémie Covid-19 a augmenté d’avantage l'utilisation des réseaux
sociaux, et par conséquence, les données associées : Images, Textes, etc.

34
I. 4. 2. 2 Valorisation du contenu et des données générées par l’utilisateur

Avec l'essor du Big Data et de toutes les technologies émergentes associées, l'utilisateur
ordinaire a obtenu un nouveau rôle : il est une entité active et productrice, et non plus passive et
purement consommatrice. En particulier, la mode est un sujet largement discuté dans les
communautés et de nombreux blogs de mode publient différents sujets liés à la mode. Comme
discuté dans la section I.4.2.1, les réseaux sociaux offrent la possibilité aux utilisateurs d’exprimer
leurs points de vue sur différents sujets. Par conséquent, les réseaux sociaux sont définis par des
plateformes permettant la création et l'échange du contenu généré par l'utilisateur.

En examinant la littérature relative à la valeur prédictive des données textuelles des réseaux
sociaux, connue par Predictive value of User-Generated content, deux grands axes de recherche
peuvent être identifiés : l'utilisation du contenu généré par l'utilisateur et l'application des mots-
clés dans les moteurs de recherche.

Plusieurs travaux ont examiné la relation entre les discussions en ligne et les résultats dans
le monde réel, ainsi que le pouvoir prédictif de ce contenu généré par les utilisateurs. Le service
de microblogging Twitter a servi de source de données pour la plupart de ces travaux. Par exemple,
Asur et Huberman [89] se concentrent sur les revenus du box-office cinématographique et les
données Twitter, et démontrent des corrélations élevées entre les données en ligne et le classement
réel d'un film. Dhar et Chang [90] suggèrent que le contenu généré par les utilisateurs est un bon
indicateur des futures ventes de musique en ligne. D'autres recherches se concentrent sur
l'exploration des sentiments à partir des données Twitter en examinant les corrélations potentielles
pour la prédiction des marchés financiers en général [91], [92]. De même, les messages Twitter
ont été utilisés pour examiner le rôle de la plateforme dans la prédiction du résultat de futures
élections [93], [94]. En plus, beaucoup de travaux de recherche ont utilisé l’analyse des sentiments
afin d’augmenter la satisfaction des consommateurs de l’industrie de mode en utilisant des données
issues des réseaux sociaux [95].

L'utilisation de mots-clés de recherche pour la prédiction constitue un autre axe de


recherche. Google Flu trends, par exemple, estime la propagation de la grippe sur la base de mots-
clés de recherche liés au sujet de la grippe deux semaines plus tôt que les autres systèmes [96]. Ils
supposent une relation entre ces mots-clés et les personnes présentant effectivement des
symptômes de grippe [97]. Goel et al. [98] ont une approche similaire : ils se concentrent sur les

35
produits de divertissement et supposent que les consommateurs intéressés par un film ou un jeu
spécifique peuvent le rechercher en ligne. Ils signalent une corrélation plus élevée entre les revenus
des films et l'activité en ligne, contrairement aux requêtes de recherche liées aux chansons. De
même, Kulkarni et al. [99] considèrent que la fréquence de recherche indique l’intérêt pour le
produit et présente un indicateur significatif des revenus futures du box-office. Beheshti-Kashi et
Thoben [100] considèrent également les requêtes de recherche comme une sorte de contenu généré
par les utilisateurs, et suggèrent donc de combiner les deux axes de recherche, l'exploration du
contenu généré par les utilisateurs avec la prévision de la mode. Cependant, ils proposent cette
approche comme un ajustement subjectif des prévisions de base.

I. 4. 2. 3 Applications diverses pour le secteur de la mode

Le Big Data, combiné aux techniques d'intelligence artificielle, peut être utile dans le
secteur de la mode dans de diverses applications. New Gen Apps [101] affirme que l'industrie de
la mode peut utiliser le Big Data pour l'identification du marché, l'analyse des tendances, la
compréhension du consommateur, la tarification, la découverte de nouveaux influenceurs, la
mesure de l'impact des influenceurs et l'amélioration des ventes, ainsi que la durabilité. La
prédiction des tendances, discutée en détail dans la section I.4.3, est très importante dans le
domaine de la mode, et le Big Data peut aider à donner une indication sur les tendances générales
qui peuvent se matérialiser [102], [74]. En outre, le Big Data sous la forme de Google Trends peut
également apporter une valeur ajoutée s'il est exploité correctement [103]. De nombreuses d’autres
opportunités peuvent être exploitées avec le Big Data et l’intelligence artificielle.

De nombreux travaux récents en vision par ordinateur ont été consacrés à la caractérisation
des vêtements. Certains de ces travaux identifient les attributs des vêtements, comme le fait qu'une
chemise ait des manches courtes ou longues [104]–[106]. D'autres travaux vont au-delà des
attributs basiques au niveau de l'image et tentent de segmenter les différents articles de vêtements
dans les images [107]–[109]. L'identification de produits est une tâche utilisée pour détecter des
produits vestimentaires spécifiques dans des photos [102], [110], [111]. En plus, il existe
également des travaux antérieurs sur la classification du « style » : l'ensemble de vêtements qu'une
personne porte, par exemple, classique, gothique, etc. [112]. Dans certains cas, ces labels sont
inconnues et nécessitent d'être découvertes [106], [113], souvent en profitant des embeddings
d'images appris par les systèmes de reconnaissance d'attributs. Enfin, plusieurs recherches ont été

36
menées dans le but de développer des systèmes de recommandations pour les consommateurs
[114]. D’autre part, beaucoup de travaux de recherche ont utilisé l’analyse des sentiments afin
d’augmenter la satisfaction des consommateurs [95], [115].

I. 4. 3 Détection des tendances de la mode à l’ère de Big Data

La prévision des tendances de la mode n'est pas un problème nouveau. Depuis 1998, la
société WGSN fournit des rapports de prévisions de mode chaque saison, avec des clients comme
Coach, Nike, Adidas et Levis' [116]. Cependant, les rapports qu'ils produisent sont davantage basés
sur une analyse qualitative et consistent en un ensemble d'idées suggestives [117]. Bien qu'il
s'agisse de ressources extrêmement précieuses, une prédiction plus précise et à grande échelle est
également nécessaire.

Être capable de prévoir les prochaines tendances de la mode présente plusieurs avantages.
Tout d'abord, du point de vue des stylistes, le fait de connaître la prochaine tendance potentielle
peut les aider à adapter leurs propres conceptions pour la collection de la saison suivante.
Deuxièmement, du point de vue des détaillants, le fait de savoir à l'avance quelles tendances vont
bientôt décoller, les aide à planifier les stocks à approvisionner. Troisièmement, du point de vue
des consommateurs, pour ceux qui sont très soucieux des tendances (comme les influenceurs de
mode en ligne), connaître les tendances populaires à l'avance les aide à se placer au top dans le
domaine de la mode.

Cette partie abordera les théories les plus pertinentes liées à la prévision des tendances de
la mode et présente une étude bibliographique détaillée sur la prévision des tendances.

I. 4. 3. 1 Pratiques liées à la prévision des tendances de la mode

Les tendances de la mode ont longtemps été perçues comme le produit d'un processus
subjectif. Cependant, les chercheurs ont montré que les tendances de la mode suivent souvent des
profils spécifiques [113], [118], [119]. Le rôle de la prévision des tendances de la mode consiste à
envisager les tendances à venir et de prévoir les désirs des consommateurs [111], [120]. Les
entreprises de mode utilisent les résultats des prévisions de tendances pour créer des produits qui
sont attractifs pour les consommateurs, stimuler les ventes et réduire les phénomènes de
surproduction [121].

37
Traditionnellement, la prévision des tendances de la mode se fait par l'intermédiaire d'un
processus humain consistant à examiner les points de vue artistiques, la culture, les attitudes
sociétales et les événements actuels pour prédire les tendances futures. Dans ce processus, les
prévisionnistes de mode collectent et analysent diverses références pour les traduire en concepts
de style, détails de conception, couleurs et motifs qui seront populaires dans la prochaine saison
[111]. La créativité est considérée comme un élément de base de ce processus [122]. Cependant,
les prévisions traditionnelles des tendances de la mode, créées par les stylistes, sont également
confrontées à des limites et à des critiques. Par exemple, certains critiquent la prévision
traditionnelle des tendances de la mode en la qualifiant de « jugement subjectif » du fait que les
concepteurs se reposent sur leur « intuition » pour prédire les tendances [123]. Ceci constitue un
risque commercial élevé en raison de la grande dépendance des designers à leur vision artistique
et de trop peu d'apports des vues commerciales [124]. Ces lacunes de l'approche traditionnelle de
prévision des tendances de la mode, et l'émergence de la science des données incitent les
entreprises de mode à explorer de nouvelles voies de prévision des tendances [124], [125]. Les
enseignes de mode utilisent activement le Big Data pour soutenir leurs opérations commerciales.
Les outils d’analyse des Big Data ont démontré leur efficacité pour aider les entreprises de mode
à améliorer l'assortiment de produits, à prédire plus précisément les ventes futures et à optimiser
les stocks sur tous les canaux de vente [126]. Cependant, l'utilisation du Big Data pour soutenir les
activités créatives des entreprises de mode, telles que la prévision des tendances, reste relativement
timide, mais prometteuse [60], [69]. Potentiellement, l’exploitation des Big Data pourraient
contribuer à améliorer les prévisions de mode et révéler les modèles et les tendances futurs en
profitant des grandes quantités de données et des analyses avancées [69], [110]. Néanmoins, la
mesure dans laquelle les informations extraites des Big Data peuvent être utilisés pour prévoir
efficacement les tendances de la mode reste encore inconnue [127], [128].

En termes de tendances de la mode, les différentes études montrent que la couleur, le motif
et les détails du design (matière et forme), sont les trois éléments les plus critiques pour la prévision
[121], [129]. Tout d'abord, la couleur est essentielle à la prévision des tendances de la mode, car
elle constitue un élément visuel de base du vêtement [129]. Des études montrent que lorsqu'ils
achètent des vêtements, en ligne ou non, les consommateurs sont souvent attirés initialement par
la couleur d'un vêtement [130]. En identifiant les couleurs de mode qui seront populaires à long
terme pendant toute la saison ou à court terme, les entreprises seront en mesure de placer le bon

38
design de produit au bon moment sur le marché [131]. Des études empiriques suggèrent également
que la précision de la prévision des couleurs peut être cruciale pour le succès final d'un vêtement
au niveau des ventes [132].

Le deuxième aspect est le motif (comme les rayures, les taches et les carreaux), qui désigne
« un dessin décoratif répété qui peut être imprimé, cousu ou tissé dans un tissu » [133]. Comme la
couleur, le motif joue également un rôle essentiel dans la prévision des tendances de la mode, car
il s'agit d'un autre attribut primaire des vêtements qui influence la décision d'achat du
consommateur [111]. Par exemple, en 2018, les vêtements et les chaussures qui utilisaient le motif
« léopard » ont été largement adoptés par les jeunes consommateurs, ce qui a permis aux marques
de mode et aux détaillants qui proposaient ces produits de remporter un succès commercial
considérable [104]. Comme une autre preuve de l'importance de la prévision des tendances en
termes de motifs, les données indiquent que les vêtements comportant des motifs floraux et de la
dentelle ont connu un succès considérable et ont atteint des marges de profits supérieures à celles
des vêtements à motifs de pois et de rayures dans le marché de détail américain entre 2017 et 2018
[104].

Le troisième aspect est celui des attributs de conception, qui se traduit par la matière et la
forme du vêtement, comme le « denim » pour la matière et le « col rond » pour la forme [121].
Ces détails de conception affectent presque tous les produits, des vestes aux robes, ce qui les rend
un élément crucial de la prévision des tendances de la mode [134]. Une bonne prévision de cet
élément permet en outre aux détaillants de maximiser leurs profits en mettant en œuvre ces détails
tendances dans de multiples styles pour une période qui peut même s'étendre au-delà de la saison
en cours [121].

En conséquence, un produit à la mode, ou produit tendance, nécessitera l’association de


ces différents attributs, la couleur, le motif, la matière et la forme du produit, ce qui rend la tâche
de prédiction particulièrement complexe.

I. 4. 3. 2 Etude bibliographique sur la prévision des tendances

L'étude des tendances de la mode remonte à plusieurs décennies. Dans les années 1960,
Blumer a étudié les tendances de la mode d'un point de vue théorique, qui était une approche
populaire pour étudier l'industrie de la mode à l'époque [105], [135], [136]. Les recherches sur

39
l'industrie de la mode et les tendances se sont ensuite orientées vers une direction plus quantitative.
Tigert et al. ont étudié l'évolution de la mode en utilisant les données des acheteurs de mode [137].
Belleau a étudié les cycles des changements de longueur des robes au fil des décennies en utilisant
les mesures obtenues à partir de peintures depuis 1860 [138].

En fait, la plupart des analyses conventionnelles des tendances de la mode se font par
l’intermédiaire de jugements subjectifs humains utilisant la méthode Delphi pour évaluer les
variables de conception telles que le style [120], la couleur [139], la matière [140] et les motifs
[141] dans les collections de mode. La méthode Delphi est un principe basé sur les résultats de
plusieurs séries de questionnaires envoyés à un panel d'experts [142]. Par exemple, Furukawa et
al. [120] ont étudié les tendances stylistiques à l'aide de questionnaires envoyés à 55 participants
formés dans le cadre d'un programme de création de mode. Ils ont examiné 495 images de
collections de mode à l'aide d'échelles à différences sémantiques (Semantic Differentials) en
construisant un ensemble de huit paires d'adjectifs différentes (par exemple, sombre/clair,
casual/formel). Song et Park [143] ont étudié les tendances de conception des vestes en utilisant
2493 images de défilés présentées dans les collections de mode 2000 SS à 2015 FW. L'analyse de
fréquence a montré que les images de silhouettes en sablier, de longueur moyenne, de manches
serrées et d'épaules naturelles sont apparues dans les collections de mode des années 2000. Bien
que la prévision des tendances de la mode traitée par des panels d'experts ait joué un rôle essentiel
dans les études de mode, ces méthodes présentent des limites. Premièrement, les opinions des
experts diffèrent de celles des consommateurs, ce qui limite la découverte des préférences des
consommateurs. Deuxièmement, le processus de recherche prend du temps et crée des délais entre
l'acquisition des données et la réalisation, ce qui peut être un problème avec les tendances sensibles
au facteur temps. Par conséquent, des analyses plus innovantes et plus efficaces devraient être
associées aux méthodes conventionnelles.

Des travaux antérieurs ont souvent porté sur de petits bases de données, comme les images
des défilés de mode de New York [144]. Lorsque des bases de données plus importantes ont été
analysées, des tendances intéressantes ont été découvertes, telles qu'une augmentation soudaine de
la popularité des « talons » à Manille [145] ou des tendances saisonnières liées à des styles tels
que « fleuri », « pastel » et « néon » [102]. Matzen et al. [106] étendent considérablement la portée
de la découverte de ces tendances en exploitant les images publiques téléchargées sur les réseaux

40
sociaux. Cependant, l'analyse des tendances spatiales et temporelles dans ces articles est souvent
juste descriptive. Ce problème est partiellement adressé par Al-Halah et al. dans [146] où une
première approche permettant de prédire la popularité future des styles, découverts par famille de
produits à partir d'images de mode de manière non supervisée, est présentée. Ces styles peuvent
être considérés comme une combinaison linéaire des attributs d'un article, déjà obtenus à l'aide
d'un réseau de neurones convolutifs (CNN). En appliquant leur modèle à une base de données
provenant d'Amazon (images de produits et ventes correspondantes), ils ont pu construire une série
temporelle pour chaque style décrivant l'évolution de sa popularité avec le temps, et prédire
comment ces styles évolueront un an plus tard. Cependant, leur méthode est considérée limitée
dans son niveau de granularité, ce qui oblige à faire des prédictions annuelles très agrégées pour
une seule année à l'avance. En revanche, les auteurs dans [147] proposent un modèle de prédiction
des tendances qui permet de faire des prédictions hebdomadaires de meilleure qualité, à un niveau
de granularité fin, jusqu'à 6 mois à l'avance. Ces derniers ont appliqué leur méthode à des images
extraites de deux plateformes de réseaux sociaux, Instagram et Flickr. Ils ont également présenté
une méthodologie permettant de découvrir automatiquement les événements sociaux qui ont un
impact sur la façon dont les gens s'habillent. D'autres chercheurs dans la littérature ont également
travaillé sur la détection de tendances à partir d'images de réseaux sociaux en utilisant un détecteur
d'objets basé sur la convolution-déconvolution pour extraire les éléments de mode des images
[148], et à partir d'images de défilés de mode en apprenant l'embedding de la collection de mode,
puis entraînant des modèles RNN/LSTM pour capturer l'évolution du style des designers [117].

En plus de l'image, les chercheurs suggèrent l'utilisation de données textuelles pour détecter
les tendances de la mode. Par exemple, Google a publié son "Rapport sur les tendances de la mode
(États-Unis)", dans lequel il a examiné six milliards de requêtes de recherche aux États-Unis liées
à l'habillement. D'après leur analyse basée sur le comportement de recherche des utilisateurs, les
tendances retrouvées ont été regroupées dans les six catégories suivantes : Croissance continue,
Croissance saisonnière, Tendances montantes, Déclin continu, Déclin saisonnier et Tendances
descendantes [149]. Il a toutefois été confirmé qu'il n'existe pas de moyen définitif de connaître
l'intention réelle (achat ou autre raison) de la recherche. D'autres études se sont concentrées sur
l'utilisation de données non structurées, ainsi que sur les techniques de traitement de texte, pour
analyser les préférences des consommateurs et les tendances du marché. Les auteurs dans [150]
ont collecté des tweets se référant à trois enseignes de Fast Fashion afin d'analyser le contenu en

41
ligne généré par les consommateurs (commentaires positifs et négatifs) et améliorer l'intelligence
marketing. Une autre étude a utilisé Word2Vec pour la représentation textuelle et un CNN pour
extraire automatiquement des caractéristiques utiles et effectuer une analyse des sentiments du
système de microblogging chinois [151]. Pour réaliser une analyse des tendances de la mode,
Beheshti-Kashi et Toben [152] ont utilisé des applications de réseaux sociaux avec une analyse de
texte pour catégoriser les attributs de mode détectées. Les auteurs dans [153] ont appliqué des
techniques de traitement de texte et une analyse de réseau sémantique sur les textes des weblogs.
Leur étude dérive des termes d'évaluation en analysant la relation sémantique entre les éléments
de design et les termes de sentiment concernant les conceptions de mode.

Une étude réalisée par DuBreuil et Lu [104] a évalué de manière empirique les similitudes
et les différences entre les résultats des prévisions de tendances de mode traditionnelles (basées
sur l'homme) et ceux générés par les outils de Big Data. Les résultats suggèrent la faisabilité et le
grand potentiel de l'utilisation des outils de Big Data pour aider les entreprises de mode à créer de
nouveaux produits. Cependant, les résultats illustrent également les limites de l'utilisation des
outils de Big Data pour la prévision des tendances en tant qu'activité créative.

I. 5 Processus de prédiction de la demande de la mode

Comme montré dans les sections précédentes, la prédiction de la demande future des
produits de mode, en termes de prédiction de ventes ou détection des tendances, est une tâche assez
importante pour les différentes prises de décision dans l’industrie de la mode. Loureiro et al. [36]
ont proposé un processus standard pour les problèmes de prévision dans l'industrie de la mode. Ce
processus est présenté dans la Figure I-4. Tout d'abord, le problème commercial doit être traduit
en un problème de régression ou de classification. En outre, les sources de données disponibles
doivent être identifiées et les algorithmes appropriés doivent être sélectionnés (algorithmes simples
pour les petites données structurées, algorithmes complexes pour les grandes données non
structurées). Ensuite, les algorithmes sont entraînés et évalués sur différents sous-ensembles des
ensembles de données disponibles. Si le modèle final atteint une performance prédictive
suffisamment bonne, il peut être déployé dans des systèmes de production et être utilisé sur de
nouvelles données.

42
Figure I-4 : Principe du processus du modèle de prévision proposé par [36]

En plus, dans le cas de la prévision des ventes, il faut tout d’abord spécifier clairement les
objectifs à atteindre par le système réalisé. Ainsi, les différentes caractéristiques de prévisions
doivent être déterminé, comme par exemple l’horizon (court, moyen, long terme) ou le niveau
d’agrégation des données de ventes. Il existe trois dimensions possibles pour l'agrégation [154],
notamment la dimension temporelle, la dimension de la classification hiérarchique des produits
(dimension des produits) et la dimension des canaux de vente (dimension du canal de vente) (voir
Figure I-5) :
 Dans la dimension temporelle, le niveau d'agrégation peut être le jour, la semaine, le
mois ou l'année.
 Dans la dimension de la classification hiérarchique des produits, le niveau
d'agrégation peut être l'UGS, un groupe d'UGS sous le même numéro de produit mais
avec des tailles et des couleurs différentes, la famille de produits (par exemple, les
pantalons, les robes, etc.), les valeurs d'attribut (une certaine couleur ou taille), ou
l'assortiment de la chaîne d'approvisionnement globale.
 Dans la dimension du canal de vente, le niveau d'agrégation peut être un magasin,
tous les magasins de la chaîne d'approvisionnement, ou un ensemble de magasins
dans une certaine région/ville.

43
Figure I-5 : Structure d'agrégation des données [154]

I. 6 Conclusion

Comme présenté dans ce chapitre, de nombreux chercheurs ont abordé la problématique


générale de la prévision de la demande des clients. En fait, les nouvelles études s'orientent toutes
vers l'IA et surtout vers des modèles hybrides, utilisant à la fois des modèles statistiques et d'IA.
Selon la littérature, les modèles hybrides de prévision des ventes sont les plus performants, compte
tenu de leur capacité à modéliser les aspects temporels et à tirer parti des variables exogènes
disponibles pour améliorer la précision des prévisions.

Cependant, dans la société actuelle, hyper connectée et immergée dans les Big Data, les
performances d’un modèle de prévision des ventes utilisant uniquement des données historiques
internes à l’entreprise peuvent s’avérer limitées. En effet, les consommateurs sont continuellement
influencés par de nouvelles tendances de mode. Par conséquent, les chercheurs ont récemment
abordé le défi de la détection et prévision des tendances de la mode. Les modèles proposés sont
basés essentiellement sur l’analyse des données non-structurées telles que les images et les textes
issues des réseaux sociaux en utilisant des techniques avancées de l’IA. Les résultats montrent le
grand potentiel de l'utilisation des techniques d'IA et des données des réseaux sociaux pour

44
identifier les tendances de la mode et aider les entreprises à créer de nouveaux produits à fort
potentiel.

Par ailleurs, les données issues des réseaux sociaux permettent d’obtenir une vue globale
des styles et des produits à la mode mais ne suffit pas pour réaliser une prédiction fiable de la
demande des clients d’une entreprise bien déterminée. D’où, l’objectif principal de cette thèse est
de construire un système de prévision de la demande plus précis, comparé aux modèles existants
dans la littérature, en exploitant l’ensemble des données disponibles dans l’entreprise et les réseaux
sociaux. À notre connaissance, ce travail est le premier à examiner l’utilité de combiner les
différents formats des données, structurés (données internes à l’entreprise) et non-structurés
(données des réseaux sociaux), dans une méthodologie de prévision globale visant à améliorer la
prédiction de la demande spécifique à une entreprise.

La nouvelle méthodologie vise à prédire les tendances et les demandes à court terme d'une
enseigne de mode en prenant en considération tous les types de données qui pourraient influencer
la demande des clients :

 Les données internes de l’entreprise telles que les données historiques des ventes, les
collections précédentes, les articles achetés par les clients, les enquêtes auprès des clients....
 Des données issues des réseaux sociaux telles que des images et des textes provenant de
différentes ressources.

Afin d'analyser ces données hétérogènes, plusieurs techniques d’IA récentes ont été mises
en œuvre pour effectuer :

 Des analyses de texte en appliquant des techniques de traitement du langage naturel (NLP),
et d'exploration de texte,
 Des prévisions de séries temporelles avec des modèles hybrides utilisant différentes
méthodes d’IA comme l’algorithme génétique et les réseaux de neurones.
 Des techniques d'apprentissage profond telles que les réseaux de neurones convolutifs
(CNN).

Le principe de la méthodologie proposée, illustrée dans la Figure I-6, consiste à extraire


des données des réseaux sociaux afin d’identifier les tendances de mode les plus pertinentes, en
termes d'attributs de mode, qui auront le plus de chance à se propager dans le marché. D'autre part,

45
le traitement des données de ventes historiques internes à l'entreprise et l'analyse des
comportements de vente de ses clients aident fortement l’entreprise à mieux comprendre à quels
types de produits ses clients s'intéressent, et de pouvoir ensuite prévoir précisément leurs demandes
futures. Le modèle proposé peut être utilisé pour prévoir les ventes de produits actuels et/ou pour
générer un approvisionnement à court terme de nouveaux produits.

Enfin, le modèle proposé est mis en œuvre et évalué sur les données réelles de l’enseigne
de mode partenaire de cette thèse.

Figure I-6 : Méthodologie globale proposée de la prévision de la demande

Dans ce qui suit, nous allons présenter les différentes techniques d’intelligence artificielle
appliquées dans ces modèles.

46
Chapitre II Techniques d’intelligence artificielle
II. 1 Introduction

L'Intelligence Artificielle (IA) est la capacité de concevoir des machines intelligentes ou


de développer des applications logicielles autonomes qui imitent les traits de la nature humaine,
comme le raisonnement, la résolution de problèmes, la planification, la prise de décision optimale,
etc... La capacité de ses approches à surpasser les actions humaines a attiré l'attention des
entreprises et des chercheurs du monde entier, et ce domaine d'étude a connu des progrès rapides
au cours des deux dernières décennies. Les domaines d’application de l’IA sont nombreux, on peut
citer par exemples l’analyse des séries temporelles, la vision par ordinateur, les systèmes experts,
l’automatique et la robotique, l’optimisation, l’analyse du texte, l’apprentissage profond, etc… La
Figure II-1 présente un aperçu sur les différents domaines d’applications de l’IA ainsi que des
exemples des techniques utilisées dans chaque domaine.

Contrairement à des techniques comme la logique floue, utilisées dans les systèmes
experts, l'apprentissage automatique, ou Machine Learning (ML), est une application ou un sous-
ensemble de l'IA qui permet aux machines d'apprendre à partir de données historiques sans être
programmées explicitement. L'apprentissage automatique peut être divisé en deux catégories
principales : l'apprentissage supervisé et l'apprentissage non supervisé.

Dans le cas d’un apprentissage supervisé, la tâche à effectuer peut-être une tâche de
classification ou de régression. Il existe plusieurs méthodes utilisées dans la littérature pour les
problématiques de régression, telles que comme la régression linéaire, les réseaux de neurones
(section II.2), les arbres de décision et le Random Forest (RF) (section II.3). De même pour la
classification, il existe plusieurs méthodes comme la régression logistique, les K plus proches
voisins ou K-Nearest Neighbors (KNN), les machines à vecteurs support ou Support Vector
Machines (SVM), le Random Forest (RF) et les Réseaux de Neurones (RN). L'apprentissage
profond est un sous-ensemble principal de l'apprentissage automatique reposant sur le modèle des
réseaux neurones. Il est appliqué dans diverses domaines de l’IA comme la vision par ordinateur
en appliquant les réseaux de neurones convolutifs, Convolutional Neural Network (CNN) (section
II.2.2), et l’analyse du texte discutée en détail dans la section II.5. Pour les systèmes appliquée
dans cette thèse, nous avons choisi le RF pour la classification, compte tenu de sa simplicité de

47
mise en œuvre et de ses performances de prédiction dans des applications similaires [36], [58].
Contrairement à l’apprentissage supervisé, l’apprentissage non supervisé est utilisé pour extraire
les principales caractéristiques ou constituer des regroupements homogènes dans un ensemble de
données non labellisé. Les deux principales applications de l’apprentissage non supervisé sont le
clustering et la réduction de la dimensionnalité. Pour le clustering, la méthode des K-moyennes
(section II.4) a été appliquée dans le système proposé dans le chapitre IV pour sa simplicité, sa
rapidité, sa facilité d’interprétation et sa capacité à obtenir des bons résultats sur des ensembles de
données convexes.

La section II.6 est dédiée à présenter l’algorithme génétique, un algorithme d’optimisation


basé sur l’imitation des processus biologiques de reproduction et de sélection naturelle pour
trouver les solutions les plus adaptées au problème d’optimisation. Cet algorithme est appliqué
dans le système proposé dans le chapitre IV compte tenu de sa capacité à effectuer des divers
problèmes d’optimisation dans diverses applications liées à la prédiction de la demande [155]–
[157]. Finalement, la section II.7 présente brièvement le récent domaine de recherche qui consiste
à l’explication des prédictions effectuées par les algorithmes de l’IA.

Figure II-1 : Domaines d'application de l'IA

48
II. 2 Réseaux de neurones artificiels

Inspirés par le cerveau humain, les réseaux de neurones artificiels sont une famille des
techniques d’IA qui imitent la structure du système nerveux en vue de prendre la décision la plus
adéquate. Beaucoup d’applications, industrielles, biomédicales, robotiques, etc…, utilisent ces
techniques d’IA qui ont toujours présenté des bonnes performances. Il en existe plusieurs types :

 Réseaux de neurones classiques – Réseaux de neurones à propagation avant (Feedforward


Neural Networks),
 Réseaux de neurones convolutifs (Convolutional Neural Networks),
 Réseaux de neurones récurrents (Recurrent Neural Networks) et Long Short-Term Memory
LSTM,
 Etc.

Cette partie présente les différents types des réseaux de neurones utilisés dans cette thèse,
notamment les réseaux de neurones classiques, les réseaux de neurones convolutifs et les
transformateurs.

II. 2. 1 Réseaux de neurones classiques

Le réseau de neurones à propagation avant, ou Feedforward neural network, est le type de


de réseaux de neurones les plus utilisés du fait qu’il peut apprendre et modéliser les relations non
linéaires et complexes entre les données d'entrée et de sortie.

Ce réseau de neurones est composé de multiples couches de neurones reliés par des
connexions pondérées de poids ajustables analogues à des synapses [158]. Un tel réseau est
composé d’une couche d’entrée avec des nœuds représentant les variables d'entrée au problème,
une couche de sortie avec des nœuds représentant les différentes classes du problème de
classification correspondant, et une ou plusieurs couche(s) cachée(s) contenant des nœuds pour
aider à découvrir les tendances cachées dans les données. La Figure II-2 présente deux exemples
de structures possibles de réseaux de neurones.

49
Figure II-2 : Structures possibles d'un réseau de neurones

II. 2. 1. 1 Evaluation des neurones

La sortie de chaque neurone est déterminée par ses entrées et sa fonction d'activation. La
valeur d’entrée 𝒖 d’un neurone est déterminée par la sortie de chacun des neurones de la couche
précédente 𝒙𝒊 ainsi que son poids synaptique correspondant 𝒘𝒊 :

𝑢 = ∑ 𝑥𝑖 ∗ 𝑤𝑖 (1)
𝑖

La sortie 𝒐 d'un neurone est ensuite calculée à l'aide de sa fonction d'activation f(x):

𝑜 = 𝑓(𝑢) (2)
Bien qu'en théorie, il est possible d'appliquer différents types de fonctions d'activation pour
différentes couches, il est courant dans la littérature d'appliquer le même type de fonction
d'activation pour les couches cachées [159]. Il s'agit généralement d'une fonction non linéaire telle
que la fonction sigmoïde (3) ou la fonction tangente hyperbolique (4).

1
𝑓(𝑥) = (3)
1 + 𝑒 −𝑥
𝑒 𝑥 − 𝑒 −𝑥
𝑓(𝑥) = 𝑥 (4)
𝑒 + 𝑒 −𝑥
II. 2. 1. 2 Processus d’apprentissage

Il existe de nombreuses façons d'entraîner les poids d'un réseau de neurones. L'une des
méthodes les plus courantes est la « rétro-propagation ». Cette dernière est une forme
d'apprentissage supervisée où le réseau de neurones est appris en utilisant un ensemble de données
d’apprentissage. Ces données se composent des valeurs des neurones d'entrée 𝑥𝑖 et des valeurs

50
attendues 𝑦𝑖𝑑 des neurones de sortie. A chaque étape k, le réseau de neurones est alimenté par un
ensemble des entrées d'apprentissage et les valeurs de sortie réelles correspondantes sont calculées.
Ensuite, les différences entre les sorties attendues et les sorties réelles sont calculées :
𝑇
𝐸(𝑤) = Σ𝑝=1 𝐸𝑝 (𝑤) (5)
1𝑚 2
Avec : 𝐸𝑝 (𝑤) = 2 Σi=1 [𝑦𝑖𝑑 (𝑘) − 𝑦𝑖 (𝑘)]

Où 𝑇 est le nombre d’exemples dans l’ensemble d’apprentissage, et 𝑚 est le nombre de


sorties des réseaux de neurones.

Puis les poids des réseaux de neurones sont mis à jour en utilisant l’algorithme du gradient
descendant :

𝑤𝑖𝑗𝑙 (𝑘 + 1) = 𝑤𝑖𝑗𝑙 (𝑘) − Δ𝑤𝑖𝑗𝑙 (6)


𝜕𝐸(𝑤)
Avec : Δ𝑤𝑖𝑗𝑙 = 𝛼 𝑙 (𝑘) ; 𝛼 étant un facteur nommé « pas d’apprentissage ».
𝜕𝑤𝑖𝑗

Ceci peut être répété autant de fois que nécessaire jusqu'à ce que le réseau de neurones
atteigne le niveau de précision désiré.

En général, la mise à jour des poids se fait en minimisant une fonction de coût (erreur par
exemple) à l'aide de plusieurs algorithmes d'optimisation bien connus : le gradient descendant (déjà
mentionné) qui est l'algorithme d'apprentissage le plus simple et le plus populaire, le gradient
descendant stochastique qui est un algorithme plus simple et donc plus rapide que l’algorithme
classique [160], l'estimation adaptative du moment (ADAM) qui est basé sur des estimations
adaptatives des moments de plus bas ordre [161], etc…

II. 2. 2 Réseaux de neurones convolutifs

Le Réseau de Neurones Convolutif ou Convolutional Neural Network (CNN) est l’une des
techniques les plus puissantes d’apprentissage profond utilisé pour la reconnaissance d'objets et
l’analyse des images [162]. Il est utilisé dans plusieurs applications telles que la classification, la
segmentation d'images, etc. Comme mentionné dans le Chapitre I, l’utilisation des modèles pré-
entraînées des CNN permettent essentiellement l’extraction des caractéristiques intéressantes des
images d’articles de mode pour diverses applications telles que la prévision de la demande et la
détection des tendances. Dans cette thèse, un CNN est appliqué pour extraire les caractéristiques

51
des images d’articles de mode afin de les utiliser comme entrées à un modèle permettant de prédire
les opinions des consommateurs sur ces articles.

Contrairement aux réseaux de neurones à propagation avant (entièrement connectés) [163],


chaque neurone de chaque couche n'est connecté qu’à un petit ensemble de neurones de la couche
précédente. Ceci est inspiré du concept des cellules simples et complexes, dans le cortex visuel du
cerveau humain, responsables de l’analyse de son environnement par la reconnaissance des
éléments présents dans son champ de vision : trouver les autres personnes, identifier les voitures,
les animaux …

Figure II-3 : Exemple d'une architecture CNN pour une classification d'images

Un CNN peut extraire et générer automatiquement, sans structuration des données par
l’opérateur, des caractéristiques profondes des images d'entrée, et a une forte robustesse contre la
translation, la mise à l'échelle, la rotation, et toute autre déformation pouvant se faire sur une image.
La Figure II-3 présente un exemple d’ architecture d’un CNN utilisé pour faire la classification
entre deux classes d’images. Un CNN est généralement composé de deux parties : Extraction des
caractéristiques et Prédiction.

Dans la première partie « Extraction des caractéristiques », les opérations de convolution


et de « pooling » sont utilisées alternativement, suivies de la couche « flattening » pour générer les
caractéristiques profondes (Deep Features) des données brutes.

a. Couche de convolution

La convolution est l’opérateur essentiel le plus important utilisé dans un CNN, du fait qu’il
permet d’extraire des caractéristiques d’une certaine image donnée tel que la mise en évidence des
traits verticaux, horizontaux, diagonaux…, Inversion de couleurs, Floue de l’image, etc… Ceci se
fait en appliquant un filtre adéquat sur l’image. Le filtre est une petite matrice de taille variable

52
(3x3, 5x5, 9x9, …) appelée aussi « kernel » ou « feature detector ». Ce filtre est appliqué sur
chaque portion de l’image en calculant un simple produit scalaire entre cette portion et le filtre lui-
même (opérateur de la convolution) ; ce produit scalaire est maximal lorsque ces deux parties sont
identiques. On répète ce même processus de convolution en balayant toutes les portions de l’image
initiale. Finalement, on obtient comme résultat une nouvelle image de taille légèrement réduite.
Cette image s’appelle « carte des caractéristiques », ou « feature map », et représente une version
filtrée de l’image d’origine. D’où, en appliquant plusieurs filtres sur l’image d’origine, on obtient
plusieurs « feature maps » (plusieurs indicateurs), et ainsi, on construit la première couche de
convolution du CNN. Les filtres d’un CNN ont une taille fixe et définie à l’avance, mais leurs
valeurs sont générées aléatoirement à l’initialisation. Puis au fur et à mesure de l’apprentissage,
chacun des poids s’adapte pour apprendre à faire ressortir les caractéristiques qui permettent au
réseau de neurones d’interpréter au mieux l’image : les valeurs des filtres font donc parties des
variables que le réseau change en apprenant.

b. Pooling

Le « pooling » (aussi appelée sous-échantillonnage) réduit la dimensionnalité de chaque


« feature map » tout en conservant les informations les plus importantes. C’est une opération
simple qui consiste à remplacer un carré de pixels de la « feature map » par une valeur unique. Il
en existe différents types : « Max Pooling », « Average Pooling », « Sum Pooling », etc... Le
« pooling » présente plusieurs avantages :

 Il rend les représentations d'entrée (feature maps) plus petites et plus faciles à gérer. Cela
permettra ainsi de diminuer la charge de calcul.
 Il réduit le nombre de paramètres dans le réseau, ce qui permet de contrôler le
« overfitting ».
 Il permet au CNN de trouver si une caractéristique est présente dans une image, sans se
soucier de l’endroit où elle se trouve.
c. Flattening

C’est l’étape la plus simple dans un réseau de neurones convolutifs. En effet, après
plusieurs opérations de convolution et de « pooling », l'image originale est représentée finalement
par une série de « feature maps ». Le « flattening » consiste à connecter toutes ces « feature maps »

53
afin de générer un long vecteur représentant le vecteur d’entrée à la dernière partie, couches
entièrement connectées.

Ainsi, dans la première partie du CNN, on peut avoir plusieurs couches successives de
convolution et de « pooling » : la deuxième couche de convolution effectue une convolution sur la
sortie de la première couche de « pooling » et ainsi de suite. Ensemble, ces couches extraient les
caractéristiques utiles des images, introduisent une non-linéarité au réseau et réduisent la
dimension des indicateurs tout en visant à rendre les caractéristiques invariantes au petites
déformations dans l’image d’origine. En général, plus nous avons d'étapes de convolution et de
« pooling », plus le réseau sera capable à reconnaître des caractéristiques complexes [164].

Dans la seconde partie d’un CNN, les caractéristiques trouvées sont connectées à un réseau
de neurones traditionnel pour faire la classification.

Comme dans le cas d’un réseau de neurone classique, l’apprentissage se fait par
l’algorithme de la rétro-propagation, avec la seule différence que dans le cas d’un CNN, il existe
plus de paramètres à entraîner. Outre les poids de la partie entièrement connectée, les noyaux des
filtres, qui désignent les poids des couches de convolution, sont aussi des paramètres initialisés
aléatoirement puis mis à jour lors de la phase d'entraînement en utilisant l’algorithme du gradient
descendant ou un de ses variantes.

Il existe plusieurs architectures de CNN pré-entraînés disponibles tels que VGG-16


ResNet50, Inceptionv3 et EfficientNet. Les modèles pré-entraînés sont des architectures de CNN
qui ont été pré-entraînés sur de grands ensembles de données, généralement pour une classification
d'images. En fonction de la tâche désirée, il est possible d'utiliser le modèle pré-entraîné tel quel
ou de le modifier en utilisant l'apprentissage par transfert. En effet, le principe de l'apprentissage
par transfert pour la classification d'images est que si un modèle est entraîné sur un ensemble de
données suffisamment large et général, ce modèle servira effectivement de modèle générique de
la reconnaissance d’images. Il est ainsi possible d’utiliser ses cartes de caractéristiques (feature
maps) déjà entraînées sans nécessité de ré-entraîner l'ensemble du modèle. Plus précisément, ces
modèles peuvent être utilisés pour :

54
 Extraction des caractéristiques : Utiliser directement le modèle pré-entraîné pour
extraire des caractéristiques des images afin de les utiliser comme entrées au modèle
d’apprentissage désiré.

 Fine-Tuning : Ajouter des nouvelles couches de classification au modèle pré-entraîné,


et entraîner conjointement les couches nouvellement ajoutées et les dernières couches
du modèle de base. Cela permet de rendre les représentations des caractéristiques d'ordre
supérieur dans le modèle de base plus adaptées à la tâche spécifique désirée.

II. 2. 3 Transformateurs

Le « transformateur » a été introduit en 2017 par l'équipe Google Brain [165]. Il s’agit d’un
modèle d'apprentissage profond qui adopte le mécanisme d'auto-attention (self-attention),
principalement utilisé dans le domaine du traitement du langage naturel (NLP). Auparavant, la
plupart des systèmes NLP reposaient sur des modèles de langage directionnels, qui lisent le texte
en entrée de manière séquentielle (de gauche à droite ou de droite à gauche). Cependant, un
transformateur lit la séquence entière de mots en une seule fois. Cette caractéristique permet au
modèle d'apprendre le contexte d'un mot en se basant sur tout son entourage. En outre, cela permet
une plus grande parallélisation que les RNNs, ce qui réduit les temps d’apprentissage des systèmes
et permet ainsi un apprentissage sur des ensembles de données plus importants [165]. Par
conséquent, des systèmes pré-entraînés basés sur les transformateurs, tel que BERT (Bidirectional
Encoder Representations from Transformers) et CamemBERT (version francophone utilisée dans
cette thèse), ont été développés en les entraînant sur des grands ensembles de données textuelles,
et ont surpassé les autres modèles en les appliquant sur des tâches spécifiques telles que
l’étiquetage morphosyntaxique et l’analyse syntaxique des dépendances [166].

II. 2. 3. 1 Architecture d’un transformateur


Dans une architecture de base d'un transformateur, nous voyons un composant de codage
(formé de plusieurs encodeurs), un composant de décodage (formé de plusieurs décodeurs), et des
connexions entre eux (Figure II-4).

55
Figure II-4 : Composants d'un transformateur

Les encodeurs ont tous une structure identique (mais ils ne partagent pas de poids). Chacun
d'eux est décomposé en deux sous-couches : une couche de self-attention, et un réseau de neurones
classique (Figure II-5).

 Les entrées de l'encodeur entrent tout d'abord dans une couche de self-attention - une
couche qui aide l'encodeur à se référer aux autres mots de la phrase d'entrée en encodant
un mot spécifique (voir section II.2.3.2).
 Les sorties de la couche de self-attention sont ensuite transmises à un réseau de neurones
classique. Ce même réseau de neurones est appliqué indépendamment à chaque mot de la
séquence d'entrée.

Le décodeur se compose également de ces deux couches, auxquelles s'ajoute une couche
d'attention (Encodeur-Décodeur) qui aide le décodeur à réaliser le mécanisme d’attention entre la
séquence d’entrée (encodée) et la séquence de sortie (en train d’être décodée).

Figure II-5 : Couches d'un encodeur/Décodeur

L’architecture générale d’un transformateur, comme proposée dans [165], est présentée
dans la Figure II-6. En plus de l’embedding initial des mots, le transformateur ajoute un vecteur
à chaque embedding d'entrée. Ces vecteurs suivent un modèle spécifique que le modèle apprend

56
et qui l'aide à déterminer la position de chaque mot. Le bloc d’encodeurs est composé de N = 6
encodeurs identiques, dont chacun est composé d’une couche d’attention multi-head (8 attention
heads) et d’un réseau de neurones (512 unités – dimension d’embedding). L’architecture utilise
des connections résiduelles autour de chacune des ces couches, suivies d'une normalisation. De
même pour le bloc des décodeurs, avec la seule différence qui est l’ajout d’une troisième couche
qui effectue une attention multi-head sur la sortie de la pile d'encodeurs.

Figure II-6 : Architecture d'un transformateur [165]

Afin de mieux comprendre le fonctionnement d’un transformateur, il faut comprendre ce


qui se déroule dans la couche de self-attention.

57
II. 2. 3. 2 Self-Attention
En traitant chaque mot (chaque position) dans la séquence d'entrée, le mécanisme de self-
attention permet au modèle de considérer d'autres mots pertinents dans la séquence d'entrée qui
peuvent aider à mieux encoder ce mot. Ceci est fait en calculant un vecteur d’attention pour chaque
mot de la séquence. Ce vecteur est calculé en prenant en considération trois vecteurs spécifiques à
chaque mot de la séquence à la position i :

 Vecteur requête (Query Vector) qu’on appelle qi,


 Vecteur clé (Key Vector) qu’on appelle ki,
 Vecteur valeur (Value Vector) qu’on appelle vi,
Ces vecteurs sont obtenus en multipliant l’embedding xi du mot par les matrices WQ, WK
et WV entraînées pendant le processus d’apprentissage.
La deuxième étape du calcul de l'attention consiste à calculer un score pour chaque mot de
la phrase d’entrée. Ces scores déterminent le degré d'attention à accorder aux autres mots de la
phrase d'entrée en encodant le mot à une certaine position i. Ceci consiste à calculer les produits
scalaires du vecteur qi avec les différents vecteurs ki des différents mots de la phrase. Les troisième
et quatrième étapes consistent à diviser les scores par la racine carrée de la dimension 𝑑𝑘 des
vecteurs clés (ce qui permet d'obtenir des gradients plus stables), puis à appliquer l’opération
softmax aux résultats obtenus. Softmax normalise les scores afin qu'ils soient tous positifs et que
leur somme soit égale à 1. On obtient ainsi le vecteur d’attention correspondant à la position i.
Enfin, les deux dernières étapes consistent à multiplier le vecteur valeur vi par les différents scores
normalisés obtenus puis calculer la somme de ces vecteurs valeur pondérés. Cela produit la sortie
zi de la couche self-attention à la position i. Les différents vecteurs zi sont ceux qui vont être passés
au réseau de neurones (deuxième partie du transformateur).
En pratique, ce calcul est effectué sous forme de matrice pour un traitement plus rapide.
On calcule tout d'abord les matrices requête Q = [q1, …, qi, …], clé K = [k1, …, ki, …] et valeur V
= [v1, …, vi, …]. Pour ce faire, on regroupe les différents embeddings xi des mots de la phrase
d’entrée dans une matrice X = [x1, …, xi, …] et on la multiplie par les matrices de poids WQ, WK
et WV entraînées pendant le processus d’apprentissage. Enfin, la matrice sortie Z = [z1, …, zi, …]
de la couche self-attention est calculée suivant la formule suivante :

58
𝑄 𝐾𝑇
𝑍 = 𝑠𝑜𝑓𝑡𝑚𝑎𝑥 ( )𝑉 (7)
√𝑑𝑘
II. 2. 3. 3 Multi-head attention
Le mécanisme connu par « Multi-head attention » est le fait d’avoir plusieurs couches de
self-attention différents fonctionnant en parallèle. Ceci a pour but de développer la capacité du
modèle à se concentrer sur différentes positions. En plus, il donne à la couche d'attention plusieurs
"sous-espaces de représentation". Dans ce cas, il s'agit de plusieurs ensembles de matrices WQ,
WK et WV (Requête/clé/valeur). Chacun de ces ensembles est initialisé de manière aléatoire.
Ensuite, après l’apprentissage, chaque ensemble est utilisé pour projeter les embeddings d'entrée
dans un sous-espace de représentation différent. La sortie finale dans ce cas est la concaténation
des vecteurs de sortie de chacune de ces couches, multipliée par une nouvelle matrice WO
entraînée pendant le processus d’apprentissage.

II. 3 Random Forest

L'algorithme Random forest (RF), ou Forêt d’arbres de décision, est un algorithme


d'apprentissage automatique fréquemment utilisé, proposé par Leo Breiman en 2001 [167]. Il s'agit
d'un modèle qui peut traiter à la fois les problèmes de classification et de régression. En effectuant
un apprentissage parallèle sur un ensemble d'arbres de décision construits de manière aléatoire, le
modèle RF combine les résultats de ces arbres de manière à obtenir un seul résultat. Cela le rend
plus robuste contre le problème de sur-apprentissage. Sa facilité de mise en œuvre et sa flexibilité
ont favorisé son adoption. Le modèle RF est connu pour être l'une des techniques les plus efficaces
et les plus appliquées car il peut traiter directement les données catégorielles et les valeurs
manquantes sans avoir recours à un prétraitement préalable des données [168]. Pour ces raisons,
ce modèle est utilisé à plusieurs reprises dans les systèmes proposés dans cette thèse. En effet,
l’ensemble de données utilisé par le système proposé dans la deuxième partie du chapitre III est
formé d'attributs de différents types, numériques et catégoriels, et consiste en des données réelles
contenant des données manquantes. Par ailleurs, le modèle RF est utilisé dans le premier système
proposé dans le chapitre IV afin de prédire des prototypes de ventes. Le choix du modèle RF est
basé sur la littérature qui montre sa capacité à fournir des bonnes performances dans différentes
applications liées à la prévision des ventes [36] , [38], [58].

59
Afin de mieux comprendre comment un RF apprend et effectue des prédictions, il faut tout
d’abord comprendre le fonctionnement d’un arbre de décision. Les arbres de décision permettent
de développer un modèle d'apprentissage capable de prédire la classe (en cas d’un problème de
classification) ou la valeur (en cas d’un problème de régression) d'une variable cible en établissant
des règles simples à partir de données d'apprentissage. Les nœuds d’un arbre de décision se
divisent en trois catégories :

 Nœud racine : l’accès à l’arbre se fait par ce nœud. Il représente l'ensemble de la


population, qui est ensuite divisé en deux ou plusieurs ensembles homogènes.
 Nœuds internes (ou de décision) : les nœuds intermédiaires, ou les sous-nœuds, qui
se divisent en d'autres sous-nœuds.
 Nœuds terminaux (ou feuilles) : les nœuds finaux qui ne se divisent plus.

Les arbres de décision utilisent plusieurs algorithmes pour choisir la règle utilisée par le
nœud racine ou un nœud interne afin de le diviser en deux ou plusieurs sous-nœuds. L’objectif de
la création de sous-nœuds est essentiellement d’augmenter l'homogénéité des sous-nœuds (sous-
ensembles) résultants par rapport à la variable cible. L'arbre de décision divise les nœuds sur toutes
les variables disponibles et sélectionne ensuite la division qui donne lieu aux sous-nœuds les plus
homogènes. La mesure de l’homogénéité des sous-nœuds s’obtient en calculant le gain
d’information obtenu suite à cette division. Dans le cas d’une classification, l'incertitude de
l'information traitée est mesurée par l’entropie de chaque nœud. Plus l'entropie est élevée, plus il
est difficile de tirer des conclusions de ces informations. Le gain d’information de la division est
ensuite calculé en soustrayant la somme des entropies des sous-nœuds enfants de celle du nœud
parent. Plus le gain d’information est élevé, plus les sous-nœuds de la division correspondante sont
homogènes. Ainsi, la règle de division correspondante est choisie. Ce processus se répète jusqu’à
qu’un critère d’arrêt est atteint : nombre maximal des nœuds initialement choisi, obtention des
nœuds terminaux (feuilles) les plus homogènes, etc. Ce processus est le même dans le cas d’une
régression, avec la seule différence que, à la place de l’entropie, la variance des nœuds est calculée
afin d’obtenir le gain d’information de la division.

Un modèle RF est composé de plusieurs arbres de décision. Le nombre optimal d'arbres est
un paramètre important qui doit être choisi initialement, et qui peut être de plusieurs centaines ou

60
plus. En utilisant un double tirage aléatoire, chaque arbre voit le problème différemment. En effet,
l’apprentissage de chaque arbre de décision se fait de la manière suivante :

 Les observations de la base de données sont tirées au hasard avec des


remplacements. Un processus appelé : tree bagging,
 Les caractéristiques (variables d’entrée) sont tirées au hasard. Un processus appelé
: feature sampling.

En d’autres termes, chaque arbre du modèle est entraîné sur un sous-ensemble aléatoire de
données selon le principe du bagging, avec un sous-ensemble aléatoire de caractéristiques (entrées
du modèle), ce qui permet d'obtenir un modèle efficace et robuste [167], [169]. Les prédictions
sont ensuite moyennées dans le cas des arbres de régression ou utilisées pour un vote dans le cas
des arbres de classification. Une illustration du fonctionnement d’un modèle RF est présentée dans
la Figure II-7.

Figure II-7 : Fonctionnement d'un RF

II. 4 K-moyennes

L'algorithme K-moyennes est un algorithme de partitionnement ou de clustering non


supervisé et non hiérarchique couramment utilisé dans les applications d'apprentissage
automatique [170] pour sa facilité de mise en œuvre, son interprétabilité, sa rapidité de calcul et
ses performances sur des données convexes. Cet algorithme permet de diviser les observations de

61
l'ensemble de données initial en K groupes distincts, appelés clusters. Ainsi, les observations
similaires sont regroupées au sein du même cluster. Ceci est réalisé en minimisant la somme des
distances entre chaque observation et la moyenne de son cluster correspondant. Le choix de la
distance est réalisé en fonction de l’application considérée.

Le choix du nombre de clusters K est une tâche très critique, surtout lorsqu'il n'y a pas de
connaissance préalable concernant les données [170]. Un grand nombre peut conduire à un
partitionnement excessif de l'ensemble de données, ce qui peut empêcher la découverte de
tendances intéressantes dans ces données. D'un autre côté, un nombre de clusters trop faible peut
conduire à des clusters trop généralisés. Par conséquent, la difficulté consiste à choisir un nombre
de clusters K approprié qui permet de mettre en évidence des caractéristiques intéressantes dans
l’ensemble de données. À cette fin, il existe plusieurs méthodes qui peuvent être utilisées : la
méthode Elbow [171], le coefficient de silhouette [172], etc. :

 La méthode Elbow :
Elle est basée sur la minimisation de la variance des différents clusters. La variance intra-
classes est la somme des distances entre chaque centre (moyenne) d’un cluster et les
différentes observations inclues dans le même cluster. En traçant la variance en fonction
des différents nombres de clusters K, on peut obtenir le K optimal : c'est la valeur de K où
la courbe montre une inflexion plus prononcée.
 Le coefficient de silhouette :
Elle est calculée comme la différence entre la distance moyenne aux observations du même
cluster et la distance moyenne aux observations des autres clusters voisins. Elle peut varier
entre -1 et +1 ; Si elle est négative, l'observation est en moyenne plus proche du cluster
voisin que du sien : elle est donc associée au mauvais cluster. Alors que si elle est positive,
l'observation est alors bien située dans son propre cluster.

II. 5 Analyse du texte et Traitement automatique du langage naturel


L’analyse du texte est le processus d'exploration et d'analyse de grandes quantités de
données textuelles non structurées à l'aide des programmes capables d'identifier des concepts, des
modèles, des mots-clés et d'autres attributs dans les données. Une fois extraites, ces informations
sont converties en une forme structurée, et sont intégrées dans des bases de données utilisées pour
des analyses descriptives, prescriptives ou prédictives. L’analyse du texte est utilisée dans cette

62
thèse afin d’analyser les données textuelles des blogs de mode publiés en ligne, et par conséquent,
identifier les dernières tendances de la mode [152], [153].

Afin d’analyser un texte non-structuré, ce dernier doit subir plusieurs étapes préparatoires.
La préparation du texte comprend plusieurs techniques comme suit :

 Tokenisation : Découpage d’un texte en entités plus petites appelées tokens, qui
représentent la base de tout traitement du langage naturel. Ce processus supprime
également tout contenu inutile du texte, comme les espaces blancs.
 Lemmatisation : La représentation des tokens sous leur forme canonique ; un verbe est
représenté par son infinitif, un nom par son masculin singulier, etc.
 Racinisation (ou stemming) : La suppression des suffixes et affixes des tokens et la
conservation de leur forme de base.
 Suppression des mots d'arrêt : L'élimination des tokens qui ont une occurrence
fréquente, mais qui n’ajoutent aucune valeur à l'analyse de texte (« et », « le », « a »,
etc.).
 Traitement automatique du langage naturel, ou Natural Language Processing (NLP) :
L'objectif est de parvenir à un algorithme capable de comprendre le langage humain
parlé et écrit.

Le texte non structuré peut être analysé à l'aide de plusieurs techniques en fonction de
l'application. On peut citer :

 Modélisation thématique ou Topic modeling : Déterminer les principaux thèmes ou


sujets dans texte en identifiant les mots-clés utilisés.
 Fréquence des termes : Évaluer l'importance d'un terme en fonction de la fréquence de
son apparition dans un texte ou un groupe de textes.

Une fois que les méthodes d'analyse de texte sont utilisées pour traiter les données non
structurées, les informations obtenues peuvent alors être visualisés sous forme de graphiques, de
courbes, de tableaux ou des graphes. Ceci permettent de repérer les tendances dans les données et
de prendre des décisions.

Le traitement automatique du langage naturel, ou NLP, est l'une des plus importantes
méthodologies utilisées pour traiter le texte. Le domaine de recherche du NLP et de la
63
compréhension du langage naturel a beaucoup progressé ces dernières années grâce aux modèles
de langage basés sur des transformateurs, un modèle d'attention populaire (voir section II.2.3). En
effet, une des limites des méthodes classiques d’embeddings des mots, tels que GloVe et
Word2Vec, est qu’elles permettent d'associer chaque mot à un seul vecteur ne représentant qu'une
seule dimension de la signification de ce mot, indépendamment de son contexte, d’où l’importance
de concevoir des modèles de langage capable de comprendre le sens ambigu d'un mot en utilisant
le contexte du texte voisin.

Les études dans le domaine de NLP montrent que les modèles de langage qui se basent sur
un apprentissage bidirectionnel sont capables d’avoir un sens plus profond et correcte du contexte
que les modèles à direction unique qui attribuent un embedding fixe pour chaque mot. Ainsi, des
modèles tels que ELMo sont proposés dans la littérature. ELMo est entraîné à prédire le mot
suivant dans une séquence de mots en utilisant un LSTM, ce qui lui permet d’avoir une idée
générale du contexte lors de la prédiction du mot suivant. En fait, ELMo est entraîné en utilisant
un LSTM bidirectionnel, de sorte que le modèle n'a pas seulement le sens du mot suivant, mais
aussi celui du mot précédent. Cependant, malgré le fait que les LSTM règlent en partie le
« Vanishing Gradient Problem » des réseaux de neurones récurrents, les transformateurs se sont
montrés plus adapté pour traiter les dépendances à long terme. Comme détaillé dans la section
II.2.3 un transformateur permet la lecture bidirectionnelle de la séquence de mots. Par conséquent,
la littérature propose plusieurs modèles de langages basés sur des transformateurs tel que BERT,
Bidirectional Encoder Representations from Transformers [166].

Dans ce qui suit, nous présentons en détail l’architecture générale et le fonctionnement du


modèle BERT, ainsi que du modèle CamemBERT, version francophone utilisée dans cette thèse.

II. 5. 1 BERT
BERT est le premier modèle de langage bidirectionnel pré-entraîné. Il est conçu à
apprendre la signification profonde des mots et des contextes. Ceci est effectué grâce à l’utilisation
des transformateurs. En effet, le choix des transformateurs est l'un des facteurs les plus importants
contribuant au succès de ce modèle. BERT utilise une méthode de modélisation du langage masqué
afin d'empêcher le mot en question de « se voir », c'est-à-dire d'avoir une signification fixe
indépendante de son contexte. BERT est alors obligé d'identifier le mot masqué en se basant

64
uniquement sur le contexte. Après le pré-entraînement, le modèle peut être adapté à différentes
tâches ainsi qu'à différents ensembles de données avec des ajustements minimaux.

BERT utilise le bloc encodeur du transformateur : pile de plusieurs encodeurs. Il existe


deux tailles de modèle pour BERT : BERTBASE et BERTLARGE. Le BERTBASE utilise 12 blocs
encodeurs, alors que ce nombre est 24 pour la version BERTLARGE. Cependant, bien que ces deux
versions présentent également quelques autres différences au niveau de la taille des couches, les
architectures fondamentales sont les mêmes. La Table II-1 présente une comparaison entre ces
deux versions.

Table II-1 : Comparaison entre BERTBASE et BERTLARGE

BERTBASE BERTLARGE
Nombre d’encodeurs 12 24
Dimension des embeddings 768 1024
Nombre des têtes d’attention 12 16
Nombre des paramètres 110 millions 340 millions

Tout comme l'encodeur classique du transformateur, BERT prend en entrée une séquence
de mots qui passe progressivement dans les différentes couches des encodeurs. Chaque couche
applique le mécanisme de self-attention sur la séquence d’entrée correspondante, et transmet ses
résultats à travers un réseau de neurones, pour enfin les transmettre à l'encodeur suivant.

BERT a été entraîné sur 2500 millions mots de Wikipédia et 800 millions mots de livres.
Lors de l'entraînement d’un modèle de NLP, il est difficile de définir un objectif de prédiction. De
nombreux modèles prédisent le mot suivant dans une séquence, une approche directionnelle qui
limite intrinsèquement l'apprentissage contextuel. Pour surmonter ce défi, BERT utilise deux
stratégies d’apprentissage :

 Le modèle de langage masqué (Masked Language Model MLM) : 15% du texte est choisi
au hasard pour être masqué. Parmi ces mots, 80% sont remplacés par [MASK], 10% sont
remplacés par un mot aléatoire, et les 10% restants sont conservés tels quels. L'objectif du
modèle est de récupérer les textes originaux à partir de cette version masquée.

65
 Le modèle de prédiction de la phrase suivante (Next Sentence Prediction NSP) : BERT
prend en entrée 2 phrases, notées A et B, sa mission est alors de prédire si B est
effectivement la phrase suivante après A dans le corpus. Cette tâche vise à renforcer la
capacité de BERT à raisonner à travers les phrases.

BERT peut être utilisé comme un modèle universel pré-entraîné et adapté à des tâches
spécifiques. En fait, l'utilisation de BERT pour une tâche spécifique est relativement simple. Ce
modèle pré-entraîné peut-être utilisé pour une grande variété de tâches de NLP, tout en ajoutant
une couche supplémentaire, au modèle de base, spécifique à la tâche désirée.

Plusieurs travaux de recherche dans le domaine du NLP ont été basés sur le modèle BERT,
tel que RoBERTa – Robustly optimized BERT approach, un des plus célèbres successeurs de
BERT [173]. Ce modèle, utilisant la même architecture que BERT, optimise quelques hyper-
paramètres du modèle initial afin d’améliorer sa performance.

II. 5. 2 CamemBERT
Bien qu’il existe plusieurs modèles de langage performants dans la littérature, la plupart de
ces modèles ont été entraînés sur des données anglophones, ce qui limite leur application pratique
dans d'autres langues. Récemment, CamemBERT [174], un modèle de langue très performant pour
le Français, basé sur l'architecture RoBERTa, a été développé. Ce modèle est entraîné avec le sous-
corpus français du nouveau corpus multilingue OSCAR. Il a surpassé les autres modèles de langue
française lors de son évaluation sur quatre tâches différentes :

 Etiquetage morphosyntaxique (Part-of-speech tagging, POS) : Attribution de chaque mot


à sa catégorie grammaticale correspondante,
 Analyse syntaxique des dépendances (Dependency Parsing) : Analyse de la structure
grammaticale d'une phrase basée sur les relations syntaxiques entre les mots,
 Reconnaissance d'entités nommées (Named Entity Recognition, NER) : Détecter les entités
dans un texte et les classer dans des catégories prédéfinies,
 Reconnaissance d’implication textuelle (Natural Language Inference, NLI) : Déterminer
si une "hypothèse" est vraie, fausse ou indéterminée à partir d'une phrase "prémisse".

66
Par conséquent, ce modèle est choisi dans cette thèse afin de développer un système de détection
des tendances (chapitre III section III.2) capable d’identifier les attributs de mode tendances à
partir des données textuelles collectées sur des sites et magazines de mode francophone en ligne.

II. 6 Algorithme génétique

Les algorithmes génétiques (AG) sont un type d'algorithmes d'optimisation utilisés pour
trouver une ou des solutions optimales ou approchées à un problème informatique donné qui
optimise une fonction objective particulière [175]. Les algorithmes génétiques représentent une
branche du champ d'études appelée « calcul évolutif » [176], en ce sens qu'ils imitent les processus
biologiques de reproduction et de sélection naturelle pour trouver les solutions "les plus adaptées"
au problème d’optimisation. Les AG ont divers avantages qui les ont rendus immensément
populaires [177]. On peut citer :

 Ne nécessitent aucune information sur les dérivées (qui peut ne pas être disponible pour de
nombreux problèmes du monde réel).
 Sont plus efficaces que les méthodes d’optimisation traditionnelles.
 Possèdent de très bonnes capacités de parallélisation des calculs.
 Fournissent une liste de bonnes solutions et pas seulement une solution unique.
 Utiles lorsque l'espace de recherche est très grand.

Compte tenu de sa capacité d’optimisation dans diverses applications liées à la prévision


de la demande [155]–[157], l’AG est appliqué dans le système proposé dans le chapitre IV afin
d’optimiser l’impact des variables exogènes sur les ventes historiques.

Pour résoudre un problème d'optimisation à l'aide de l'algorithme génétique, il est essentiel


de se familiariser avec certaines définitions de base :

 Chromosome (ou Individu) : Chaine composée d’une série de gènes (valeurs binaires ou
réelles) représentant une solution possible du problème donné.
 Population : Ensemble de chromosomes (des solutions possibles) représentant une partie
de l’espace de recherche.

67
 Génotype : C’est la population dans l'espace de calcul où les solutions sont représentées
d'une manière qui peut être facilement comprise et manipulée par un système informatique
(population après codage des solutions).
 Phénotype : c’est la population de l'espace de solution du monde réel dans lequel les
solutions sont représentées d’une manière réelle et sans codage (informations issues du
décodage).
 Codage/Décodage : Pour les problèmes simples, les espaces phénotype et génotype sont
les mêmes. Cependant, dans la plupart des cas, les espaces phénotype et génotype sont
différents. Le décodage est un processus de transformation d'une solution du génotype en
espace phénotype, tandis que le codage est un processus de transformation du phénotype
en espace génotype (Par exemple, transformation d’un nombre réel, phénotype, en sa
représentation binaire, génotype, et vice versa). Le décodage doit être rapide car il est
effectué de manière répétée dans un AG pendant le calcul de la valeur de la fonction fitness
(définie après).
 Fonction « fitness » : C’est la fonction utilisée pour évaluer la performance d’une solution
(liée directement à la fonction objective à optimiser) ; Elle donne une idée à quel point
l’individu est adapté au problème.
 Opérateurs génétiques : Ils modifient la composition génétique des individus. Il s'agit
notamment du croisement, de la mutation, et de la sélection.

II. 6. 1 Opérateurs génétiques

a. Sélection

La sélection des parents est le processus de sélection des individus de la population


courante qui vont se recombiner pour créer des descendants (nouvelles solutions) pour la
génération suivante. Le choix de la technique de sélection est très important pour le taux
de convergence de l'AG du fait que des bons parents amènent les individus vers des
solutions meilleures et plus adaptées. Plusieurs techniques de sélection existent : La
méthode de la « loterie biaisée », la méthode « élitiste », la sélection par tournois, etc.

68
b. Croisement
L'opérateur de croisement combine deux chromosomes parents pour créer deux
nouveaux chromosomes enfant pour la génération suivante. Généralement, les algorithmes
génétiques incluent un paramètre de taux de croisement 𝜌𝑐 ; ce dernier indique la
probabilité qu'un croisement soit effectué sur les deux parents sélectionné. En pratique, on
prend 𝜌𝑐 de l’ordre de 0.6-0.7 , indiquant qu’à peu près 60 à 70% des individus de la
population vont subir un croisement (sinon les deux enfants sont des copies des parents
correspondants). Il existe différentes méthodes de croisement : croisement à point unique,
croisement à point multiple, et croisement uniforme.

c. Mutation

L'opérateur de mutation modifie aléatoirement les gènes dans le chromosome. La


probabilité de mutation d'un gène est le taux de mutation 𝜌𝑚 . Généralement, on prend une
petite valeur de 𝜌𝑚 de l’ordre de 0.03-0.04 , indiquant que seulement 3 à 4% des gènes
vont subir une mutation. La mutation d'un gène dépend du codage ; si un gène est binaire,
la mutation de ce gène sera l'inversion de ce bit, tandis que dans le cas d’un codage réel, la
mutation consiste tout simplement à lui ajouter un petit nombre aléatoire. Cela préserve la
diversité de la population et permet d'éviter une convergence précoce vers un optimum
local.

II. 6. 2 Processus général

L’algorithme commence par une population initiale de solutions possibles au problème


donné (chromosomes) aléatoirement générés. Ces chromosomes sont évalués ensuite par la
fonction fitness afin de donner à chaque individu une certaine probabilité d’être sélectionné.
Durant la phase de sélection, les individus ayant les meilleures valeurs de fitness sont considérés
les solutions les plus adaptés au problème, ayant ainsi une probabilité supérieure d’être
sélectionnés. Les individus sélectionnés subissent ensuite un croisement et potentiellement une
mutation, comme en génétique naturelle, produisant de nouveaux enfants, et le processus se répète
sur plusieurs générations. De cette façon, l’AG continue à « faire évoluer » les meilleurs individus
ou les meilleures solutions au fil des générations, jusqu'à ce qu’un critère d'arrêt soit atteint. Ce

69
critère d’arrêt peut être exprimé, par exemples, en nombre d’itérations ou en stagnation de
l’optimisation. Cet algorithme est illustré dans la Figure II-8.

Figure II-8 : Organigramme de l'AG

II. 7 Explicabilité des modèles d'apprentissage automatique

Les entreprises utilisent de plus en plus d'algorithmes d'apprentissage automatique, dont


certains peuvent sembler des boîtes noires vu leur complexité. En outre, malgré leur précision, ces
modèles fournissent des résultats parfois difficiles à expliquer et comprendre, ce qui constitue une
problématique importante pour les entreprises. En effet, les entreprises doivent avoir une bonne
compréhension de ce qui se passe réellement à l'intérieur de ces modèles, de la manière dont les
prédictions sont faites (qu’est ce qui influence les résultats et comment), en particulier dans les
applications sensibles, comme les diagnostics médicaux par exemple. Afin de relever ces défis, un
nouveau domaine de recherche émerge : l'explicabilité des modèles d'apprentissage automatique.
Dans son ensemble, ce concept contribue à la compréhension des modèles et des prédictions qu'ils
produisent, et est considéré comme un élément essentiel de l'apprentissage automatique.

SHapley Additive exPlanations, ou SHAP, est une approche largement utilisée pour
expliquer les modèles d'apprentissage automatique [178]. Basées sur un concept issu de la théorie

70
des jeux coopératifs, les valeurs SHAP peuvent être utilisées pour effectuer une rétro-ingénierie
de la sortie d'un modèle ML. Les valeurs SHAP sont une mesure de la contribution de chaque
caractéristique à la prédiction. Chaque instance de données est constituée de valeurs de
caractéristiques qui se coordonnent dans le cadre d'une coalition. Selon la formule de Shapley, la
valeur de Shapley d'une caractéristique est sa contribution marginale moyenne parmi toutes les
coalitions possibles. Plus la valeur SHAP absolue d'une caractéristique est élevée, plus elle est
importante et contributive. De plus, les valeurs SHAP peuvent être utilisées pour comprendre
comment une prédiction est faite. En fait, une valeur de base, pour les valeurs de Shapley, est
calculée comme la moyenne de toutes les prédictions de l'ensemble d'entraînement. Ensuite, pour
expliquer une prédiction spécifique, les valeurs SHAP sont analysées afin de déterminer l'impact
de chaque caractéristique sur la prédiction : la prédiction finale est déterminée en ajoutant les
valeurs SHAP de toutes les caractéristiques à la valeur de base.

Nous distinguons deux types d'explicabilité :

 L'explicabilité globale : cherche à expliquer le modèle dans son ensemble. En d'autres


termes, quelles sont les variables les plus importantes en moyenne pour le modèle.
 L'explicabilité locale : consiste à expliquer la prédiction d'un modèle pour un ensemble
spécifique de caractéristiques.

II. 8 Conclusion

Dans ce chapitre, nous avons exposé les techniques d’IA utilisées durant cette thèse ainsi
que leurs fonctionnements. Au regard de la littérature scientifique, ces techniques ont été choisies
pour leurs capacités à répondre aux différents problèmes rencontrés pour développer les modèles
de prévision proposées dans les deux chapitres III et IV. Les deux chapitres suivants se focalisent
sur les applications de ces techniques les objectifs de cette thèse : la détection des tendances de
mode et des préférences clients (Chapitre III), et la prédiction des ventes et de la demande de mode
(Chapitre IV). Ils détaillent les méthodologies proposées et appliquées durant cette thèse dans le
but de répondre à la problématique initiale de cette thèse : comment une enseigne de mode peut
exploiter et analyser les quantités massives des données hétérogènes, structurées et non-
structurées, quantitatives et qualitatives, en utilisant les techniques de l’IA, afin d’extraire des
informations cruciales pour les différentes prises de décision ?

71
Chapitre III Détection des tendances de mode et prédiction
des préférences clients
III. 1 Introduction

Les réseaux sociaux, les applications mobiles et d'autres technologies numériques sont
récemment devenus des éléments essentiels de la vie quotidienne de milliards de personnes qui les
utilisent fréquemment. Le nombre d'utilisateurs des réseaux sociaux a augmenté rapidement ces
dernières années et devrait atteindre près de 3,43 milliards dans le monde d'ici 2023. Suite à cette
révolution de l'internet et des réseaux sociaux, le comportement des consommateurs, et les
relations entre les entreprises et les consommateurs ont été radicalement modifiées. Pour les
entreprises du secteur de la mode, il s'agit d'une énorme opportunité d'établir de nouvelles
méthodes pour l’extraction d’informations pertinentes, afin de mieux comprendre les attentes de
leurs consommateurs et ainsi, augmenter la satisfaction de leurs clients, mieux préparer
l’assortiment des nouvelles collections, et survivre dans un environnement très concurrentiel.

Dans ce chapitre, nous proposons deux systèmes pour aider les enseignes de mode à
détecter et prédire les attentes des consommateurs. Le premier système, détaillé dans la section
III.2, consiste à détecter les dernières tendances de mode à partir des réseaux sociaux, et plus
précisément, à partir des blogues publiés en ligne par les influenceuses et les magazines digitaux
de mode, influençant d’une manière directe le goût des consommateurs. Le deuxième système,
présenté dans la section III.3, consiste à prédire les préférences des clients en termes de produits
de mode. Ce système se base sur des données collectées à partir d’une application mobile ayant
pour but de proposer des nouveaux produits aux clients et de collecter leurs opinions sur ces
produits.

Dans les deux systèmes proposés dans ce chapitre, plusieurs techniques d'apprentissage
automatique ont été appliquées afin de mieux exploiter les données brutes. La procédure suivie
dans ces systèmes est basée sur l’approche Data, Information, Knowledge and Wisdom (DIKW)
[179] présentée à la Figure III-1 et composée des trois étapes suivantes :

 En interprétant, corrélant, comparant, etc., les données brutes (Data), elles deviennent plus
organisées, claires et utiles. Ces données utiles constituent des informations (Information).

72
 En appliquant, comprenant et synthétisant ces informations, elles deviennent des
connaissances (Knowledge).
 Et enfin, en appliquant ces connaissances dans des processus de prise de décision, elles
deviennent de l’intelligence (Sagesse ou Wisdom).

Figure III-1 : Le Modèle « DIKW » [179]

Ainsi, les données subissent plusieurs transitions jusqu'à ce qu'elles acquièrent


suffisamment de valeur pour donner lieu à des décisions pertinentes [179]. La principale
problématique est alors de mette en œuvre les techniques adéquates pour assurer ces transitions et
la prise de valeur.

III. 2 Détection des tendances à partir des réseaux sociaux

Les tendances de la mode changent constamment, ce qui entraîne une difficulté dans la
prévision de la demande. Une bonne compréhension de l’évolution des styles et des tendances de
mode joue un rôle crucial, au sein des enseignes de mode, et offre d’énormes avantages. Pour cela,
les enseignes de mode ont recours à des sous-traitants spécialisées dans la détection et la prévision
des tendances où des prévisionnistes essaient de parcourir les défilés et les grands évènements de
modes, les photos sur les réseaux sociaux, ainsi que les influenceuses et les bloggeuses du monde
entier afin de repérer la prochaine grande tendance. Cependant, de nos jours, nous téléchargeons
collectivement sur les plateformes des réseaux sociaux des milliards de photos et de publications
chaque jour, ce qui rend le travail des prévisionnistes encore plus difficile (Chapitre I section I.4).
Par conséquent, afin de gérer cette masse d'informations de façon optimale, les techniques

73
d'Intelligence Artificielle (IA), se révèlent particulièrement efficaces : au lieu de parcourir
manuellement les différentes plateformes de réseaux sociaux, l'IA permet l'analyse rapide d'une
vaste base de données textuelles et visuelles, ce qui serait difficile, voire impossible, pour une
personne seule.

A cette fin, cette section présente un système de détection de tendances utilisant le


traitement du langage naturel (NLP), un sous-domaine de l'IA pour l'analyse de texte présenté dans
le Chapitre II. La méthodologie proposée consiste à collecter des données relatives à la mode en
ligne afin d'analyser et de détecter les tendances de mode les plus pertinentes, en termes de styles,
qui se répandent sur le marché français. Par conséquent, ce système contribue à la détection
automatique des attributs de mode les plus tendances à partir des magazines de mode en ligne et
des sites web de mode, complétant ainsi les méthodologies existantes de détection des tendances,
et donnant la possibilité de prédire les tendances futures.

La méthodologie générale du système proposé est présentée dans la section III.2.1. Les
sections III.2.2, III.2.3 et III.2.4 montrent en détail les étapes d’extraction de données, leur
transformation en informations structurées et utiles, puis en connaissances (tendances de mode),
respectivement. Les résultats sont présentés dans la section III.2.5.

III. 2. 1 Méthodologie générale


Le système proposé consiste en un outil de détection des tendances basé sur des données
textuelles liées à la mode. L'implémentation de ce système se concentre sur les magazines de mode
numériques et les weblogs en langue française, représentant le premier domaine des réseaux
sociaux de la mode. Les données provenant de telles sources sont constituées généralement de
texte non structuré, qui doit être prétraité afin d'extraire des informations utiles telles que les
attributs de la mode - couleur, matière, motif, style - reflétant les tendances de la mode sur une
certaine période. Une vue d'ensemble du système proposé est illustrée à la Figure III-2. Tout
d'abord, la méthodologie proposée consiste à identifier et à extraire les données (ou scraping en
anglais) des blogs et des magazines de mode en ligne. Les données extraites sont ensuite stockées
dans une base de données structurée contenant, pour chaque blog, son titre, sa date et son contenu.
Ensuite, des techniques d’analyse du texte et de Natural Language Processing (NLP) sont
appliquées pour extraire des informations pertinentes des blogs en termes de mots, de
combinaisons de mots et de taux de récurrences.

74
Figure III-2 : Méthodologie globale du système de détection des tendances

III. 2. 2 Extraction des données

La première étape du système de détection des tendances consiste à choisir soigneusement


les magazines de mode et les sites des influenceurs ayant l’impact le plus important sur le marché
de la mode. En d’autres termes, les informations détectées doivent refléter correctement les
tendances courantes du marché de la mode. Ainsi, notre choix s’est porté sur les influenceuses de
mode françaises les plus célèbres ayant un nombre élevé de suiveurs sur les réseaux sociaux. En
complément, nous avons également sélectionné les magazines de mode en ligne les plus renommés
tels que Vogue, publiant tous les jours les derniers sujets et tendances de mode sous forme des
blogs.

Une fois les sources pertinentes identifiées, l'étape d'extraction des données est réalisée à
l'aide de la bibliothèque « Beautiful Soup », une librairie Python pour l'analyse des documents
HTML et XML. Beautiful Soup fournit des méthodes simples pour naviguer, rechercher et extraire
le contenu de fichiers HTML ou XML. Elle transforme un document HTML complexe en un arbre
d'objets Python, un arbre d'analyse ou parse tree, qui permet d'extraire les données d'une manière
simple et directe. Pour chacun des sites web choisis, un code d’extraction de données est appliqué

75
pour collecter automatiquement les données textuelles incluses dans chaque blog - le résumé du
blog, les différents titres, les textes, les légendes des images, etc. Finalement, l’ensemble de
données obtenu comprend, pour chaque blog, son titre, sa date et son contenu (sous forme de texte
non structuré).

III. 2. 3 Extraction d’information utiles et structurées

Afin de pouvoir construire un système de détection de tendances de mode à partir des


données textuelles se trouvant dans les blogs en ligne, il faut tout d’abord (i) préciser la période
d’étude des tendances et agréger les blogs publiés durant cette période, (ii) préparer et nettoyer
les données textuelles en utilisant différentes techniques de traitement du texte, (iii) appliquer des
techniques plus avancées d’analyse du texte en vue d'extraire des mots et des combinaisons qui
nous permettent d'analyser le texte et en tirer des informations. Les techniques utilisées sont des
modèles pré-entraînés basés sur le modèle de langage Francophone CamemBERT, compte tenu
de ses performances par rapport à autres modèles de langue française lors de son évaluation sur
les différentes tâches utilisées dans notre système (voir chapitre II section II.5.2). D’autre part, il
était nécessaire de (iv) développer un dictionnaire spécifique de mode en Français afin de (v)
filtrer les expressions relatives à la mode, classifier les mots et ainsi permettre une analyse plus
pertinente par la suite.

Les différentes étapes suivies pour traiter les données et extraire des informations utiles
sont présentées en détail dans cette section et illustrées dans la Figure III-3.

76
Figure III-3 : Méthodologie proposée pour l'extraction des expressions liées à la mode à partir des blogues

77
III. 2. 3. 1 Agrégation des blogs
L’étude de tous les blogs relatifs à la mode, collectées sur une période donnée, permet
d’obtenir une vision générale des sujets de mode les plus fréquemment discutés et de déduire les
tendances au cours de cette période. Par conséquent, la méthodologie proposée commence par
l'identification de la période d’étude des tendances de mode, puis l'agrégation de tous les contenus
des blogs correspondants sous la forme d’un texte unique non structuré.

III. 2. 3. 2 Préparation et nettoyage des données


Une fois que tous les blogs de la période étudiée sont agrégés, les données textuelles
obtenues doivent être traitées afin de pouvoir extraire des informations pertinentes par la suite.
Nous avons ainsi procédé à la rectification des données via des méthodes de NLP telles que la
suppression des mots d’arrêt, la lemmatisation et la racinisation (ou stemming) afin de représenter
tous les mots sous leur forme canonique (par exemple Blanc-Blanche, manteau-manteaux) (voir
chapitre II section II.5). De plus, les mots spécifiques aux produits de mode ayant des significations
similaires ont été unifiés (par exemple, nylon = polyamide, lycra = élasthanne, denim = jean, etc..),
et les mots relatifs aux couleurs ont été regroupés en plusieurs groupes de couleurs plus généraux
afin d'obtenir des résultats plus robustes (par exemple, [rose, fuchsia, etc.] = [couleur rose]).

III. 2. 3. 3 Extraction de mots et de combinaisons de mots


L'étape suivante de la méthodologie proposée consiste à extraire les mots et les différentes
combinaisons de mots qui peuvent décrire les tendances de la mode. Pour ce faire, nous avons
procédé comme suit :

1- Examiner les catégories grammaticales des mots collectés ainsi que les relations
syntaxiques grammaticales entre les mots dans la phrase, en utilisant l’étiquetage
morphosyntaxique (Part-of-speech tagging, POS) et l'analyse syntaxique de
dépendance (Dependency Parsing) basés sur CamemBERT (voir chapitre II section
II.5.2).
2- Construire une fonction permettant d’identifier les différentes combinaisons de mots et
les relations grammaticales que nous souhaitons extraire. Par exemple, ces
combinaisons de mots peuvent être « adjectif - nom », « adjectif – adjectif - nom »,
« sujet - COD », etc. Des exemples de combinaisons de mots intéressantes à extraire,

78
du fait qu’ils sont pertinents pour identifier des tendances de mode, sont présentées ci-
dessous :
 « Elle porte une jupe blanche et des talons hauts bleus » : « jupe blanche »,
« talons hauts bleus »,
 « La robe imprimée qu'elle porte a des manches longues » : « robe
imprimée à manches longues »,
 « Cette chemise est noire » : « chemise noire ».
3- Appliquer cette fonction à toutes les phrases obtenues à l'étape précédente. De cette
manière, nous obtenons, à partir des textes extraits des blogs, toutes les combinaisons
de mots qui peuvent nous aider à détecter les tendances. Cependant, ces différentes
combinaisons obtenues peuvent ne pas être liées à la mode. Il a donc été nécessaire de
les filtrer afin d'obtenir des expressions uniquement liées à la mode.

III. 2. 3. 4 Développement d’un dictionnaire de mode


Les modèles de traitement automatique de langage naturel Francophone ayant été
développés récemment, les dictionnaires français disponibles (des ensembles de données
structurées de mots catégorisés) ne couvrent pas toutes les applications existantes. A notre
connaissance, il n'existe pas de dictionnaire de NLP Francophone pour le domaine de la mode. Par
conséquent, comme il s'agit d'une partie essentielle pour la détection des tendances, nous avons
développé un dictionnaire spécifique basé sur des livres de vocabulaire de mode en français et des
connaissances d'experts dans le domaine. Le dictionnaire est composé de mots classés selon les
attributs de la mode tels que le type de vêtement, la couleur, la matière, le motif, la forme et le
style (Table III-1). La taille du dictionnaire varie selon l’attribut, il contient : 72 types de
vêtement, 48 couleurs, 36 matières, 50 motifs, 91 formes et 77 styles différents.

Table III-1: Dictionnaire de mode développé

Type De Vêtement Couleur Matière Motif Forme Style


Chemise Noir Coton Léopard Ajouré Américain
Cardigan Blanc Cachemire Carreau Asymétrique Basique
Pull Rouge Chiffon Fleuri Bouffant Bohème
Robe Beige Flanelle Géométrique Ceinturé Chic
Blazer Camel Fourrure Rayé Décolleté Sportif
… … … … … …

79
III. 2. 3. 5 Filtrage des expressions liées à la mode et classification des mots
A l’aide du dictionnaire de mode francophone développé, nous avons procédé au filtrage
des combinaisons de mots liés à la mode. En effet, les expressions obtenues dans la section III.2.3.3
peuvent correspondre à différents sujets sans relation avec la mode. Il est donc nécessaire de filtrer
ces expressions afin de conserver celles qui sont uniquement liées à la mode. Il s'agit des
expressions qui incluent, par exemple, un type de vêtement, une matière, ou tout autre attribut de
la mode. Ensuite, nous attribuons à chaque mot présent dans ces expressions, la catégorie
correspondante parmi les attributs de mode du dictionnaire : type de vêtement, couleur, matière,
etc. Ceci permet d'obtenir une base de données structurée des attributs de mode mentionnés dans
les blogs pendant la période considérée. La Figure III-4 illustre un exemple d’extraction des
expressions de mode des blogs.

Figure III-4 : Exemple d’extraction des expressions de mode

80
III. 2. 4 Obtention des connaissances sur les tendances de la mode
Afin d'analyser les données et d'obtenir des indications sur les articles les plus tendance
mentionnés dans les blogs de mode en ligne, plusieurs méthodes ont été appliquées. Tout d'abord,
la fréquence des occurrences de chaque mot dans le dictionnaire de la mode est calculée. Nous
sommes partis de l'hypothèse que des occurrences plus élevées d'un mot relatif à un attribut de
mode impliquent sa popularité dans le monde de la mode ainsi que l'intérêt des experts de la mode
envers cet attribut (par exemple, une certaine couleur) au cours de la période considérée. En effet,
il est rare qu’un blog publié dans les magazines de mode mentionne négativement un certain
produit ou attribut de mode. Ainsi, chaque mention est considérée comme positive. En outre, des
matrices de cooccurrence ont été calculées en utilisant les expressions de mode et la catégorie de
mode correspondante de chaque mot dans ces expressions. Cela donne un aperçu, non seulement
des mots de mode populaires, mais aussi des combinaisons d’attributs de mode les plus tendances
(par exemple, une certaine couleur – matière, ou une combinaison motif – type de vêtement).

III. 2. 5 Résultats du système de détection des tendances

III. 2. 5. 1 Détection des tendances


a. Test sur un seul blog
Pour tester l'efficacité du système proposé dans la mise en évidence des sujets clés discutés
dans un texte - en termes d'attributs de mode (type de vêtement, matériau, motif, etc.) - nous
l’avons appliqué dans un premier temps à un blog français extrait du magazine numérique de
mode : Vogue. Le blog extrait discute de la façon de porter la dernière tendance de vestes pour
l'automne-hiver 2020-2021 : les chemises et surchemises à carreaux. Le système proposé a été
capable d'extraire les expressions de mode, d'affecter chaque mot à sa catégorie correspondante et
de calculer la fréquence d'occurrence de chaque mot. Par exemple, les mots les plus répétés étaient
: chemise et surchemise pour les types de vêtements, flanelle et laine pour les matières, et carreaux
pour les motifs.

Par ailleurs, il est intéressant d'analyser également les combinaisons de mots extraites. En
effet, pour identifier les tendances de la mode, il est crucial de reconnaître les différentes
combinaisons possibles des différents attributs de mode extraits. Ces combinaisons sont détectées
en calculant une matrice de cooccurrence entre les différents mots de mode détectés. Pour
visualiser les résultats, nous avons construit un réseau de graphes en utilisant cette matrice de
81
cooccurrence ; la visualisation du réseau fournit une représentation claire et significative des
données.

Figure III-5 : Exemple du système de détection des tendances appliqué sur un seul blogue

82
Typiquement, chaque nœud représente un mot, et chaque arête entre deux nœuds représente
la cooccurrence des deux mots correspondants. Plus un mot apparaît souvent dans le texte, plus le
nœud correspondant est grand. De même, plus une combinaison de deux mots apparait souvent,
plus la ligne qui relie les mots devient épaisse. La Figure III-5 présente un exemple de réseau de
graphes de tendances obtenu en appliquant le système de détection proposé au blog de Vogue sur
les chemises à carreaux. Différentes couleurs de nœuds sont utilisées pour les différents attributs
de mode.

b. Détection des tendances sur une période de temps


Après avoir testé le système proposé sur un seul blog pour valider sa capacité à détecter
des mots-clés et des combinaisons de mots dans un texte, nous l’avons appliqué dans un second
temps à la détection des tendances de mode discutées dans les blogs de mode entre août 2019 et
février 2020. Pour ce faire, nous avons agrégé tous les blogs publiés au cours de cette période et
appliqué la même méthodologie. Les résultats de la Figure III-6 montrent une partie du graphe de
réseau obtenu. Les nœuds en "rouge" indiquent le type de vêtement, en "bleu" la matière et en "or"
le motif. Les robes, les pulls et les manteaux sont les mots les plus répétés, ce qui est logique
puisque la période considérée comprend à la fois les blogs des saisons d'été et d'hiver. Les résultats
ont également montré plusieurs combinaisons de mots intéressantes, telles que pull en cachemire,
pull imprimé, robe à paillettes (robe sequin), robe fleurie, manteau en fourrure, etc. Ces mots
étaient plus souvent mentionnés ensemble dans les blogs (arête épaisse entre les nœuds) reflétant
les tendances de la mode. De même, nous avons appliqué le système proposé pour détecter les
tendances liées à la famille de produits des vestes, pour les mois de novembre et décembre 2018
(seuls les blogs concernant cette famille de produits ont été traités). La Figure III-7 met en
évidence les tendances les plus pertinentes discutées au cours de cette période : les combinaisons
A- [manteau-fourrure-léopard-imprimé], et B [blazer-veste-carreaux].

83
Figure III-6 : Quelques tendances détectées pour différentes familles de
produitsdans les blogs de mode entre août 2019 et février 2020

Figure III-7 : Quelques tendances détectées pour la famille de produits des vestes dans les blogs de mode entre
novembre 2018 et décembre 2018

III. 2. 5. 2 Evolution des tendances


En plus de la détection et de la visualisation des tendances, le système proposé offre la
possibilité de fournir l'évolution des tendances avec le temps. Ces tendances peuvent correspondre
à un seul attribut (par exemple, la couleur rouge) ou à une combinaison d'attributs (par exemple,
une robe fleurie). L’évolution des tendances est obtenue en : (i) définissant la durée totale d’étude

84
(par exemple année 2019) et (ii) la fenêtre d’observation des tendances pour laquelle on applique
la méthodologie proposée (un mois). Ainsi, on obtient l’évolution des tendances pour l’année 2019
par mois (12 points). En outre, afin de valider les tendances détectées par le système proposé, nous
les avons comparées avec celles fournies en ligne par Google Trends. Des exemples de ces
comparaisons pour la matière « cachemire » et le motif « carreaux » sont montrés dans les figures,
Figure III-8 et Figure III-9, respectivement. Ces figures montrent qu’il existe une certaine
corrélation entre les tendances détectées par le système proposé et celles fournies par Google
Trends. Par ailleurs, on remarque par exemple dans la Figure III-8 qu’il existe un léger décalage
entre les deux. Apparemment, les blogueurs semblent influencer les consommateurs sur un certain
attribut de la mode (la matière cachemire dans ce cas), de sorte qu'ils le recherchent plus tard sur
Google. D’autre part, on constate que cet impact est moins évident dans le cas du motif
« carreaux » (Figure III-9).

L'obtention de l'évolution des tendances sur plusieurs années présente divers avantages. Tout
d’abord, cela permet de regrouper les tendances de mode selon leurs évolutions avec le temps, afin
d'identifier les tendances stables, les tendances émergentes, etc. En effet, une analyse macro des
tendances est effectuée pour les différents attributs de mode. Les figures Figure III-10, Figure
III-11, Figure III-12 et Figure III-13, illustrent des exemples des évolutions des tendances par
an. On remarque par exemple que pour les matières « denim » et « cachemire », les courbes de la
fréquence d’occurrence augmente régulièrement chaque année dès 2018, contrairement aux
matières « fourrure » et « velours » (Figure III-12). De même, en analysant les tendances des
motifs dans la Figure III-13, on remarque que le motif « carreaux » peut être considéré comme
une tendance émergente, contrairement au motif « léopard » qui a montré un pic dans l'année 2016
puis une baisse significative par la suite. Ces résultats peuvent être utilisés par les stylistes dans
les enseignes de mode afin de concevoir les prochaines collections de sorte qu’elles correspondent
aux dernières tendances. En outre, l'obtention de l'évolution des tendances offre la possibilité
d’intégrer les tendances détectées dans des systèmes de prévision des ventes et de la demande des
articles de mode, comme proposé dans le chapitre IV.

85
Figure III-8 : Comparaison de l'évolution de la tendance "Matière = Cachemire" par mois détectée par le système
proposé et celle fournie par Google Trends

Figure III-9 : Comparaison de l'évolution de la tendance "Motif = Carreaux" par mois détectée par le système
proposé et celle fournie par Google Trends

86
Figure III-10 : Exemple d'évolution des tendances de quelques sous-catégories de la famille des vestes par an

Figure III-11 : Exemple d'évolution des tendances des couleurs par an

87
Figure III-12 : Exemple d'évolution des tendances des matières par an

Figure III-13 : Exemple d'évolution des tendances des motifs par an

88
III. 3 Prédiction des préférences des clients

Avec l’émergence des technologies mobiles et connectées, la détection des tendances peut
également être envisagées en collectant directement les données de façon massives auprès des
consommateurs. Dans cette partie, nous présentons un système de prédiction de l’opinion d’un
consommateur envers un nouveau produit. La méthodologie générale du système proposé est
présentée dans la section III.3.1. La description des données ainsi que l’extraction d’informations
des données brutes et la méthode de prédiction appliquée sont présentées dans les sections III.3.2,
III.3.3 et III.3.4 respectivement. La section III.3.5 présente et discute les résultats obtenus.

Figure III-14 : Méthodologie proposée pour la prédiction des préférences clients

III. 3. 1 Méthodologie générale


Dans ce système, les données initiales collectées sont des données brutes non structurées
se rapportant aux produits de mode (images et descriptions textuelles) et aux consommateurs
(préférences de style et actions historiques). Ces données sont transformées en informations utiles
- attributs descriptifs structurés - puis en connaissances – groupe d’images et de styles, etc. - en
appliquant différentes techniques telles que le traitement de texte, le clustering et l'analyse de
données. Une fois les informations structurées et utiles obtenues, un modèle de prédiction est
construit pour prédire l'opinion des consommateurs sur des nouveaux produits. Enfin, une analyse
des prédictions obtenues permet d’identifier les tendances en termes d’attributs de mode préférés

89
par les clients. La méthodologie proposée est illustrée dans la Figure III-14. Les sections suivantes
présentent en détail les différentes étapes de la méthodologie proposée.

III. 3. 2 Données utilisées

Les données brutes utilisées pour cette étude ont été collectées à l'aide d'une application
mobile créée par une société française appelée « Matchmarket ». Matchmarket présente une
approche innovante pour détecter les best-sellers d'une marque avant même leur lancement. Les
marques peuvent utiliser les services de Matchmarket pour collaborer avec leurs clients à la
conception des futures collections. Dans ce contexte, Matchmarket développe une application
mobile dédiée qui permet aux consommateurs de donner leur avis sur des photos de prototypes, ce
qui aide les marques à localiser plus précisément leurs clients potentiels, à optimiser leurs
campagnes de marketing et à mieux estimer les quantités à produire. Cependant l’application ne
permet pas de prédire le succès d’un article et d’analyser les causes de son succès.

Chaque consommateur utilisant cette application est invité à indiquer ses données
personnelles (âge, genre, lieux de résidence, etc.) et également à sélectionner ses préférences de
style dans une liste de 15 styles différents fournie par l'application, avant de pouvoir commencer
à l'utiliser. Ces styles sont : Rock, Bohème, Streetwear, Urban cool, Fatale, Chic, Casual, Smart,
Romantique, Working Girl, Vintage, Made in local, Engagé, Gothique et Kawaii. Lorsqu’un
certain nombre de nouveaux produits sont en attentes d’évaluations, l’application lance une
« campagne d’évaluation » où l’ensemble ou une partie ciblée des utilisateurs est invité à évaluer
le produit pour un vote (appelé action) « like » ou « dislike ». Chaque produit est présenté à
l'utilisateur par son image, accompagnée d'une courte description contenant ses caractéristiques
telles que sa marque, son type, son prix, et/ou sa matière, etc. La Figure III-15 présente un
exemple d’un produit et ses caractéristiques tels que présentés dans l’application.

90
Robe perlée
Matière Coton
Couleur Rose
Prix 35€

Figure III-15 : Exemple d'un produit de mode tel que présenté dans l'application Matchmarket

De plus, certains attributs sont parfois donnés séparément comme la couleur du produit, la
matière, etc. L'ensemble des données collectées contient initialement 247252 enregistrements,
correspondant à 3731 utilisateurs donnant leur avis sur 425 produits différents.

Les données brutes sont nettoyées afin d'extraire uniquement les données fiables. Cette
étape de nettoyage des données est nécessaire car l'ensemble de données initial contient de
nombreux exemples incomplets et non pertinents. Par exemple, plusieurs utilisateurs peuvent avoir
sélectionné de manière aléatoire toutes les préférences de style, ou aucune, lors de la création
initiale de leur compte. Un autre exemple est la nécessité de corriger les données relatives à divers
produits, par exemple en unifiant la terminologie des attributs des produits (nylon = polyamide,
lycra = élasthanne, etc..).

Avec une telle quantité de données hétérogènes et peu structurées – plusieurs attributs de
différents types – il est complexe d’extraire les informations pertinentes pour la prédiction des
opinions des clients sur de nouveaux produits. Pour cela, il est nécessaire de définir de nouveaux
attributs, basés sur les données initiales, capables de fournir des informations plus précieuses sur
les produits et pour les clients afin d'aboutir à un modèle de prédiction plus robuste et efficace. En
fait, plusieurs méthodologies ont été appliquées afin de définir les attributs qui modélisent les liens
entre le profil de l'utilisateur et un produit donné - ceci inclut :

 La création d'un attribut de profil de style de l'utilisateur pour mieux décrire ses préférences
de style,

91
 L'exploitation des images des produits pour extraire des informations significatives,
 Le calcul des nouveaux attributs relatifs au comportement de vote des utilisateurs.

La définition de ces nouveaux attributs repose sur la mise en œuvre de diverses techniques
d'apprentissage automatique et est présentée en détail dans les parties suivantes.

III. 3. 3 Extraction d’information et définition de nouveaux attributs

III. 3. 3. 1 Traitement du texte


Cette étape est nécessaire afin d'obtenir des informations utiles à partir des données brutes.
En effet, comme détaillé dans la section III.3.2, les attributs des produits ont été collectés sous la
forme d’images et de descriptions textuelles non structurées, où chaque produit est décrit de façon
libre par l’enseigne de mode. Par conséquent, afin de pouvoir utiliser les données textuelles pour
le modèle de prédiction, elles doivent être transformées en un ensemble de données structurées
présentant les attributs de chaque produit. Pour ce faire, nous avons utilisé des techniques de
traitement du texte, ainsi que des dictionnaires d'attributs de mode préparés avec l'aide d'experts
de la mode, afin d'extraire ces informations des textes bruts. En effet, le produit i de description
« Robe bleue courte en velours à fleurs, 80 euros » devient un enregistrement dans la base de
données comme présenté par la Table III-2.

Table III-2 : Exemple de la base de données obtenue après le traitement des textes (descriptions) des produits

Numéro Type du Prix


Couleur Motif Forme Matière
du produit produit (en euros)
… … … … … … …
i Robe Bleu Fleuri Court Velours 80
… … … … … … …

III. 3. 3. 2 Clustering des images


Afin d'exploiter les informations contenues dans les images, il est important de noter que
la représentation du produit à travers sa photo, par exemple, un produit sur un fond blanc ou un
produit porté par un mannequin, peut avoir un impact significatif sur l'évaluation du
consommateur. En d'autres termes, il est important de considérer l'image du produit exactement
telle qu'elle est présentée à l'utilisateur, c'est-à-dire avec l'arrière-plan et les éventuelles poses du

92
mannequin. Par conséquent, un clustering d'images est nécessaire pour regrouper les images
similaires afin d’extraire les informations potentielles à intégrer au modèle prédictif.

Les réseaux CNN sont largement reconnus comme l'une des techniques les plus
appropriées pour traiter le problème des images (voir Chapitre II section II.2.2). Par conséquent,
une architecture largement utilisée d'un CNN, le VGG-16, pré-entraînée sur plus d'un million
d'images de la base de données ImageNet, est appliquée aux images pour extraire des
caractéristiques significatives. Ensuite, une Analyse en Composantes Principales (ACP) est
appliquée afin de réduire la dimension des vecteurs de caractéristiques obtenus en conservant les
informations significatives. Enfin, une classification non supervisée basée sur la méthode des K-
moyennes est appliqué pour répartir les images en clusters, afin de regrouper les images similaires
au sein d’un même cluster. La Figure III-16 illustre les étapes du processus de clustering propose.
Le nombre de clusters le plus approprié est défini en utilisant le coefficient de silhouette (voir
chapitre 2 section II.4).

Figure III-16 : Processus du clustering des images

III. 3. 3. 3 Analyse des actions historiques


Les votes des utilisateurs pour un produit fournissent des informations précieuses sur sa
popularité. Cependant, ces votes dépendent aussi fortement du comportement de vote des
utilisateurs : certains utilisateurs sont plus aptes à aimer des produits, d'autres ont des opinions
plus marqués, etc. Par conséquent, des attributs supplémentaires sont calculés à partir des actions

93
historiques (likes/dislikes) afin de mieux décrire chaque client et son influence sur le processus de
prédiction global. Ces nouveaux attributs sont nommés : expérience de l’utilisateur, taux de
« likes » et fiabilité de l’utilisateur.

a. Expérience de l'utilisateur :

L'expérience de l'utilisateur est définie comme le nombre de votes d’un client. Le but de
cet attribut est principalement de pondérer les actions des utilisateurs pendant le processus
d'apprentissage et de prédiction et plus particulièrement lorsqu'il est considéré en combinaison
avec d'autres attributs d'utilisateurs. Par exemple, les attributs « taux de likes » et « fiabilité »,
calculés par la suite, devraient être fortement pondérés lorsque l'utilisateur a une grande
expérience. L'expérience d'un utilisateur u est calculée comme suit :

𝑈𝐸(𝑢) = 𝐶𝑎𝑟𝑑({𝐴(𝑢, 𝑝) ≠ ∅}, 𝑝 ∈ {𝑃}) (8)

Où A(u,p) est l'action (like/dislike) de l'utilisateur u pour le produit p, et P est l'ensemble des
produits historiques de la base de données.

b. Le taux de « likes » de l'utilisateur :

Le taux de « likes » de l'utilisateur est le pourcentage d'actions de « like » de l'utilisateur


parmi le nombre total de ses actions (votes). Cette information permet d'identifier les utilisateurs
qui ont des goûts éclectiques ou, au contraire, qui sont très restrictifs dans leurs choix. Le taux de
« likes » d'un utilisateur u est calculé comme suit :

𝐶𝑎𝑟𝑑({𝐴(𝑢, 𝑝) = 𝑙𝑖𝑘𝑒}
𝑈𝐿𝑅(𝑢) = , 𝑝 ∈ {𝑃} (9)
𝐶𝑎𝑟𝑑({𝐴(𝑢, 𝑝) ≠ ∅}

c. La fiabilité de l'utilisateur :
La fiabilité de l'utilisateur est un indice qui quantifie si l'utilisateur évalue un produit
comme la majorité des utilisateurs qui ont également évalué ce produit. La fiabilité d'un utilisateur
u est calculée comme suit :

∑𝑝∈𝑃𝐷(𝑢) 𝑃𝐷𝑅(𝑝) + ∑𝑃∈𝑃𝐿(𝑢) 𝑃𝐿𝑅(𝑝)


𝑈𝑅(𝑢) = (10)
𝐶𝑎𝑟𝑑({𝐴(𝑢, 𝑝) ≠ ∅}, 𝑝 ∈ {𝑃})

94
Avec PDR(p) le taux de « dislike » du produit et PLR(p) le taux de « like » du produit p :

𝐶𝑎𝑟𝑑({𝐴(𝑢, 𝑝) = 𝑑𝑖𝑠𝑙𝑖𝑘𝑒} (11)


𝑃𝐷𝑅(𝑝) = , 𝑢 ∈ {𝑈}
𝐶𝑎𝑟𝑑({𝐴(𝑢, 𝑝) ≠ ∅}

𝐶𝑎𝑟𝑑({𝐴(𝑢, 𝑝) = 𝑙𝑖𝑘𝑒} (12)


𝑃𝐿𝑅(𝑝) = , 𝑢 ∈ {𝑈}
𝐶𝑎𝑟𝑑({𝐴(𝑢, 𝑝) ≠ ∅}

Et où PD(u) et PL(u) sont les ensembles de produits pour lesquels l'action de l'utilisateur u est
« dislike » et « like », respectivement.

III. 3. 3. 4 Clustering des utilisateurs selon leurs préférences de styles


La préférence de style d'un utilisateur est évidemment un attribut clé pour prédire son
opinion sur un certain produit. La combinaison des styles sélectionnés par un utilisateur, parmi les
15 styles proposés dans l'application, forme le profil de style de l'utilisateur. Cependant, la variété
des combinaisons de styles est un vrai problème car elle peut rendre le processus d'apprentissage
du modèle de prédiction plus compliqué. En effet, ayant 15 styles proposés à chaque utilisateur, il
est possible d'obtenir 215 = 32 768 combinaisons de styles différentes. En outre, ce profil est une
information auto-déclarée et subjective et, par conséquent, comprend des valeurs aberrantes et des
biais qui peuvent aussi fortement perturber le processus d'apprentissage.

Compte tenu de ces éléments, un clustering des utilisateurs selon leurs profils de style
apparaît comme l'approche la plus appropriée pour réduire la complexité et définir les principaux
profils de style existants. Un tel problème de clustering peut être formalisé comme un clustering
de données binaires où les profils de style sont représentés par des vecteurs binaires de dimension
égale aux nombres de styles différents. Chaque profil de style est alors composé des préférences
de style d'un utilisateur, sélectionnées parmi les quinze styles différents (S1, ..., S15) proposés dans
l'application. Il est donc représenté par un vecteur binaire de dimension 15, où chaque bit indique
si le style correspondant a été initialement sélectionné par le client ou non (Figure III-17).

Figure III-17 : Structure du vecteur binaire représentant le profil de style initial d'un utilisateur

95
Ensuite, la distance de similarité de Jaccard est appliquée pour obtenir la matrice de distance entre
tous les clients, en fonction des différents styles. Le choix de cette métrique est justifié par sa
capacité à mesurer les similitudes avec des attributs binaires. A partir de l’analyse de la matrice de
similarité obtenue, K différents clusters d’utilisateurs sont identifiés par la technique de clustering
agglomératif. Ceci implique que les différentes combinaisons de styles possibles peuvent être
résumées en K principaux profils de style. Cette approche basée sur un clustering agglomératif à
partir de la matrice de similarité est privilégiée afin de permettre la visualisation des clusters, et
par conséquent, valider les clusters obtenus par les experts de mode. En effet, les styles de mode
sont des variables très subjectives, par conséquent, le choix de K doit être guidé par l’identification
des principaux centres de classe sur la matrice de similarité et surtout les connaissances des experts,
notamment pour valider la cohérence des profils obtenus.

III. 3. 4 Modèle de prédiction


A partir de l'ensemble des attributs existants et calculés, l'objectif final est la prédiction des
actions de l'utilisateur (like/dislike) pour un produit. Le nombre et les catégories d’utilisateurs qui
vote positivement pour un produit peut ensuite permettre de dégager les tendances actuellement
plébiscitées par les consommateurs. Il s'agit d'un problème de classification binaire avec des
attributs hétérogènes (catégoriques et numériques). Par conséquent, la technique de Random Forest
(RF) est mise en œuvre pour effectuer la prédiction, compte tenu de sa capacité à traiter
directement les données catégorielles et les valeurs manquantes sans nécessiter de prétraitement
préalable des données (voir chapitre II section II.3) [168]. Cependant, la nature des données
considérées est à la fois déclarative et subjective, et par conséquent, inclut probablement des
valeurs aberrantes. La détection des valeurs aberrantes sur des ensembles de données hétérogènes
et volumineux est complexe et cruciale pour la performance d'apprentissage du modèle de
prédiction. Par conséquent, le modèle de détection des anomalies, Isolation Forest, a été appliqué
aux données afin de détecter les valeurs aberrantes, permettant ainsi un meilleur apprentissage du
RF.

En utilisant les données ainsi obtenues, le développement du modèle de prédiction est


effectué en suivant les étapes suivantes :

a. Répartition des données en ensembles d'apprentissage et de validation :

96
Cette étape est basée sur le concept de validation croisée k-fold, en contrôlant la répartition
des données de manière à garantir, dans la mesure du possible, que chaque sous-ensemble contient
des données correspondant à tous les clients de l'ensemble de données, avec des commentaires sur
différents produits, et surtout que les données d'un produit ne sont pas présentes à la fois dans les
ensembles d'apprentissage et de validation. Ainsi, les produits inclus dans l'ensemble de validation
peuvent être considérés comme les produits d'une future collection que nous voulons évaluer avant
de lancer les achats. De plus, dans l'ensemble d'apprentissage, seules les actions sur les produits
historiques sont considérées pour calculer les attributs supplémentaires des utilisateurs proposés :
l’expérience de l’utilisateur, le taux de « likes » et a fiabilité de l’utilisateur.

b. Apprentissage et prédiction :

Les paramètres du modèle RF sont réglés à l'aide de la technique « grid-search » ; il s’agit


d’une méthode simple pour l’optimisation des hyperparamètres d’un modèle de ML. Elle consiste
à essayer différentes valeurs puis à retenir celle qui minimise l’erreur sur la base de validation. La
précision de la prédiction est calculée en faisant la moyenne des k précisions, comme dans le
concept de validation croisée k classique.

c. Analyse de l'importance des caractéristiques :

Chaque caractéristique contribue à la précision du modèle de prédiction, mais à des niveaux


différents. L'analyse de l'importance de cette contribution est une information cruciale. Elle donne
un aperçu des caractéristiques qui jouent un rôle clé pour qu'un client décide s'il aime ou non un
certain produit. Deux méthodes sont appliquées pour estimer l'importance des caractéristiques :
La diminution moyenne de l'impureté (Mean Decrease in Impurity MDI) - qui calcule
l'amélioration totale de l'erreur au carré résultant de toutes les divisions d'une variable particulière
- et les valeurs SHAP (voir chapitre II section II.7).

III. 3. 5 Résultats de la prédiction des préférences clients

III. 3. 5. 1 Clusters des images


Le processus de clustering des images de produits est mis en œuvre avec un nombre de
clusters variant entre 2 et 15. Le nombre de clusters k le plus approprié est défini en utilisant le
coefficient de silhouette qui suggère de sélectionner huit clusters. Des échantillons de produits
affectés à chacun des huit clusters (I1 - I8) sont présentés dans la Figure III-18. Comme présenté

97
dans la figure, les produits ont été principalement regroupés par leurs catégories (bottes, maillots
de bain, etc..). Cependant, nous avons constaté que pour les maillots de bain par exemple, il existe
deux groupes différents, I3 et I6, en fonction de la pose prise par le mannequin. Ceci peut être
intéressant dans la mesure où la façon dont un produit est présenté influence l'opinion du
consommateur.

Figure III-18 : Echantillons des clusters des images

III. 3. 5. 2 Clusters des styles


Comme mentionné dans la section III.3.3.4, en ayant 15 styles proposés aux utilisateurs et
en traduisant le problème de clustering des préférences de styles en un clustering binaire, ceci
donne la possibilité de 215 = 32 768 combinaisons de styles différentes. L’objectif initial de cette
liste de 15 styles était de proposer une liste la plus exhaustive possible aux utilisateurs. Pa r ailleurs,
ces attributs auto-déclarés sont très subjectifs : deux styles peuvent être perçus comme très
similaires par un utilisateur, alors que ces deux styles peuvent sembler très différents pour un autre
utilisateur. Par conséquent, un pré-clustering est effectué sur les 15 styles afin de réduire la
dimensionnalité des données à partir des connaissances d’experts du domaine. Le principal
avantage de la réduction de la dimensionnalité est la limitation des valeurs aberrantes et du bruit
inclus dans les données subjectives. Cela permet une interprétation plus facile des résultats et des
clusters plus robustes incluant un plus grand nombre d'utilisateurs. A partir de la matrice de

98
distance de similarité de Jaccard entre les 15 styles, et des connaissances des experts de la mode,
le nombre de styles est réduit de 15 à 8 (S'1, ..., S'8) en combinant les styles similaires comme
illustré dans la Figure III-19. Dans cette matrice, il apparait par exemple qu’un grand nombre
d’utilisateurs qui a choisi le style « gothique », a également choisi le style « kawaii » : les deux
styles sont alors regroupés dans un même et unique attribut (S'8). La structure du vecteur binaire
représentant le profil de style d’un utilisateur devient ainsi de dimension 8 (Figure III-20).

Figure III-19 : Matrice de similarité Jaccard des distances entre les 15 styles selon tous les utilisateurs

Figure III-20 : Structure du vecteur binaire représentant le profil de style d'un utilisateur après une réduction de
dimensionnalité

99
Ensuite, l’analyse de la matrice des distances de Jaccard entre tous les profils de style des
clients (représentés par les 8 styles) permet de définir 8 clusters, représentant les profils
(prototypes) de style les plus pertinents. (Figure III-21). Chaque utilisateur est ensuite affecté au
centre de classe le plus proche, formant ainsi le cluster qui reflète au mieux ses préférences en
termes de styles. Le label des clusters est ensuite utilisé comme attribut dans le modèle de
prédiction pour représenter les préférences de style de l’utilisateur. La Figure III-21 illustre les 8
centres de clusters obtenus, et la Table III-3 présente le nombre d’utilisateurs présents dans chacun
des 8 clusters obtenus ainsi que le profil de style (codé en binaire, avec X=0 ou 1) représentant
chaque centre de classe (Figure III-20).

Figure III-21 : Matrice de similarité Jaccard des préférences de style des utilisateurs et les centres des 8 clusters

100
Table III-3 : Description des 8 clusters des utilisateurs par rapport aux 8 styles

Cluster des clients Nombre d’utilisateurs Centre du cluster


C1 722 11X0 0000
C2 598 11X1 0000
C3 346 10X0 0000
C4 629 1111 X111
C5 590 111X 10X0
C6 158 1X00 1000
C7 188 011X 0000
C8 116 0101 0000

III. 3. 5. 3 Base de données structurée


L'ensemble de données structuré utilisé pour l'entraînement du modèle RF, contenant
247252 enregistrements correspondant à 3731 utilisateurs donnant leur avis sur 425 produits
différents, est composé des attributs du produit, attributs de l’utilisateur, ainsi que le vote de
l’utilisateur (like/dislike). La Table III-4 présente les types des différents attributs, le nombre
correspondant des valeurs distinctes, ainsi que des exemples de chaque attribut.

Table III-4 : Types des attributs et nombre correspondant de valeurs distinctes

Nombre de valeurs
Attribut Type de donnée Exemples
distinctes
Marque 21 Catégorique Confidentiel
Pull, robe, short,
Catégorie 16 Catégorique

Cardigan, robe
Sous-catégorie 36 Catégorique droite, robe
caftan, …
Rayé, fleuri,
Motif 27 Catégorique
animal, …
Oversize, long,
Forme 31 Catégorique manches ballons,

Velours, côtelé,
Texture 26 Catégorique
dentelle, …
Noir, blanc, bleu,
Couleur 56 Catégorique

101
Soie, polyester,
Matière 148 Catégorique
coton, …
Prix [15, …, 1550] Numérique 50 euros
Bio, recyclé,
Eco-label 5 Catégorique
etc…
Cluster d’image 8 Catégorique I1, …, I7
Expérience de
[1, …, 146] Numérique 5, 100, 62…
l’utilisateur
Taux de « likes » de
[0, …, 1] Numérique 0.601, 0.415…
l'utilisateur
Fiabilité de
[0.319, …, 0.735] Numérique 0.452, 0.721…
l’utilisateur
Cluster du style de
8 Catégorique C1, …, C8
l’utilisateur

III. 3. 5. 4 Prédiction des préférences clients


Comme détaillé dans la section III.3.4, un algorithme de RF est appliqué afin de prédire le
vote « like/dislike » des utilisateurs pour chaque nouveau. Les processus d'apprentissage et de
validation sont réalisés selon une approche de validation croisée 5-fold. Les sous-ensembles de
données ne sont pas choisis au hasard, mais sélectionnés de manière à ce que chaque sous-
ensemble contienne des actions correspondant à tous les utilisateurs de l'ensemble de données,
avec des commentaires sur différents produits, et que, surtout, chaque produit n'appartienne pas à
la fois aux ensembles d'apprentissage et de validation (comme décrit en section III.3.4). La
répétition du processus de manière aléatoire 5 fois permet une évaluation plus robuste de la
précision de la prédiction.

Les paramètres du modèle RF (nombre d'arbres, profondeur maximale, etc.) sont réglés à
l'aide de la technique « grid-search » afin d'obtenir les paramètres optimaux donnant les meilleurs
résultats de prédiction sur les données considérées. La précision moyenne du modèle proposé est
de 70,15%, ce qui démontre que le modèle proposé fournit aux marques une idée précieuse des
préférences des utilisateurs et de leur opinion sur les collections futures. Cela les aide à mieux
orienter leurs campagnes de marketing et à localiser leurs clients potentiels. La Table III-5
présente les précisions des modèles obtenus par famille de produits. La matrice de confusion
montrant les prédictions pour toute les familles de produits est présentée dans la Figure III-22.

102
On remarque qu’il existe un bon équilibre entre les deux classes dans l’ensemble de données. Ceci
confirme la bonne performance du modèle proposé, ayant une précision de 70,15%.

Table III-5 : Précision de la classification par famille de produits

Mobilier Toutes les


Catégorie Pull Robes Pantalons Polo Manteaux
de maison catégories

Précision 60.67% 69.36% 73.36% 70.43% 68.23% 76.36% 70.15%

Figure III-22 : Matrice de confusion

III. 3. 5. 5 Interprétation des résultats


Un moyen efficace d'examiner le comportement global du modèle consiste à analyser
l'importance des caractéristiques fournies par le classificateur RF avec la MDI. La Figure III-23
présente la MDI correspondant à l'importance de chaque attribut dans le processus de prédiction.
Il apparaît que la fiabilité de l'utilisateur et le taux de « likes » de l'utilisateur sont évidemment les
facteurs les plus pertinents. Cela montre que la régularité de l'utilisateur à donner son avis sur les
produits est cruciale pour la performance du modèle de prédiction. Les autres attributs créés -
cluster style de l'utilisateur, expérience de l'utilisateur et cluster image du produit - ainsi que les
caractéristiques du produit semblent avoir une importance assez proche. On peut mentionner que
le cluster d'image d'un produit est un attribut important (parmi les attributs de produit les plus
importants) qui souligne l'idée que la façon dont un produit est présenté - la pose prise par le
mannequin - influence l'opinion de l'utilisateur sur le fait qu'il l'aime ou non.

103
Figure III-23 : L'importance des caractéristiques en utilisant MDI

En complément, afin d'expliquer les prédictions du modèle RF, nous avons procédé à
l'estimation des valeurs SHAP correspondant aux différentes caractéristiques. La valeur SHAP de
chaque attribut représente l'impact de cet attribut sur la valeur de sortie du modèle.

En fait, les valeurs SHAP semblent particulièrement importantes pour leur capacité à
effectuer une analyse locale de la prédiction d'une seule instance. Par exemple, la Figure III-24
présente un exemple de diagramme de décision obtenu pour un ensemble spécifique (une instance)
de valeurs d’attributs. La ligne grise verticale présente la valeur de base calculée (la moyenne des
prédictions dans l'ensemble de données d'entraînement). Dans notre cas, la valeur de base est de
0,508. En partant du bas, le graphique bleu illustre comment les valeurs SHAP s'additionnent pour
atteindre la prédiction finale du modèle en haut (0,43 dans notre cas). Ce diagramme de décision
montre que, pour cet exemple, l'expérience de l'utilisateur, la marque du produit, la sous-catégorie,
le groupe d'images, la catégorie et le style de groupe ont joué un rôle important dans l'évolution de
la prédiction vers une valeur supérieure à la valeur moyenne. Cependant, le taux de likes de
l'utilisateur, qui est l'attribut le plus important, a considérablement fait passer la prédiction de 0,62
à 0,43. Il est important de mentionner que lors de l'application des valeurs SHAP pour effectuer
une analyse locale, l'ordre d'importance des caractéristiques peut différer selon chaque ensemble
d’attributs. Une telle analyse locale SHAP peut être utilisée comme un système d'aide à la décision
utile pour déterminer l'impact des attributs d’un produit sur les préférences des consommateurs, et
ainsi envisage l’extraction des tendances. En effet, en analysant les valeurs des attributs qui
permettent de converger la prédiction vers 1 (un vote « like »), on peut dégager les attributs de
mode préférés par les clients.
104
Figure III-24 : Exemple de diagramme de décision pour un ensemble donné de caractéristiques

III. 4 Conclusion

Dans ce chapitre, nous avons proposé deux systèmes pour aider les enseignes de mode à
mieux prédire les attentes de leurs clients. Le premier système propose un outil de détection des
tendances de mode à partir des blogs publiés en ligne par les magazines digitaux de mode et les
influenceurs de mode. Ce système consiste à extraire les informations de ces blogs en utilisant des
méthodes de traitement du texte. Les tendances détectées, en termes d’occurrences et
cooccurrences des mots et des combinaisons des mots liés à la mode, reflètent les attributs de mode
les plus discutés par les experts de mode durant une période précise. Le système proposé permet
la visualisation des tendances détectées en utilisant un réseau de graphes. Les résultats obtenus
montrent la capacité du système proposé à détecter les tendances de mode et à fournir les
évolutions de ces tendances avec le temps. Ce système peut être utilisé soit directement par les
départements de styles des enseignes de mode pour le développement des futurs produits, soit
comme données d’entrée d’un modèle de prévision de la demande, comme proposé dans le chapitre
IV.

Dans le second système proposé, une prédiction du succès des nouveaux produits auprès
des consommateurs est réalisée. Dans ce système, les données sont collectées à partir d'une
application mobile qui demande aux clients leur avis sur les nouveaux produits. Les résultats

105
montrent que grâce aux techniques d'apprentissage automatique et à l'utilisation des réseaux
sociaux et des applications mobiles, les entreprises sont en mesure de mieux comprendre les
préférences stylistiques de leurs clients. Elles peuvent ainsi satisfaire les consommateurs en
optimisant l’assortiment des collections et les quantités à acheter et ainsi en réduisant les invendus.

Le chapitre suivant détaille deux méthodologies de prévision de ventes proposées durant


cette thèse. Le premier système consiste en un système de prévision par article dans le contexte
particulier de Covid-19. Le second système est un système de prévision de ventes par famille. Ce
système a pour objectif de corriger les ventes historiques de l’influence des variables exogènes.
Ce système permet d’intégrer les informations de tendances de mode, détectées dans la première
section de ce chapitre, aux prévisions de ventes. Finalement, trois modèles de prévision de ventes
en intégrant les tendances du marché sont comparés.

106
Chapitre IV Prévision des ventes et de la demande de mode
IV. 1 Introduction

De nombreux systèmes de prévision de ventes des produits de mode, par article et par
famille de produit, sont présentés dans la littérature. Ces dernières années, ces systèmes ont
largement bénéficié des récentes évolutions en termes d’IA et de l’apprentissage profond.
Cependant, l’application des systèmes de prévision de ventes dans l’industrie de la mode reste
toujours une tâche complexe et difficile à implémenter pour plusieurs raisons (Chapitre I),
notamment l’environnement très changeant et le nombre limité de données pour l’apprentissage
des systèmes. Il est donc nécessaire de développer des systèmes de prévision capable d’intégrer
les évolutions de l’environnement du consommateur en s’appuyant sur les techniques adaptées aux
données disponibles.

Dans ce chapitre, nous proposons deux systèmes qui peuvent aider les entreprises à prévoir
les ventes et la demande des articles de mode dans deux situations bien distinctes :

(i) Le premier système, détaillé dans la section IV.2, est conçu pour réaliser des
prévisions par article lorsque les ventes sont fortement impactées par un évènement
soudain, tel que la pandémie de la Covid-19,
(ii) Le second système, présenté dans la section IV.3, est adapté pour effectuer des
prévisions dans un contexte où les ventes sont continuellement influencées par des
facteurs exogènes, tels que les actions commerciales ou les tendances de mode qui
émergent des réseaux sociaux ou de l’Internet.

La section IV.4 propose plusieurs modèles de prévision de ventes qui permettent d’intégrer
les tendances du marché, détectées dans le chapitre III section III.2, aux données historiques
internes de l'entreprise dans le but d’améliorer les prévisions de la demande des consommateurs.

107
IV. 2 Prédiction des ventes par article dans le contexte exceptionnel de la
Covid-19
Motivée par un besoin réel de l’entreprise partenaire, cette étude propose une nouvelle
méthodologie de prévision des ventes dans un contexte inhabituel et exceptionnel, celui de la
pandémie de COVID-19. Malgré le fait qu'il existe de nombreux systèmes de prévision des ventes
proposés dans la littérature, à notre connaissance, ces systèmes reposent sur des techniques
d'apprentissage basées sur des données historiques et ne sont donc pas adaptés à un environnement
aussi fluctuant. Par conséquent, la principale contribution du système proposé dans cette partie
réside dans une approche originale de mise en œuvre de techniques d'apprentissage automatique
dans un contexte sans précédent tel que la pandémie de Covid-19. Plus généralement, l'objectif est
de développer une nouvelle méthodologie de prévision des ventes pour les enseignes de la mode
pour prédire les ventes de produits dans un environnement où les comportements d'achat des
consommateurs sont radicalement et soudainement modifiés par des facteurs externes
exceptionnels, ayant un impact profond sur le marché. Afin de traiter ce problème imprévu et
complexe du monde réel, notre méthodologie repose sur la mise en œuvre de techniques avancées
d'apprentissage automatique à partir d'une analyse complète de l'impact de la crise sur les différents
types de produits. La description du problème est présentée dans la section IV.2.1. Les sections
IV.2.2 et IV.2.3 montrent en détail la méthodologie générale du système proposé ainsi que les
étapes d’implémentation et de préparation des données, respectivement. Les résultats sont
présentés dans la section IV.2.4.

IV. 2. 1 Description du problème


Dans cette étude, nous abordons un problème réel de prévision des ventes d'une enseigne
française de mode, dans un contexte de phénomène soudain et imprévu qui rend les systèmes de
prévision traditionnels inutilisables. En effet, l'industrie de la mode a été l'une des industries les
plus négativement impactées par la pandémie de Covid-19 au niveau économique. Le
comportement d'achat des consommateurs a été modifié en raison de plusieurs facteurs ; les
mesures strictes prises par le gouvernement pour prévenir la propagation du virus, telles que le
confinement strict, la fermeture des magasins et l'annulation des événements, ont eu un impact
considérable sur les marques de mode, qui ont été privées de leurs ventes en magasin pour la toute
première fois. Ainsi, à la fin de la période de confinement, les enseignes de mode se sont retrouvées

108
dans une situation difficile où elles ont dû agir rapidement pour faire face aux défis totalement
nouveaux posés par la pandémie.

En raison de l'absence de données historiques et de fortes variations du comportement des


consommateurs, les systèmes de prévision des ventes existants ne sont plus applicables. Par
conséquent, les enseignes avaient un besoin urgent de nouvelles méthodologies de prévision lors
de la réouverture des magasins afin de décider quels produits de la collection pré-COVID
pouvaient rester en ventes et quels produits de la nouvelle collection fallait-il approvisionner.

Bien que les ventes en ligne aient été encore possibles pendant la période de confinement,
les achats en ligne des consommateurs ont été profondément impactés par cette crise. La Figure
IV-1 montre la différence entre les semaines de ventes du premier semestre de 2019 (situation
normale) et de 2020 (avec Covid-19) pour les ventes en ligne. L’étude est menée en semaine 18
de l’année 2020 et seules les ventes jusqu'à la 17e semaine étaient disponibles. En effet, le début
de l'impact de la pandémie sur les ventes en France a commencé en semaine 6, et le confinement
s'est terminé au début de la 20e semaine, annoncé deux semaines plus tôt. Ainsi, à la semaine 18,
il était crucial pour les enseignes de corriger leurs prévisions de ventes à partir de la fin du
confinement (semaine 20) pour assurer leur survie économique. En analysant les schémas de vente
présentés, on peut remarquer que la période entre les semaines 1 et 17 est essentiellement divisée
en 3 parties, chacune avec un comportement d'achat différent, comme suit :

 Semaines 1 à 6 : comportement d'achat normal (avant le début de la crise),


 Semaines 6 à 13 : l'impact total des changements (chute significative de la quantité des
ventes avec le début du confinement),
 Semaines 13 à 17 : résilience du comportement des consommateurs (augmentation
régulière des quantités vendues).

109
Figure IV-1 : Comparaison des ventes en ligne entre les années 2019 et 2020 pour l’enseigne de mode considérée

La baisse importante de la quantité des ventes mentionnée ci-dessus (semaines 6 à 13) peut
s'expliquer par un comportement rationnel face à une situation inattendue et inconnue. Lorsque le
confinement a été annoncé, les consommateurs ont été pris de panique et se sont soudainement
concentrés sur l'achat de biens essentiels (ex. farine, huile, ...) [180]. Ce comportement a également
été observé lors d'épidémies précédentes, telles que l'épidémie de SARS, la catastrophe de
Fukushima, l'épidémie de MERS, etc. comme mentionné dans [181] et qui peut être considéré
comme une forme de résilience. Avec l'annonce du confinement, les ventes de produits de mode
se sont soudainement arrêtées, et à mesure que la panique des consommateurs s'apaise, le marché
commence à se rétablir, ce qui explique l'évolution en deux étapes des ventes entre les semaines 6
et 17 illustrées dans la Figure IV-1 : semaines 6 à 13, et 13 à 17.

Dans cet environnement perturbé, le principal problème pour les enseignes de mode était
de savoir dès la semaine 18 quels produits et quelles quantités pouvaient encore être vendus après
le confinement à partir de la semaine 20. Ainsi, afin de prévoir les ventes après le confinement,
nous avons développé un modèle de prévision spécifique qui s'appuie sur les données de ventes en
ligne et plus particulièrement sur les ventes pendant la période de reprise (semaines >13) pour
modéliser les variations du comportement des consommateurs.

110
IV. 2. 2 Méthodologie générale
Dans cette section, le système de prévision des ventes proposé sera présenté en détail. En
combinant plusieurs algorithmes : K-moyennes pour le clustering, RF pour la classification, et
Régression Polynomiale pour la correction des prévisions, l’objectif du modèle de prévision
proposé est de prédire un profil de vente pour chaque article en tenant compte de l'effet de la crise
du Covid-19 sur les ventes. Ce système est principalement composé de deux parties, comme le
montre la Figure IV-2.

Figure IV-2 : Aperçu de la méthodologie proposée

Dans la première partie (Partie I), une méthodologie de prévision inspirée des travaux de
Thomassey et Fiordaliso [182] a été appliquée afin de générer des prévisions de ventes pour chaque
nouvel article en fonction de ses caractéristiques à l'aide de techniques de clustering et de
classification. La Figure IV-3 montre en détail le processus d’apprentissage de ces techniques en
utilisant les données historiques ainsi que de son application pour prédire le prototype de ventes
des nouveaux articles. Il a déjà été démontré que cette méthodologie est capable de prévoir les
ventes dans un contexte régulier (sans perturbations majeures et soudaines) [182][58]. En effet, en
utilisant les ventes historiques d'articles similaires, ainsi que les caractéristiques du nouveau
produit, cette méthode est capable de détecter différents prototypes de vente dans les données
historiques et d'attribuer un prototype de vente correspondant aux nouveaux produits. La deuxième
partie (Partie II) de la méthodologie proposée vise à corriger les prévisions obtenues dans la Partie
I pour les semaines après la semaine k (k=17, comme décrit dans la section IV.2.1) afin qu'elles

111
s’adaptent aux fortes perturbations de la demande causées par la pandémie de Covid-19. Ceci est
fait en utilisant les prévisions de ventes obtenues dans la première partie ainsi que les ventes en
ligne réelles jusqu'à la semaine k afin de modéliser l'impact de la crise. Le modèle de correction
utilisé dans cette partie est spécifique au prototype de vente obtenu dans la Partie I pour le produit
considéré. La méthodologie proposée utilise les données de tous les articles appartenant à la même
famille de produits. Les parties suivantes présentent les détails de la méthodologie proposée.

Figure IV-3 : Représentation schématique du système de prévision des ventes proposé

112
IV. 2. 2. 1 Profils de ventes historiques
La première étape du système de prévision est la préparation des données qui consiste à
obtenir le profil des ventes pour chacun des articles historiques. Le profil des ventes d'un certain
produit représente le rythme de vente de ce produit pendant une certaine période de temps ; il
donne un aperçu de la demande des consommateurs pour ce produit pendant cette période. Dans
cette étude, on considère un horizon de prévision fixe de 23 semaines correspondant à la collection
printemps-été pour les produits de mode (janvier - juillet) de l’enseigne partenaire. Ainsi, pour
chaque article, le calcul du profil des ventes nécessite les deux étapes de prétraitement suivantes :

i. Normalisation du volume des ventes : Cette étape est nécessaire pour permettre une
comparaison cohérente des profils de vente. Soit 𝑉 𝑖 = [𝑣1𝑖 , … , 𝑣𝐿𝑖 ] le vecteur de longueur L
représentant les ventes par semaine du produit i entre janvier et juillet. Les ventes
normalisées 𝑉𝑛𝑖 sont 𝑉 𝑖 divisé par la somme totale des ventes :
𝑉𝑖 (13)
𝑉𝑛𝑖 = 𝐿
Σ𝑙=1 𝑣𝑙𝑖

𝑖
ii. Calcul des ventes cumulées normalisées 𝑉𝑐𝑛 du produit i : La représentation sous la forme
de ventes cumulées permet au processus de clustering d'être plus robuste et plus simple que
l'utilisation directe des profils de vente normalisés. Ainsi, une simple technique de
clustering, telle que K-moyennes, permet d’identifier facilement les prototypes de vente
optimaux.

IV. 2. 2. 2 Prédiction des profils de ventes


Une fois tous les profils de ventes cumulées des articles historiques obtenus, la méthode de
clustering des k-moyennes est appliquée aux profils de chaque famille de produits afin d’identifier
les principaux types de profils. Ensuite, la deuxième étape consiste à entraîner un modèle de
classification afin de prédire, pour chaque nouvel article, à quelle classe il appartient, en utilisant
comme entrées les caractéristiques de l’article, telles que sa gamme de prix, sa matière, etc. Pour
cela, un classificateur RF est choisi pour sa simplicité de mise en œuvre et son efficacité prouvée
dans des applications similaires [58]. Cependant, l'efficacité du classificateur RF, ainsi que du
système de prévision global, dépend fortement du nombre de clusters k initialement choisi lors de

113
l'application du k-moyennes. Ainsi, le nombre de clusters est optimisé par une approche spécifique,
détaillée ci-dessous.

a. Optimisation du nombre de clusters

Bien qu'il existe plusieurs méthodes pour identifier le nombre optimal de clusters pour
la méthode k-moyennes (chapitre II section II.4), nous avons développé une approche qui vise
à identifier le nombre optimal de clusters en se basant sur l'erreur de prévision obtenue après
l'étape de classification. Cette procédure permet d’intégrer les relations entre les étapes de
clustering et de classification pour construire un système de prévision des ventes précis. Nous
avons procédé comme suit :

 Sélection d'un nombre de clusters 𝑘 ∗ qui varie entre 3 et 7 (Selon l’enseigne de mode
partenaire, il n’est pas judicieux de définir un nombre de profils de ventes trop
important pour une même famille d’articles),
 Application du clustering k-moyennes sur les N profils de vente historiques avec 𝑘 =
𝑘 ∗ afin d'identifier k* prototypes de vente différents (Figure IV-4),
 Mise en œuvre d'un classificateur Random Forest qui associe chaque article à son
prototype de vente correspondant parmi les 𝑘 ∗ prototypes de vente déjà obtenus, en
fonction de ses différentes caractéristiques. L’apprentissage du RF est réalisé par
validation croisée à 10 blocs (Figure IV-5),
 Calcul de l'erreur moyenne de prévision comme la moyenne des erreurs quadratiques
moyennes RMSE obtenues pour chaque bloc de validation entre les ventes cumulées
𝑖
réelles 𝑉𝑐𝑛 et le prototype prédit correspondant 𝑃̂𝑖 en utilisant la formule suivante :

∑𝑁 𝑖 ̂𝑖 2
𝑖=1(𝑉𝑐𝑛 − 𝑃 )
𝑅𝑀𝑆𝐸 = √ (14)
𝑁

Où N est le nombre total des produits historiques,


 Choix du nombre optimal de clusters Koptimal correspondant à l'erreur de prévision
moyenne la plus faible sur les 10 blocs.

114
Figure IV-4 : Clustering des profils de vente

Figure IV-5 : Classification Random Forest

b. Classification des produits

A partir du nombre optimal de clusters Koptimal défini précédemment, la méthode k-


moyennes détermine les Koptimal prototypes de vente qui résument le mieux les comportements de
vente des produits historiques. Ensuite, en utilisant les données historiques des produits (ventes et
caractéristiques), un classificateur RF est construit pour modéliser les relations entre les
caractéristiques d'un produit et son prototype de vente correspondant. Ainsi, le classificateur RF
appris peut prédire le prototype de vente correspondant 𝑃̂𝑖 pour chaque nouveau produit i en
utilisant les caractéristiques du produit comme entrées. De plus, afin d'éviter le problème de sur-

115
apprentissage, une validation croisée 10-fold a été utilisée pendant l'apprentissage du
classificateur.

IV. 2. 2. 3 Correction des ventes prédites


À ce niveau, le système permet de prédire un prototype de vente 𝑃̂ 𝑖 pour chaque nouvel
article i de la collection de 2020. Cependant, le comportement du consommateur en 2020 a été
fortement impacté par le confinement dû à la pandémie Covid-19, ce qui a ajouté un facteur
inconnu par le système de prévision entraîné sur les données historiques de 2019. Ainsi, la
prévision des ventes pendant cette période perturbée nécessite une modélisation précise de l'impact
du confinement sur les ventes, qui peut être réalisée en prenant en compte le changement du
comportement d’achat des consommateurs pendant cette période.

En nous appuyant sur l'analyse effectuée dans la section IV.2.1, nous avons identifié deux
périodes correspondantes à des comportements d'achat différents pour les ventes en ligne après le
début du confinement :

 La première période, de la semaine 6 à 13, correspond à un état de choc, et n’est pas


exploitable pour modéliser la reprise des ventes après le confinement,
 La seconde période, entre les semaines 13 et 17, est une période de reprise d'achat que
nous considérons comme représentative de la reprise des ventes après le confinement.

Ainsi, la modélisation de l’impact du confinement s’appuie les ventes en ligne réelles et les
prévisions pendant la période des semaines 13 à 17. Le modèle utilisé, appelé « correcteur de
ventes », est basé sur une régression polynomiale entrainée pour chaque Koptimal clusters de profils
de ventes séparément, afin de corriger les ventes pour les semaines après la semaine 17. Ainsi, la
prévision finale obtenue avec notre méthodologie intègre à la fois :

 La prévision initiale des ventes cumulées 𝑉̂ 𝑖 , obtenue par extrapolation à partir du


prototype prédit 𝑃̂𝑖 et les ventes réelles jusqu'à la semaine 6, qui englobent le
comportement régulier d’achat lié uniquement aux caractéristiques du produit et sans
impact de la pandémie,
 Les impacts spécifiques du confinement sur les ventes pour les produits d'un même
cluster après la semaine 13.

116
Ainsi, pour chacun des Koptimal clusters de profils de ventes, le modèle correctif est défini
pour un produit i appartenant à un cluster (i ∈ [1, …, m] avec m = nombre de produits dans le
cluster considéré) comme suit : :

Soit,

 ̂ 𝒊𝒔 = [𝑣̂1𝑖 , … , 𝑣̂𝐿𝑖 ] : le profil de ventes prévu initialement (sans intégrer l’impact de la


𝑽
COVID19), où L est la dernière semaine de l'horizon de prévision (L > 17),
 𝑹𝒊𝒔 = [𝑟1𝑖 , … , 𝑟17
𝑖
] : les ventes réelles en ligne disponibles jusqu’à la semaine 17,
𝒊
 𝑽̂
𝒄 𝒔 = [𝑣̂
𝑖
𝑐 18 , … , 𝑣̂
𝑖
𝑐 𝐿 ] : le profil de ventes corrigé prévu à partir de la semaine 18.

Pour modéliser l'impact de la crise sur les ventes et par conséquent corriger les prévisions initiales
𝑉̂𝑠𝑖 , la régression polynomiale calcule un coefficient de correction par semaine 𝑪𝒊𝒔 . Un processus
en deux étapes est mis en œuvre pour l'apprentissage du modèle de régression comme suit :

 Le type de modèle de régression (coefficient multiplicatif ou additif) et l'ordre de régression


k sont déterminés par un processus de validation croisée sur l'ensemble de données
composé de tous les produits du cluster du produit i pour les semaines comprises entre 13
et 17,
 Puis, un ajustement (fine-tuning) des coefficients du modèle de régression est effectué pour
le produit i.

Ainsi la correction donnée par le modèle de régression polynomiale d'ordre k est :

𝑪𝒊𝒔 = 𝑪𝑖 (𝒔) = 𝛽𝟎𝒊 + 𝛽𝟏𝒊 𝒔 + 𝛽𝟐𝒊 𝒔2 + ⋯ + 𝛽𝒌𝒊 𝒔𝑘 + 𝜀 (15)

Où 𝑪𝒊𝒔 est le coefficient de correction correspondant à la semaine 𝒔.

Ainsi deux modèles de régression sont entraînés sur les semaines s comprises entre s=13
𝒊 𝒊
et s=17 sur les coefficients 𝑪𝒊𝒔 = ( 𝑹𝒊𝒔 ⁄ 𝑽
̂𝒔 ) pour le modèle multiplicatif ou 𝑪𝒊𝒔 = ( 𝑹𝒊𝒔 − 𝑽
̂𝒔 ) pour
le modèle additif, afin de prédire les coefficients de correction par semaine correspondants à partir
de la semaine 18 (i allant de 1 jusqu’à m]).

Les prévisions corrigées à partir de la semaine 18 du produit i sont calculées comme suit :

117
𝒊 𝑽 ̂𝒔 𝒊
̂ 𝒊𝒔 ∗ 𝑪 𝑠𝑖 𝑐𝑜𝑒𝑓𝑓𝑖𝑐𝑖𝑒𝑛𝑡 𝑚𝑢𝑙𝑡𝑖𝑝𝑙𝑖𝑐𝑎𝑡𝑖𝑓
𝑽̂
𝒄𝒔 = { (16)
𝑽 ̂𝒔 𝒊
̂ 𝒊𝒔 + 𝑪 𝑠𝑖 𝑐𝑜𝑒𝑓𝑓𝑖𝑐𝑖𝑒𝑛𝑡 𝑎𝑑𝑑𝑖𝑡𝑖𝑓

̂𝒔 𝒊
Avec 𝑪
𝒊 𝒊
̂ 𝟏𝟖 , … , 𝑪
= [𝑪 ̂ 𝑳 ] : le vecteur des coefficients de correction prédits par le modèle de
régression à partir de la semaine 18.

IV. 2. 3 Application sur des données réelles


IV. 2. 3. 1 Description des données
Les données de ventes considérées dans cette étude ont été collectées à partir des données
des points de vente fournies par le système d’information d'une enseigne de mode française,
partenaire de ces travaux. Notre méthodologie de prévision des ventes est appliquée sur quatre
ensembles de données différents correspondant à quatre types de produits différents : Pantalons,
Chemisiers, T-shirts et Robes. La Table IV-1 présente le nombre d'articles pour chaque famille de
produits dans les collections 2019 et 2020, utilisées pour l'entraînement et le test de notre
méthodologie proposée. Comme détaillé dans la section IV.2.2, le système de prévision proposé
est composé de deux parties :

 Partie I – Clustering et classification pour les prévisions de profils de vente : ce modèle a


été entraîné à l'aide des données historiques des produits vendus en 2019 (collection
printemps-été 2019), qui ont été divisées en ensembles d'entraînement et de validation
pendant le processus d'apprentissage. Une fois la phase d'apprentissage terminée, le
système de prédiction des ventes est appliqué pour prédire les ventes des articles de 2020
– collection printemps-été 2020.
 Partie II – Régression pour la correction des profils de vente : ce modèle a été entraîné en
utilisant les prédictions de vente obtenues pour 2020, ainsi que les ventes réelles de 2020
pour les semaines entre 13 et 17, par famille de produits et par prototype de vente (un
modèle de régression différent a été entraîné pour chacun des prototypes de vente obtenus).
Le modèle a ensuite été testé en corrigeant les ventes 2020 de la semaine 17 à la semaine
21.

Toutes les données utilisées représentent uniquement des données de ventes en ligne,
puisqu'aucune vente n'a été effectuée en magasin pendant la période de confinement.

118
Le choix des caractéristiques descriptives des produits pour la phase de classification est
une tâche critique, surtout lorsqu'on travaille sur des données réelles : certaines caractéristiques
importantes peuvent ne pas être fiables ou simplement ne pas se trouver dans l'ensemble de
données de l’enseigne. Pour cette étude, nous nous sommes d'abord appuyés sur des avis d'experts
afin de choisir les attributs des produits qui sont les plus significatifs pour caractériser les ventes.
Une deuxième sélection est ensuite appliquée à partir d'une analyse quantitative de l'importance
des caractéristiques dans la phase de classification. En effet, pendant l'apprentissage d'un RF,
l'importance des caractéristiques dans la construction du modèle peut être quantifiée en utilisant
l'algorithme « Gini Importance » ou « Mean Decrease in Impurity (MDI) ». À partir de la MDI de
toutes les caractéristiques disponibles, seules les caractéristiques qui ont la contribution la plus
importante dans la construction du modèle (ayant la MDI la plus élevée) ont été sélectionnées pour
la tâche de classification

Table IV-1 : Nombre d'articles pour chaque famille de produits dans les collections 2019 et 2020

Pantalons Chemisiers T-shirts Robes


Collection 2019 258 674 1822 448
Collection 2020 210 503 1319 244

IV. 2. 3. 2 Prétraitement des données


Le prétraitement des données est nécessaire pour assurer une mise en œuvre correcte de la
méthodologie proposée : seuls les articles actifs pendant la période considérée ont été pris en
compte. De plus, les volumes de ventes sont normalisés afin de pouvoir comparer leurs profils par
la suite, comme décrit dans la section IV.2.2.1. Cependant, lorsque nous étudions et comparons
les profils de vente sur une période donnée (par exemple la collection printemps-été), il apparait
clairement que la représentation des ventes cumulées est bien plus adéquate pour comprendre et
identifier le comportement de vente, comme l'illustre la Figure IV-6. Par conséquent, la dernière
étape du prétraitement des données consiste à calculer les ventes cumulées normalisées pour
chaque article.

119
Figure IV-6 : Quelques exemples de profils de ventes dans le cas de ventes normalisées (à gauche) et de ventes
normalisées cumulées (à droite)

IV. 2. 3. 3 Comparaison avec l'état de l'art


Pour le système de prévision proposé, une comparaison directe des résultats avec les
méthodologies existantes est difficile car, à notre connaissance, aucune étude préalable n'a été
réalisée dans ce contexte. Nous avons donc procédé en comparant les prévisions, avec et sans
correction, avec des profils de vente réels d'articles appartenant à la même famille et au même
groupe de prototypes de vente. De plus, afin de mettre en évidence l'efficacité des techniques
utilisées dans le système proposé, différentes techniques sont appliquées pour comparaison lors
des différentes étapes : clustering et classification.

Une comparaison de différentes techniques de clustering est nécessaire afin de démontrer


que la technique des K-moyennes appliquée aux profils de vente cumulés pouvait identifier
efficacement, les prototypes de vente existants dans les données. Nous avons donc utilisé le modèle
des cartes auto-organisatrices (Self Organizing Maps, SOM) suivi de la méthode K-moyennes,
comme une méthodologie de clustering plus complexe et plus avancée. SOM est un algorithme
d'apprentissage non supervisé basé sur un réseau de neurones et appliqué avec succès au clustering
des données dans de nombreux domaines [58]. En outre, trois autres modèles de classification ont
été testés pour évaluer les performances du classificateur Random Forest : Le modèle bayésien
naïf (Naïve Bayesian NB) [183], le modèle de machine à vecteurs de support (Support Vector
Machine SVM) [184] et le modèle de perceptron multicouches (Multilayer Perceptron MLP)
[185]. Les performances des modèles sont quantifiées à la fois par l'erreur de prévision globale
basée sur l’erreur quadratique moyenne RMSE et par la précision de la classification, comme le
montrent les équations (14) et (17) :

120
∑𝑁
𝑛=1 𝑓𝑛 (17)
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 =
𝑁

Avec N est le nombre total de produits, et :

0 𝑖𝑓 𝑃̂𝑖 ≠ 𝑃𝑖 𝑟é𝑒𝑙
𝑓𝑛 = { (18)
1 𝑖𝑓 𝑃̂𝑖 = 𝑃𝑖 𝑟é𝑒𝑙

IV. 2. 4 Résultats et discussion


Dans cette section, les résultats de la méthodologie proposée sont présentés en détail pour
chacune des quatre familles de produits : pantalons, robes, t-shirts et chemisiers.

IV. 2. 4. 1 Prédiction des profils de ventes dans un contexte normal


a) Clustering des profils de ventes
Le nombre optimal de clusters Koptimal des profils de vente est calculé pour chaque famille
de produits avec le processus décrit dans la section IV.2.2.2. La Figure IV-7 présente le RMSE
obtenu à partir des données de validation croisée et montre que le nombre optimal de clusters
Koptimal est de quatre pour toutes les familles de produits. Ainsi, les profils de vente des produits
d’une famille sont résumés en 4 prototypes différents. La Figure IV-8 illustre un exemple des 4
clusters de profils de vente obtenus pour la famille des robes. Les principales caractéristiques qui
séparent ces modèles sont la date de mise en œuvre du produit et son rythme de vente, qui peuvent
être influencés par les besoins et les demandes des consommateurs à un moment donné. Les 4
clusters illustrés dans la Figure IV-8 sont composés de :

 Cluster 1 : produits de début de saison, 80% de leurs ventes sont réalisées entre les semaines
5 et 10,
 Cluster 2 : produits de fin de saison, 80% de leurs ventes sont réalisées dans les 5-8
dernières semaines de la saison,
 Cluster 3 : produits dont les ventes se font tout au long de la saison mais avec un rythme
croissant à partir du milieu de la saison,
 Cluster 4 : produits dont les ventes sont régulières tout au long de la saison.

121
Figure IV-7 : Erreur quadratique moyenne obtenue par validation croisée en fonction du nombre de clusters.

Figure IV-8 : Clusters obtenus à partir des profils de vente de la famille des robes

La méthode des K-moyennes appliquée a été comparé à une technique de clustering plus
avancée basée sur l'algorithme « SOM suivi de K-moyennes » (section IV.2.3.3). Les résultats sont
présentés dans la Figure IV-9 et montrent que les erreurs obtenues sont similaires. En outre, nous
avons testé notre méthodologie de classification (K-moyennes + RF) sur des profils de vente
normalisés (non cumulés). La Figure IV-10 montre que l’utilisation des ventes cumulées
permettent de réduire les erreurs de prévision pour les différents ensembles de données utilisés. En

122
fait, comme le montre la Figure IV-6, l'utilisation des ventes cumulées évite d'avoir à identifier
des clusters qui se chevauchent. Par conséquent, l'utilisation des profils de vente cumulés (i) rend
le clustering plus facile et plus direct, de sorte que le type d’algorithme de clustering utilisé n’a
pas d’impact significatif sur les résultats, (ii) améliore les résultats de la prévision de la
méthodologie globale.

En conclusion, nous avons pu réaliser une estimation efficace et robuste des différents
prototypes de vente en utilisant le clustering K-moyennes basé sur les profils de vente cumulés.

Figure IV-9 : Erreurs quadratiques moyennes lors de l'utilisation des méthodes de clustering K-moyennes et SOM-
K-moyennes.

Figure IV-10 : Erreurs quadratiques moyennes lors de l'application de la méthodologie proposée aux ventes
normalisées et cumulées normalisées.

123
b) Classification des profils de vente
L'affectation du cluster de profil de vente correspondant, ou prototype de vente, à chaque
nouvel article, est effectuée à partir des critères descriptifs du produit. Le classificateur RF est
appris à partir des produits historiques (ensembles de données de 2019) en utilisant les critères
descriptifs, comme entrées, et le label des clusters de profils de vente, comme sortie. Le processus
d'apprentissage est basé sur une validation croisée 10-fold ainsi que sur une méthode de « grid-
search » pour régler les paramètres du modèle. La Table IV-2 présente les paramètres obtenus
après optimisation du modèle pour chaque famille d’articles. Afin d'obtenir un modèle de
classification plus robuste, une sélection des attributs les plus pertinents est effectuée en
s’appuyant sur les importances des caractéristiques lors de la construction du RF (Gini Importance)
comme mentionné dans la section IV.2.3.1. Six caractéristiques descriptives ont finalement été
retenues en entrée du classificateur : la gamme de prix, la typologie du produit (son type : essentiel,
basique, mode, etc.), la matière, la sous-famille, l'année de la collection et la semaine de la première
vente. La Figure IV-11 montre un exemple de l'importance des caractéristiques obtenues pour
l'ensemble de données des pantalons. Il est évident que la semaine des premières ventes est la
caractéristique la plus importante considérée par le RF. Cependant, la matière du produit ainsi que
sa sous-catégorie jouent également un rôle important dans la phase de classification, tandis que la
gamme de prix et la typologie du produit peuvent être considérées comme non pertinentes et
supprimées.

Table IV-2 : Paramètres optimaux du modèle Random Forest pour les quatre ensembles de données.

Profondeur maximale Nombre d’arbres


Pantalons 7 100
Chemisiers 6 150
T-shirts 6 150
Robes 8 100

Comme mentionné dans la section IV.2.3.3, trois autres algorithmes de classification ont
été testés pour évaluer les performances du classificateur Random Forest : Naïve Bayes (NB),
Support Vector Machine (SVM) et Réseau de Neurones à propagation avant (RN). Les précisions
de classification obtenues pour chacun des ensembles de données ainsi que les erreurs de prévision
globales pour les différents classificateurs testés sont présentées respectivement dans la Table IV-
3 et la Table IV-4. Les résultats indiquent que, pour les différents ensembles de données utilisés,

124
le modèle RF surpasse les autres classificateurs en donnant des précisions de classification plus
élevées et des erreurs de prévision plus faibles. De plus, ces résultats reflètent la capacité du
système proposé à réaliser efficacement la tâche de prévision des ventes à long terme. La précision
de classification la plus faible (62,25%) a été obtenue pour l'ensemble de données des T-shirts.
Cela peut être dû au fait que les caractéristiques utilisées pour effectuer la classification de cette
famille de produits n'étaient pas assez riches pour permettre une précision de classification plus
élevée.

Table IV-3 : Précisions de classification des différents classificateurs

Pantalons Chemisiers T-shirts Robes


NB 60.85% 67.21% 57.54% 82.08%
SVM 61.67% 68.43% 55.13% 81.41%
RN 56.20% 60.03% 53.65% 70.75%
RF 70.15% 71.25% 62.25% 83.22%

Table IV-4 : Erreurs quadratiques moyennes en cas d'utilisation de différents classificateurs.

Pantalons Chemisiers T-shirts Robes


NB 18.60 17.44 18.76 13.02
SVM 17.84 17.42 18.99 13.36
RN 19.74 18.89 19.78 15.89
RF 16.31 16.80 17.41 12.58

Figure IV-11 : Importance des caractéristiques pour l'ensemble de données « Pantalon ».

125
Les prototypes de vente prédits avec le classificateur RF représentent la prévision des
profils de vente des articles de l'année 2020 effectuée dans un environnement normal (sans crise
Covid-19). A partir des ventes réelles des nouveaux produits pour les six premières semaines de
2020 (avant le début de la crise Covid-19) (voir section IV.2.1) et des profils de ventes prédits, les
quantités de ventes prédites pour chaque produit sont ensuite calculées pour toute la période
(janvier-juillet). Ces prévisions de ventes devraient être les prévisions finales pour 2020 si la crise
Covid-19 n'avait pas eu lieu.

IV. 2. 4. 2 Correction des profils de ventes


Les profils de vente des nouveaux articles prédits dans la section IV.2.4.1 conviennent
jusqu'à la semaine 6 de l'année 2020. Ensuite, les ventes sont profondément perturbées et le modèle
de prévision devient inutilisable. La méthodologie proposée consiste à prévoir les ventes à partir
de la semaine 18 (réouverture des magasins) en se basant sur :

 La prévision du profil des ventes obtenues en situation normale (section IV.2.4.1 qui
contient encore des informations importantes sur la saisonnalité, les tendances, etc. liées
aux produits,
 Un modèle correctif (modèle de régression) entraîné en utilisant les ventes réelles réalisées
entre les semaines 13 et 17, qui reflète la résilience du comportement d’achat des
consommateurs. La sortie de ce modèle est un coefficient correcteur (multiplicatif ou
additif) par semaine des profils de vente pour les semaines après la semaine 17 (section
IV.2.2.3).

La Table IV-5 montre la valeur RMSE obtenue lors de l’apprentissage du modèle correctif
(régression polynomiale) par validation croisée sur les quatre prototypes de la famille des
chemisiers. Les résultats montrent que l'ordre de régression affecte significativement la précision
pour les deux types de régression, multiplicative et additive. Par exemple, la régression d'ordre
zéro donne toujours les erreurs les plus élevées, ce qui implique que la correction des prototypes
de vente est dépendante du temps : l'impact de la crise sur les ventes change avec le temps. Les
erreurs les plus faibles ont été obtenues par une régression d'ordre 1 ou 2 ; aucun ordre supérieur
à 2 n'a été testé afin d'éviter un sur-ajustement. Un exemple des résultats de la prévision finale
obtenue pour la famille des chemisiers est présenté à la Figure IV-12.

126
Table IV-5 : Erreurs quadratiques moyennes calculées sur les données de validation pour la famille des chemisiers

Coefficient Coefficient Coefficient Coefficient Coefficient Coefficient


multiplicatif multiplicatif multiplicatif additif additif additif
d’ordre 0 d’ordre 1 d’ordre 2 d’ordre 0 d’ordre 1 d’ordre 2
Prototype 1 0.362 0.294 0.228 0.253 0.294 0.285
Prototype 2 0.132 0.123 0.116 0.135 0.123 0.114
Prototype 3 0.214 0.197 0.193 0.249 0.204 0.189
Prototype 4 0.148 0.095 0.108 0.149 0.092 0.106

L'analyse de la Figure IV-12 met en évidence l'impact de la crise sur les ventes après la
semaine 6, notamment pour les deuxième et troisième groupes de profils de vente (en haut à droite,
en bas à gauche). Par ailleurs, pour le premier prototype (en haut à gauche), aucun changement
important n'est constaté dans le comportement de vente, notamment parce que les articles de ce
cluster sont principalement vendus au cours des premières semaines (semaines 1 à 6). En fait, pour
presque tous les prototypes de vente, le modèle de régression utilisé a permis de corriger
efficacement le profil de vente. Ceci est clairement démontré en comparant les ventes prédites sans
crise (courbe rouge) et les prévisions corrigées (courbe verte) avec les ventes réelles (courbe noire)
qui se sont réellement effectuées pour les semaines entre 17 et 21. Cependant, pour le quatrième
prototype, le modèle de correction n'a pas été aussi performant que pour les trois autres prototypes.
Cela peut être dû au faible nombre de produits affectés à ce prototype.

La Table IV-6 présente les erreurs quadratiques moyennes entre les ventes réelles et les
prédictions, initiales et corrigées, agrégées par famille de produits entre les semaines 17 et 21. Les
résultats montrent que pour toutes les familles de produits, la méthodologie de correction des
prédictions de ventes que nous avons proposée permet une réduction significative des erreurs de
prévision. La méthodologie proposée a été très efficace pour corriger les prévisions initiales et a
réduit de manière significative les erreurs quadratiques moyennes entre les ventes réelles et les
ventes prévues (corrigées). A noter que ces travaux ont été effectué lors du 1er confinement (à la
semaine 17) et les prévisions obtenues à partir de la semaine 18 ont été directement utilisées par
l’enseigne partenaire. Le calcul de ces erreurs a ainsi été effectué à postériori à partir des ventes
réelles réalisées à partir de la semaine 18.

127
Figure IV-12 : L'agrégation des ventes cumulées de la famille des chemisiers, pour l'année 2020, sans et avec
l'impact de la crise sanitaire

128
Table IV-6 : Erreurs quadratiques moyennes entre les ventes réelles et prédites (initiales et corrigées)

Pantalons Prévisions initiales Prévisions corrigées


Prototype 1 128 22
Prototype 2 18060 150
Prototype 3 598 407
Prototype 4 2209 173

Chemisiers Prévisions initiales Prévisions corrigées


Prototype 1 340 74
Prototype 2 28035 1540
Prototype 3 60997 955
Prototype 4 22 4

T-shirts Prévisions initiales Prévisions corrigées


Prototype 1 2782 1253
Prototype 2 53844 1493
Prototype 3 75363 1964
Prototype 4 1042 46

Robes Prévisions initiales Prévisions corrigées


Prototype 1 634 276
Prototype 2 6727 255
Prototype 3 3461 1205
Prototype 4 153 81

IV. 3 Prévision des ventes à long terme par famille de produits intégrant les
impacts des variables explicatives

L'industrie de la mode est un secteur très concurrentiel et dynamique. La durée de


conception et de production d'une nouvelle collection, y compris l'approvisionnement en matières
premières, leur transformation en produits finis et leur mise sur le marché, est normalement
beaucoup plus longue que la durée de vente de ces derniers, ce qui constitue un problème majeur
pour les enseignes de la mode. Il est donc crucial pour les enseignes de mode de pouvoir estimer
avec précision les ventes à moyen/long terme pour la saison suivante afin de pouvoir passer des
commandes auprès des fournisseurs (Chapitre I section I.2.1).

Afin de prédire les ventes pour une famille de produits sur un horizon long terme (un an),
plusieurs méthodes peuvent être appliquées. Cependant, en se basant sur la bibliographie déjà
établie dans le Chapitre I, les méthodes hybrides se montrent particulièrement efficaces dans de

129
nombreuses situations, en particulier dans le domaine de la mode où les données historiques sont
souvent réduites. L’approche que nous avons adoptée utilise d’une part un modèle ayant comme
rôle de prédire l’aspect temporel (saisonnier) de la série temporelle (ventes), et d’autre part un
modèle de ML prenant en considération les données explicatives afin d’améliorer les résultats de
prévision.

Une méthode intéressante proposée dans [186] consiste premièrement à appliquer un


LSTM pour prédire les ventes en capturant la composante temporelle. Ensuite les résidus
(différences entre les prédictions du LSTM et les ventes réelles) sont calculés. Ces résidus
contiennent les informations qui n'ont pas pu être saisies par le LSTM. Puis, une régression basée
sur un RF est utilisée pour modéliser les relations non temporelles entre les résidus et les variables
externes. Enfin, la prévision finale est obtenue par l'agrégation des prévisions des deux modèles.
Cependant, cette méthode hybride présente plusieurs limites. En effet, prévision à long terme avec
un horizon de 52 semaines nécessite une largeur de la fenêtre utilisée par le LSTM importante, et
par conséquent, un volume important de données pour l’apprentissage. Comme les données
historiques sur les articles de mode sont limitées, souvent à 2 ou 3 années, le nombre d’échantillons
d’apprentissage se réduit énormément, causant ainsi un problème de sur-apprentissage pour le
LSTM. Ainsi, pour réaliser de telles prévissions, notre choix s’est porté sur des modèles plus
simples, mieux adaptés aux tailles des ensembles de données disponibles. Par ailleurs, les pratiques
au sein des enseignes de mode s’appuient souvent sur la notion de ventes potentielles ou de courbes
de vie qui correspondent aux ventes « naturelles » du produit, c’est-à-dire sans l’influence des
actions commerciales, des promotions, des soldes, etc. La méthode ainsi choisie est inspirée par
cette approche pratique du métier et par le système de prévision proposé dans [155] dans lequel un
système de logique floue est optimisé pour prédire les influences des variables explicatives sur les
ventes.

IV. 3. 1 Modèle Basé sur un Système de Capture d’Influence MBSCI


Le modèle proposé consiste à corriger les ventes historiques (année ∈ [1, ..., n]) en
supprimant l'influence des variables externes avant de prédire les ventes de l'année n+1. Ce
modèle, appelé MBSCI ou Modèle Basé sur un Système de Capture d’Influence, présente plusieurs
avantages, notamment celui d'obtenir des ventes potentielles, c’est-à-dire qui auraient lieux sans
l'impact de variables explicatives externes, qui reflètent plus précisément les demandes réelles des

130
clients. A titre d’exemple, les ventes faites pendant les périodes des soldes ne reflètent pas
exactement la demande des clients durant cette période. Ainsi, la définition de vente potentielle
permet aux enseignes de développer une idée plus correcte de la demande réelle de leurs clients,
ce qui les aide à mieux gérer les approvisionnements des magasins, planifier la construction
budgétaire pour la saison suivante et optimiser les actions marketing. Les parties IV. 3. 1. 1 et IV.
3. 1. 2 suivantes décrivent en détail la méthodologie proposée ainsi que le processus
d'apprentissage.

IV. 3. 1. 1 Système de prévision global


Le système de prévision proposé, présenté à la Figure IV-13, est composé de trois étapes
principales :

 Les influences des variables explicatives sont supprimées des données de ventes
historiques à l'aide du Système de Capture d'Influence SCI,
 Les ventes potentielles historiques ainsi obtenues sont utilisées pour faire des prévisions
des ventes potentielles de l'année n+1,
 Les prévisions de ventes finales sont obtenues en ajoutant les influences des variables
explicatives, correspondant à l'année n+1, aux ventes potentielles prévues de l’année n+1
à l'aide d’un système SCI-1.

Figure IV-13 : Système de prévision global

131
IV. 3. 1. 2 Processus d’apprentissage du MBSCI
Le Système de Capture d’Influence SCI est conçu pour prédire, à partir des variables
explicatives, un coefficient qui a pour rôle de corriger les ventes de l’influence des variables
explicatives. Nous avons utilisé un réseau de neurones simple (perceptron) pour prédire ces
coefficients de correction, en partant du principe qu'un réseau de neurones peut apprendre
efficacement des relations non linéaires complexes.

Ensuite, pour prédire les ventes potentielles de l'année suivante (n+1), nous avons appliqué
une méthode classique basée sur la moyenne des saisonnalités qui est l'une des méthodes les plus
simples de prévision des séries temporelles, vu que les ventes de produits de mode, agrégées par
famille de produits, ont généralement un comportement saisonnier marqué. En outre, le choix de
ce modèle permet de vérifier la capacité de la méthodologie proposée à optimiser les coefficients
de correction, en limitant les paramètres supplémentaires à ajuster, ce qui augmenterait la
complexité du processus d'apprentissage global.

L’approche proposée consiste à optimiser les paramètres (poids) du réseau de neurones de


telle sorte que l’erreur de prévision finale soit minimale. Pour ce faire, nous avons utilisé un
Algorithme Génétique (AG) où chaque chromosome est formé par des gènes réels représentant
les poids du réseau de neurones (Figure IV-14).

Figure IV-14 : Réseau de neurones utilisé (Perceptron) et le chromosome correspondant

132
Figure IV-15 : Processus d'apprentissage

La Figure IV-15 présente en détail le processus d'apprentissage du système proposé qui


utilise les années ∈ [1, …, n-1] pour l’apprentissage et l’année n pour la validation. La boucle
d'apprentissage est composée des étapes suivantes :

 A partir des variables explicatives historiques (année ∈ [1, …, n-1]) et des poids initiaux
générés aléatoirement, le réseau de neurones prédit les coefficients de correction
(𝑐𝑐𝑎𝑛𝑛é𝑒 ∈ [1,…,𝑛−1] ) qui quantifie l'impact de ces variables explicatives sur les ventes des
années ∈ [1, …, n-1],
 En utilisant les coefficients correctifs ainsi obtenus ainsi que les ventes historiques réelles
des années ∈ [1, …, n-1], la fonction d'Extraction d'Influence EI calcule les ventes
potentielles des années ∈ [1, …, n-1] comme entrée au modèle de prévision, tel que :

133
𝑣𝑒𝑛𝑡𝑒𝑠 𝑟é𝑒𝑙𝑙𝑒𝑠𝑎𝑛𝑛é𝑒 ∈ [1,…,𝑛−1]
𝑣𝑒𝑛𝑡𝑒𝑠 𝑝𝑜𝑡𝑒𝑛𝑡𝑖𝑒𝑙𝑙𝑒𝑠𝑎𝑛𝑛é𝑒 ∈ [1,…,𝑛−1] =
1 + 𝑐𝑐𝑎𝑛𝑛é𝑒 ∈ [1,…,𝑛−1] (19)

 Prévision des ventes potentielles (sans les influences des variables explicatives) de l’année
de validation n, avec le modèle de prévision de séries temporelles basé sur la moyenne des
saisonnalités,
 A partir des variables explicatives de l’année de validation n et du même réseau de neurone,
les coefficients correctifs de l’année n sont calculés,
 Les influences de ces variables explicatives sont ajoutées aux ventes potentielles de l’année
n, en utilisant EI-1, pour effectuer la prévision de vente finale de cette année, tel que :

𝑣𝑒𝑛𝑡𝑒𝑠 𝑝𝑟é𝑣𝑢𝑒𝑠𝑎𝑛𝑛é𝑒 𝑛 = 𝑣𝑒𝑛𝑡𝑒𝑠 𝑝𝑜𝑡𝑒𝑛𝑡𝑖𝑒𝑙𝑙𝑒𝑠 𝑝𝑟é𝑣𝑢𝑒𝑠𝑎𝑛𝑛é𝑒 𝑛 ∗ (1 + 𝑐𝑐𝑎𝑛𝑛é𝑒 𝑛 ) (20)


 La fonction fitness de l'AG est calculée à partir des ventes ainsi prévues et des ventes réelles
de l’année de validation n en calculant l'erreur quadratique moyenne RMSE :

𝑓𝑖𝑡𝑛𝑒𝑠𝑠 = 1⁄𝑅𝑀𝑆𝐸 (21)


 L'AG génère de nouveaux poids pour le réseau de neurones afin d'augmenter la valeur de
la fonction fitness,
 Les paramètres optimaux du réseau de neurones qui permettent d’obtenir la valeur RMSE
la plus faible, et par conséquent les ventes potentielles optimales de l’année de validation
n, sont obtenus lorsque le critère d’arrêt de l’AG est atteint (convergence de la fonction
fitness).

Une fois le modèle SCI optimal obtenu, la prévision de ventes de l’année n+1 est calculée
en ajoutant l'influence des variables explicatives de la saison future (année n+1), aux ventes
potentielles de cette année.

IV. 3. 2 Résultats des prévisions du modèle MBSCI


IV. 3. 2. 1 Description des données
Le système de prévision proposé a été appliqué aux données réelles d'une enseigne de mode
partenaire. Il a été testé pour effectuer une prévision des ventes sur un an (52 semaines) pour quatre
différentes familles de produits : T-shirts, Vestes, Pulls et Robes. Nous avons utilisé deux années

134
de données historiques de ventes (2016 et 2017) pour le processus d'apprentissage, une année
(2018) pour la validation, et une année (2019) pour le test.

En premier lieu, les variables explicatives les plus significatives doivent être bien
sélectionnées. Compte tenu que les produits étudiés sont très sensibles aux variations de prix, les
variables choisies en accord avec l’enseigne partenaire sont :

 Le type d'opération commerciale OP appliquée. Il existe deux types : (i) les soldes hiver/été
de longue durée et (ii) les soldes hiver/été de courte durée (10 jours),
 La saison : automne, hiver, printemps et été,
 La durée restante de la période des soldes (100% au début des soldes et 0% à la fin) pour
identifier à quelle phase de la période des soldes on se trouve. Cette variable est juste
appliquée dans le cas des soldes hiver/été de longue durée puisque, selon l’enseigne de
mode partenaire, l’influence de ces derniers sur les ventes varie légèrement avec le temps
dans ce cas.

La Figure IV-16 montre un exemple des ventes par semaine de la famille des T-shirts avec
les variables explicatives utilisées correspondantes.

Figure IV-16 : Ventes des T-shirts par semaine et variables explicatives correspondantes

135
IV. 3. 2. 2 Résultats de prédictions de ventes en utilisant les variables explicatives liées aux
soldes
Pour chaque famille de produit, les paramètres de l’AG (Nombre maximal de générations,
nombre de chromosomes par génération, taux de mutation 𝜌𝑚 , taux de croisement 𝜌𝑐 ) utilisés lors
de l’apprentissage sont optimisé en utilisant la technique « grid search », en tenant compte que le
taux de mutation 𝜌𝑚 soit inférieure à 0.05, et le taux de croisement 𝜌𝑐 soit de l’ordre de 0.5-0.8.
En outre, la méthode de sélection choisie est la méthode de la roulette biaisée (voir Chapitre II
section II.6). Les chromosomes de la population initiale (différents solution des poids du
perceptron) sont générés aléatoirement.

Pour la famille des T-shirts, la Figure IV-17 montre l’évolution de la fonction de fitness
de l’AG ainsi que le RMSE sur l’année de validation 2018. La convergence de la valeur de fitness
montre que l’AG a pu optimiser les poids du réseau de neurones d’une façon à prédire les
coefficients correctifs optimaux pour la correction des ventes sur l’année de validation 2018 avec
seulement une dizaine d’itérations. La Figure IV-18 montre, pour l'année 2019, la courbe de
ventes potentielles prévues à partir des ventes potentielles historiques (sans l'influence des soldes),
les ventes prévues après réinjection de l’influences des soldes de 2019, les coefficients correcteurs
prédits correspondants à chaque semaine, ainsi qu'une visualisation des variables explicatives
utilisées (saison, types de soldes et la durée restante de la période des soldes). Les résultats obtenus
démontrent l'efficacité du modèle MBSCI ainsi que la capacité du réseau de neurones, optimisé
avec l'AG, à modéliser les influences des variables explicatives. Il est évident, d'après la Figure
IV-18, que pendant les soldes d'hiver/été (indiqués par les cercles pointillés rouges), l'influence
des variables explicatives est plus visible que pendant les semaines normales. Le coefficient de
correction est à son maximum au début des soldes hiver/été, et diminue continuellement tout au
long de la période de promotions : on voit clairement dans les prédictions pour l'année 2019 que
le pic des semaines 26 et 27 est causé par le début des soldes d'été (le coefficient correcteur, dans
ce cas, est égal à 90%). Cette correction est de moindre importance pendant les soldes de 10 jours
(représentés en cercles pointillés noirs), ce qui est logique puisque pendant ce type d'opération, les
promotions ne sont pas appliquées sur l'ensemble de la collection ce qui explique les pics plus
faibles dans ces périodes.

136
Figure IV-17 : Evolution de la fonction de fitness et de RMSE de l'année 2018 de validation lors du process
d'apprentissage pour la famille des T-shirts

Nous avons évalué la capacité du modèle MBSCI à effectuer des prévisions à long terme
en le comparant à trois autres méthodes de prévision en termes d'erreur quadratique moyenne
(RMSE), d'erreur absolue moyenne (MAE) et de pourcentage d'erreur absolue moyenne (MAPE).
Nous avons utilisé pour la comparaison une méthode classique de prévision des séries temporelles
SARIMAX, le modèle Random Forest (en ajoutant le numéro de semaine comme une entrée
supplémentaire aux autres variables explicatives utilisées) et un LSTM multivarié. Les résultats
présentés dans la Table IV-7 montrent que le modèle MBSCI donne de meilleurs résultats
lorsqu'elle est appliquée aux données de test de 2019, en présentant les erreurs de prévision les
plus faibles pour les trois paramètres utilisés, sauf dans le cas de la famille des vestes où le RMSE
du modèle RF (9334) est légèrement inférieur à celui du modèle MBSCI (9360). La Figure IV-19
montre les prévisions de ventes ainsi que les ventes réelles des T-shirts pour l’année 2019.

137
Table IV-7 : Erreurs obtenues sur les données de test 2019 pour la famille des T-shirts.

T-shirts RMSE MAE MAPE


SARIMAX 73133 62710 34.57
RF 54135 45459 29.04
LSTM Multivarié 73765 57464 29.92
MBSCI 49360 37601 22.13

Pulls RMSE MAE MAPE


SARIMAX 75563 71105 110.41
RF 36540 30632 52.99
LSTM Multivarié 36030 30401 44.38
MBSCI 33314 22799 28.95

Vestes RMSE MAE MAPE


SARIMAX 9415 7022 34.84
RF 9334 7653 39.96
LSTM Multivarié 11780 9661 45.4
MBSCI 9360 6836 31.58

Robes RMSE MAE MAPE


SARIMAX 15900 10890 39.01
RF 22622 14063 51.45
LSTM Multivarié 26376 17014 63.32
MBSCI 14341 9018 30.04

138
Figure IV-18 : Ventes corrigées (courbe V) et prédiction finale (en haut), coefficient de correction (en bas)

Figure IV-19 : Prévisions de ventes de l’année 2019

139
IV. 4 Prévision des ventes en intégrant les tendances du marché

De nombreux chercheurs ont exploré le problème de la prévision de la demande des clients,


comme montré dans la bibliographie présentée dans le chapitre I. Cependant les prévisions de
vente d’une enseigne, n’utilisant que les données issues de son système d’information, se révèlent
imprécises à elles seules car dans la société actuelle, numérique et connectée, la demande des
clients est influencée par de nombreux facteurs externes. Notamment les réseaux sociaux
constituent une source d’information intéressante pour obtenir une vision globale du marché et des
tendances de la mode. Par conséquent, l'objectif principal de cette section est de proposer des
modèles de prévision pour le secteur de la mode en intégrant les tendances du marché, détectées
dans le chapitre III, en complément des données historiques internes à l’entreprise en vue
d’améliorer les résultats de prévision de la demande des clients. Comme montré dans le chapitre
III, l’influence des réseaux sociaux est éphémère, et, par conséquent, doit être considérée pour des
prévisions à court terme. Une prévision plus précise de la demande à court terme offre aux
enseignes de mode la possibilité de réapprovisionner les stocks des magasins par les produits ayant
un fort potentiel d’être demandés par les clients.

IV. 4. 1 Systèmes proposés pour la prévision de ventes avec les tendances de mode
Afin d’intégrer l’influence des tendances du marché de la mode sur les prévisions de ventes
à court terme par famille de produits, trois modèles de prévision basés sur des méthodes
d'apprentissage automatique sont appliqués (Figure IV-20) :

 Une régression en utilisant le modèle RF ; choisi pour ses capacités d’apprentissage


automatique performantes et sa facilité d'intégrer des données catégorielles et numériques.
 Le modèle LSTM multivarié ; cette technique d'apprentissage profond est sélectionnée
pour ses résultats prometteurs dans les problèmes d'apprentissage de séquences non
linéaires. Notamment Les réseaux RNN et LSTM, contrairement aux autres réseaux de
neurones, ont la propriété de retenir l'information au cours du temps et surclassent
régulièrement les méthodes populaires d'apprentissage automatique pour la prévision des
séries temporelles dans la littérature [187]. Ce type de modèle, basé sur l’apprentissage
profond, a également l’avantage de pouvoir traiter directement les données brutes, sans
pré-traitement.

140
 Le modèle MBSCI proposé dans la section IV.3 a démontré sa capacité à intégrer
l’influence des actions commerciales. L’intégration de différents types de variables
exogènes telles que les tendances de mode est aisé. Contrairement à la section IV.3 ce
modèle est utilisé ici pour des prévisions à court terme compte tenu de l’influence
éphémère des tendances de mode détectées sur les réseaux sociaux et l’Internet.

IV. 4. 2 Données utilisées pour la prévision de ventes avec tendances de mode


Pour comparer les performances des différents systèmes de prévision proposés dans la
section IV.4.1, ces derniers sont appliqués sur les données de quatre familles de produits : Vestes,
T-shirts, Pulls et Robes. En plus des données de ventes historiques et des données des opérations
commerciales collectées à partir des systèmes d’information de l’enseigne partenaire (voir section
IV.3.2.1), les tendances de mode correspondant à chacune des familles de produits testées sont
considérées pour établir la prévision. Les étapes suivies pour calculer les entrées des modèles de
prévision correspondant aux tendances de mode sont les suivantes :

 Détecter les évolutions de tendances par semaine :


Pour chaque famille, nous avons détecté, sur plusieurs années et par semaine, la fréquence
d’occurrence de tous les mots liés à cette famille de produits dans les blogs extraits des
magazines et des sites de mode en ligne, en suivant la méthodologie de détection des
tendances proposée dans le chapitre III. Par exemple pour la famille des vestes, les mots
considérés sont : manteau, coat, overcoat, cape, doudoune, duffel-coat, veste, trench,
trench-coat, blazer, jaquette, gilet, canadienne, parka, biker, imperméable, etc.
 Appliquer une moyenne mobile, ou moving average, afin de lisser la courbe de tendances
obtenue comme le montre la Figure IV-21 pour la famille de produit des Pulls pour 4
années – 2016, 2017, 2018 et 2019 (208 semaines). En effet, la fréquence des occurrences
obtenues des à partir des blogs est une variable très fluctuante mais son influence peut être
considérée comme plus régulière.
 A partir de la courbe lissée obtenue, calculer deux attributs pour chaque semaine s : (i) la
pente de la courbe pour les semaines [s-m, …, s] (avec m=7), ainsi que (ii) la moyenne de
la fréquence d’occurrence pendant cette période (fenêtre) (Figure IV-22). En effet, le choix
de la taille de cette fenêtre (7 semaines) est fait suite à une analyse visuelle des courbes de
tendances obtenues. Cette étape est effectuée comme un prétraitement des données de

141
tendances lors de l’application des modèles RF et MBSCI, et permet aux modèles de mieux
prendre en compte les caractéristiques de l’évolution des tendances de mode. Dans le cas
du modèle LSTM multivarié, la courbe de lissage (avec une fenêtre de taille n) est traitée
directement compte tenu des capacités d’apprentissage profond du système.

Pour le modèle RF, l’application de prévision des ventes nécessite l’ajout d’un attribut
supplémentaire lié à l’aspect temporel : typiquement le numéro de la semaine pour les données
hebdomadaires considérées ici.

Par résumé, les différentes variables utilisées en entrées des systèmes pour effectuer une
prévision des ventes à (t+1) sont présentés dans la Figure IV-20.

Figure IV-20 : Méthodologie d'application des différents modèles pour la prévision de ventes en intégrant les
tendances de la mode

142
Figure IV-21 : Courbes d’évolution des tendances liées aux Pulls, brutes et lissées

Figure IV-22 : Données -- pente et moyenne -- calculées à partir des tendances Pull

143
La Figure IV-23 et la Figure IV-24 présentent les courbes des ventes et des tendances
détectées pour les familles des Pulls et des Vestes, respectivement. L’analyse visuelle de ces
courbes montre qu’il existe une corrélation évidente entre les ventes de ces familles de produits et
les courbes de tendances correspondantes. Par contre, pour les familles des Robes et des T-shirts,
les tendances semblent ne pas avoir une influence significative sur les ventes. En effet, les courbes
de tendances détectées ne montrent ni une corrélation entre les ventes et les tendances, ni même
un effet saisonnier de l’occurrence de ces mots dans les blogs. La Figure IV-25, et la Figure IV-26
montrent les ventes des produits de la famille des robes et des t-shirts ainsi que les courbes
représentant l’évolution des tendances liées à ces deux familles. On peut alors constater que pour
certaines familles de produits, les relations entre les tendances détectées et les ventes
n’apparaissent pas clairement visuellement.

Figure IV-23 : Ventes de la famille des Pulls et la courbe tendance correspondante

144
Figure IV-24 : Ventes de la famille des Vestes et la courbe tendance correspondante

Figure IV-25 : Ventes de la famille des Robes et la courbe tendance correspondante

145
Figure IV-26 : Ventes de la famille des T-shirts et la courbe tendance correspondante

IV. 4. 3 Résultats de la prévision de ventes avec tendance de mode


L’objectif de cette section est de montrer la contribution des données de tendances issues
des réseaux sociaux dans l’amélioration des prévisions de ventes à court terme. Ainsi, chacun des
modèles proposés est testé sur des prévisions avec et sans utilisation des tendances comme
variables exogènes. Ces modèles sont entraînés sur les années 2016, 2017 et 2018 et testés sur
l’année 2019.

Les RMSE des prévisions obtenues en appliquant les 3 modèles RF, LSTM multivarié et
MBSCI sont présenté dans la Table IV-8. Les résultats obtenus montrent que, pour les familles
des Pulls et Vestes, l’ajout des tendances détectées à partir de la fréquence d’occurrences des mots
correspondants dans les blogs et magazines de mode au système de prévision améliore les
prévisions des ventes. Ceci est justifié par le fait que, comme montré dans la section IV.4.2, il
existe une corrélation significative entre les courbes des ventes et des tendances pour les familles
des pulls et des vestes (Figure IV-23, Figure IV-24), contrairement aux courbes des familles des
t-shirts et des robes (Figure IV-25, Figure IV-26). On constate alors que pour certaines familles
de produits, les tendances détectées ne présentent pas d'impact sur les ventes correspondantes.

146
Par ailleurs, une comparaison entre les RMSE obtenues en appliquant les 3 modèles de
prévision (utilisant les tendances comme variables exogènes supplémentaires aux données des
opérations commerciales) montre que, pour les 4 familles de produits, le LSTM multivarié présente
les valeurs RMSE les plus faibles, et par conséquent il fournit les meilleures prévisions de ventes
à court terme par rapport aux modèles RF et MBSCI. Par rapport au modèle RF, ces résultats sont
attendus compte tenu des performances du LSTM dans différentes applications de prévision des
séries temporelles, en comparaison avec d’autres méthodes populaires d’apprentissage
automatique ne pouvant pas capturer les aspects temporelles des séries [187]. Par contre,
différentes méthodes hybrides présentées dans la littérature se sont montrées plus efficaces dans
les applications de prévision des ventes, vu leur capacité à la fois à détecter les aspects temporels
et les influences des variables exogènes. Ceci est encore montré dans l’application du modèle
MBSCI pour la prévision à long terme des ventes dans laquelle il a significativement surpassé les
performances des différents modèles statistiques (SARIMAX), de l’apprentissage automatique
(RF) et de l’apprentissage profond (LSTM multivarié) (section IV.3.2.2).

Table IV-8 : RMSE des prévisions avec et sans l’utilisation des tendances des 4 familles de produits pour les 3
modèles RF, LSTM et MBSCI

Pulls Sans Tendances Avec Tendances


RF 36540 33675
LSTM Multivarié 21759 20512
MBSCI 33314 33034

Vestes Sans Tendances Avec Tendances


RF 9334 9318
LSTM Multivarié 8860 8705
MBSCI 9326 9360

T-shirts Sans Tendances Avec Tendances


RF 54135 54230
LSTM Multivarié 38943 41087
MBSCI 49364 49981

Robes Sans Tendances Avec Tendances


RF 22622 21172
LSTM Multivarié 10223 10688
MBSCI 14341 14276

147
La Table IV-9 montre les erreurs quadratiques moyennes obtenues pour l’année de
validation 2018 ainsi que pour l’année de test 2019 pour les 4 familles de produits lors de
l’application du modèle MBSCI. Les résultats montrent que, pour les années de validation, l’ajout
des variables liées aux tendances de mode permet une amélioration en termes de RMSE pour toutes
les familles de produits. Cette amélioration est plus significative pour la famille des Pulls que pour
les autres familles. Pour les prévisions de l’année de test 2019, les résultats montrent que les
tendances permettent d’améliorer légèrement les prévisions pour les pulls et les vestes (Equivalent
aux résultats obtenus par les modèles RF et LSTM). Les résultats sur les T-shirts et les robes, les
tendances dégradent la précision du modèle.

Table IV-9 : RMSE de validation et de test pour les 4 familles de produits en appliquant la méthodologie proposée

Modèle
Sans Tendances Avec Tendances
MBSCI
Validation 2018 Test 2019 Validation 2018 Test 2019

Pulls 23166 33314 22506 33034


Vestes 6377 9360 6190 9326
T-shirts 36645 49364 36024 49981
Robes 10309 14341 10220 14276

Les résultats obtenus par le modèle MBSCI lors de l’intégration des tendances de mode
pour une prévision à court terme peuvent être justifiés de plusieurs façons. En premier lieu, comme
mentionné dans la section IV.4.1, le modèle MBSCI est conçu initialement pour réaliser des
prévisions à long terme ; le modèle utilisé pour effectuer la prévision des ventes potentielles est un
modèle de prévision de séries temporelles classique basé sur la moyenne des saisonnalités qui,
pour une prévision à court terme, n’est pas le plus optimal. En outre, le modèle de prédiction des
coefficients de correction des ventes dans le modèle SCI (voir section IV.3.1.2) joue un rôle
important dans la prévision des ventes. Un réseau de neurones classique montre des limites pour
détecter des relations complexes dans les données d’entrée notamment l’influence des tendances
de mode sur les ventes. Plus précisément, ces limites concernent surtout la capacité de
généralisation aux données de test. Dans une moindre mesure, les capacités d’apprentissage du
perceptron sont également assez faibles compte tenu de la faible amélioration obtenue lors de
l’ajout des tendances de mode sur les données d’apprentissage.

148
IV. 5 Conclusion

Les deux premières parties de ce chapitre présente deux systèmes de prévisions de


ventes développées pour des usages et des contextes différents. Dans le premier système, les ventes
sont prédites par article dans le contexte exceptionnel de la Covid-19. Une nouvelle méthodologie
de prévision des ventes a été développée pour tenir compte de l'impact de la pandémie de Covid-
19 sur les ventes de produits de mode. Les résultats montrent la capacité du système proposer à
prédire les ventes par articles et les corriger en intégrant l’impact de la pandémie, déterminé en
premier lieu par l’analyse des comportements d’achats des clients. La méthodologie proposée peut
également être appliquée à d'autres domaines et situations dans lesquels les ventes sont fortement
et soudainement perturbées, rendant les modèles de prévision existants inefficaces.

Le deuxième système proposé, appelé MBSCI, consiste à corriger les ventes historiques
des facteurs exogènes pour prévoir les ventes et la demande des clients. Ce système est appliqué
pour effectuer des prévisions de ventes à long terme de quatre familles de produits en corrigeant
les ventes historiques de l’influence des variables liées aux opérations commerciales. Les résultats
obtenus montrent que le système proposé surpasse les performances d’autres techniques
d’apprentissage automatique en fournissant des erreurs de prévision plus faibles.

Finalement, la troisième section de ce chapitre vise à intégrer les tendances de mode pour
améliorer les prévisions de ventes. Trois modèles sont ainsi testés pour effectuer des prévisions de
ventes à court terme par famille de produits en utilisant les tendances détectées dans le chapitre
III : le RF, le LSTM multivarié et le système MBSCI. Les résultats montrent que pour certaines
familles de produits, les tendances détectées offrent des informations pertinentes permettant
d’améliorer les prévisions à court termes. Le modèle LSTM se montre le plus efficace pour
exploiter ces informations et modéliser les relations entre les ventes et les tendances de mode. Le
modèle MBSCI obtient des résultats mitigés mais des perspectives d’amélioration sont identifiées.

Dans ce qui suit, nous présentons la conclusion générale de cette thèse avec des
perspectives des travaux futurs.

149
Conclusion générale et perspectives

L'industrie de la mode, ou industrie de l’habillement, est une des plus anciennes activités
humaines et traverse les siècles en s'adaptant continuellement aux avancées technologiques et
sociétales. Plusieurs facteurs, tels que le cycle de vie court des produits, les délais
d’approvisionnement longs, la demande très fluctuante, etc., contribuent à rendre le secteur de la
mode un des environnements les plus complexes à gérer. Par ailleurs, les consommateurs
bénéficient de nos jours d’un accès direct et simple aux dernières tendances de mode grâce aux
réseaux sociaux et les applications mobiles ce qui influence d’une manière directe leur demande,
ainsi que les relations enseignes/consommateurs. Ainsi, les enseignes de mode doivent trouver des
nouveaux systèmes de prévision de la demande et de détection des tendances, en profitant des
derniers avancements dans le domaine de l’Intelligence Artificielle (IA) ainsi que des données
massives de plus en plus accessibles, afin d’augmenter continuellement la satisfaction de leurs
clients, identifier les produits à fort potentiel et réduire la quantité des invendus.

Diverses méthodologies performantes pour la prévision des ventes dans le secteur de la


mode sont proposées dans la littérature appliquant des modèles de prévision des séries temporelles
et des modèles d’apprentissage automatique. Des nouvelles études montrent que l’utilisation des
modèles hybrides, combinant à la fois des modèles capables de modéliser les aspects temporels
avec des modèles d’apprentissage automatique pour exploiter des variables exogènes, permettent
de fournir des prévisions plus précises de la demande. D’autre part, les chercheurs ont récemment
abordé le défi de la détection et prévision des tendances du marché. Les systèmes proposés dans
ces travaux reposent essentiellement sur l’analyse des images et des textes issus des réseaux
sociaux dans le but d’identifier les tendances du marché. Les résultats obtenus montrent que
l'utilisation des techniques d'IA et des données des réseaux sociaux peut aider les entreprises à
anticiper les tendances de la mode afin d’aider les entreprises à créer des produits à fort potentiel.
Toutefois, à notre connaissance, aucune étude permettant d’intégrer les tendances de la mode aux
systèmes des prévisions des ventes n’est proposée dans la littérature.

L’objectif de cette thèse est de proposer aux enseignes de mode différents systèmes d’aide
à la décision, qui prennent en compte les spécificités assez complexes du secteur de la mode, afin
de mieux prédire la demande réelle de leurs clients, en profitant de la disponibilité des différents

150
types de données, internes à l’entreprise ou issues des réseaux sociaux. Les systèmes proposés
reposent sur la mise en œuvre des diverses méthodes de l’intelligence artificielle afin de mieux
traiter ces données hétérogènes, et ainsi, prévoir plus précisément la demande des consommateurs.
Chacun de ces systèmes est développé pour un objectif spécifique : (i) déterminer la demande des
clients en détectant les tendances de mode, (ii) prédire les préférences de clients en termes de
produits de mode, ou (iii) effectuer des prévisions de ventes dans différents contextes et à différent
horizons de prévision, en intégrant des facteurs exogènes de différentes natures, quantitatives et
qualitatives.

Le premier système, détaillé dans le chapitre III section III.2, consiste à détecter les
dernières tendances de modes à partir des réseaux sociaux, et plus précisément, à partir des blogues
publiés en ligne par les influenceurs et les magazines digitaux de mode, influençant d’une manière
directe le goût des consommateurs. Le système proposé permet de fournir la fréquence des
occurrences des mots et de visualiser les cooccurrences à l'aide de réseaux de graphes. Les résultats
obtenus ont montré que le système proposé est capable de mettre en évidence les attributs de mode
les plus discutés dans les blogs de mode. Cela démontre son efficacité à détecter les tendances
actuelles et à identifier les tendances précédentes, ce qui constitue une base pour la prévision des
tendances futures. Par ailleurs, ce système fournit une aide à la décision intéressante pour les
départements de style des enseignes de mode en identifiant de façon globale les principales
tendances de mode pour concevoir les produits futurs ayant un fort potentiel à être vendus. En
outre, les tendances détectées par ce système peuvent être utilisées comme données d'entrée pour
un modèle de prévision de la demande comme proposé dans le chapitre IV section IV.4.

Le deuxième système, présenté dans le chapitre III section III.3, consiste à prédire les
préférences des clients en termes de produits de mode. Ce système se base sur des données
collectées via une application mobile ayant pour but de proposer des nouveaux produits aux clients,
et de demander leurs opinions sur ces produits. Il s’agit des données non-structurées décrivant
d’une part les produits de mode (images et descriptions textuelles), et d’autre part les utilisateurs
de l’application en fournissant leurs préférences stylistiques et actions historiques (opinions sur
des produits historiques). Les résultats obtenus montrent la capacité du système proposé à prédire
avec une bonne précision les opinions des consommateurs sur des nouveaux produits. Ceci fournit
aux marques des informations précieuses sur les préférences des utilisateurs concernant les futures

151
collections. Outre la prédiction des opinions des consommateurs sur les nouveaux produits en
utilisant leurs attributs correspondants, ce système offre également la possibilité de détecter des
tendances. En effet, en effectuant des analyses locales via l’estimation des valeurs de SHAP des
entrées du modèle de prédiction sur les différentes prédictions effectuées, les attributs des produits
contribuant à des prédictions d’avis positifs sur les produits peuvent être obtenus. L’analyse des
valeurs de ces attributs fournit une idée globale des préférences actuelle des consommateurs, et
par conséquent, reflète les tendances actuelles de la mode et les attentes des consommateurs.

Les résultats obtenus à partir de ces deux systèmes montrent qu'en utilisant des techniques
d'apprentissage automatique et en offrant aux entreprises de nouveaux moyens de communiquer
avec leurs clients grâce aux réseaux sociaux et aux applications mobiles, les entreprises peuvent
mieux comprendre les demandes et les besoins de leurs clients. Cela les aide à mieux optimiser
leurs futures collections en réduisant le nombre d'invendus et à augmenter la satisfaction des
consommateurs en proposant des produits correspondants aux tendances du marché.

Le troisième système proposé, détaillé dans le chapitre IV section IV.2, consiste à prédire
les ventes par article dans un contexte exceptionnel : le début de la pandémie Covid-19. Vu que
les systèmes traditionnels de prévision de ventes sont devenus inutilisables pendant cette période,
ce système présente une nouvelle méthodologie de prévision des ventes développée pour prévoir
les ventes de produits de mode en tenant compte de l'impact de la pandémie Covid-19 sur les
ventes. Ce système est développé dans le but de répondre à un besoin réel et urgent de l’enseigne
partenaire lors la thèse et les prévisions résultantes ont été utilisées directement par l'entreprise.
Un calcul des erreurs, effectué à posteriori, montre que la méthode proposée a été très efficace en
termes de modélisation de l’impact de la pandémie sur les ventes, entraînant une réduction
significative des erreurs quadratiques moyennes entre les ventes réelles et les prévisions. La
méthodologie proposée peut également être généralisée à d'autres domaines et à d'autres situations
où les ventes sont fortement et soudainement perturbées, rendant les modèles de prévision existants
inefficaces.

Le quatrième et dernier système (Modèle Basé sur un Système de Capture d’Influence


MBSCI), présenté dans le chapitre IV section IV.3, consiste à effectuer des prévisions de ventes
à long terme en corrigeant les ventes historiques de l’influence des variables exogènes. Ceci est
réalisé en développant une méthode hybride qui combine à la fois un modèle classique de prévision

152
des séries temporelles et un réseau de neurones pour modéliser l’influence des variables
explicatives. En appliquant ce modèle avec des variables exogènes collectées des données internes
à l’entreprise, telles que les ventes et les données liées aux opérations commerciales, le système
proposé se montre le plus performant pour effectuer des prévisions à long terme en comparaison
avec d’autres modèles comme SARIMAX, Random Forest et LSTM. En outre, le modèle proposé
permet d’obtenir une courbe des ventes potentielles, sans influence des variables exogènes, qui
traduit plus fidèlement la demande des consommateurs.

Finalement, dans le chapitre IV section IV.4, les tendances de mode détectées par le
système développé dans le chapitre III section III.2 sont intégrées aux données précédentes afin
d’effectuer des prévisions à court terme par famille de produits. Ainsi, les évolutions des tendances
correspondantes aux familles de produits considérées sont extraites et utilisées comme entrées
supplémentaires à trois systèmes de prévisions, un Random Forest, un LSTM multivarié et le
modèle MBSCI déjà développé. Les résultats montrent que le LSTM multivarié surpasse les deux
autres modèles en présentant les erreurs de prévision les plus faibles. Les résultats démontrent
également que pour certaines familles de produits, l’utilisation des données liées aux tendances
détectées à partir des réseaux sociaux améliore significativement les résultats de prévision à court
terme des ventes. Cependant pour d’autres familles de produits, les tendances détectées ne
fournissent pas des informations suffisamment pertinentes, ou sont trop complexes à interpréter
par les systèmes, et par conséquent, n’aboutissent pas à une amélioration au niveau des prévisions
de ventes.

En conclusion, les différents systèmes proposés durant cette thèse se sont montrés efficaces
pour réaliser les différentes tâches de détection des tendances, prédiction des préférences des
clients, et prévisions de ventes par famille et par article à moyen/long terme. En outre, la réalisation
de prévisions de ventes à court terme à l'aide de données liées aux tendances de la mode a été testée
et a donné des résultats prometteurs. Cependant, plusieurs limitations ont empêché une exploration
plus approfondie de la prévision des ventes avec les tendances détectées :

1. Les modèles hybrides se sont toujours montrés les plus efficaces dans le domaine de la
prévision des ventes. Toutefois, l’application du modèle MBSCI afin de réaliser des
prévisions à court terme avec des tendances de mode n’a pas fourni les meilleures
prévisions. Deux raisons principales peuvent être identifiées à ce problème. Premièrement,

153
le modèle utilisé pour la correction des ventes historiques des influences des variables
exogènes n’arrive plus à modéliser les impacts de ces variables lorsque les tendances de
mode sont intégrées. Deuxièmement, le modèle de prévision des ventes potentielles utilisé
dans le système MBSCI est une méthode classique de prévision de séries temporelles basée
sur la moyenne des saisonnalités. Les performances de ce modèle basique sont correctes
sur des prévisions à long terme mais largement dépassées pour des prévisions à court terme.
2. Les sources de données utilisées pour le système de détection des tendances ont un impact
important sur les résultats des modèles de prévision des ventes. En effet, les clients de
l’enseigne partenaire peuvent ne pas être influencés par les blogs considérés. Par ailleurs,
l’âge moyen de la cliente de l’enseigne partenaire est 46 ans. Il se peut ainsi qu’elle ne soit
pas beaucoup influencée par les dernières tendances de mode vu que, par exemple aux
États-Unis, les réseaux sociaux ont été classés comme le premier facteur d'influence des
achats de mode pour les femmes âgées de 18 à 24 ans [87].
3. Les réseaux sociaux ont significativement modifié la façon dont les entreprises
interagissent avec leurs clients. En effet, les marques payent les influenceurs pour
promouvoir leurs produits et, par conséquent, stimuler la demande de ces produits sur le
marché. Ainsi, les blogs publiés ne reflètent pas nécessairement les tendances du marché,
mais ils deviennent plutôt une forme de publicité.

Plusieurs travaux futurs sont envisagés afin d’améliorer les performances des différents
systèmes proposés permettant ainsi une prévision plus précise des demandes des consommateurs.
Les pistes d’amélioration sont principalement divisées en deux parties : (a) détection des tendances
et (b) prévision des ventes en intégrant les tendances.

a. Détection des tendances :

Le système de détection des tendances proposé dans le chapitre III section III.2 utilise
des données textuelles extraites des blogs et magazines de mode. Ces tendances peuvent être
compléter par des prévisions des tendances à partir des images issues des réseaux sociaux. En effet,
les images peuvent être considérées comme une source d’information significative dans le
domaine de la mode. La démarche consisterait à extraire les attributs et les styles des produits en
appliquant des réseaux de neurones convolutifs sur les images, puis à analyser, détecter et obtenir
l’évolution des tendances.

154
Des tendances peuvent également être détectées à l'aide du modèle de prédiction des
préférences des clients. Les attributs du produit qui contribuent le plus à fournir des prédictions
d’avis positifs peuvent être déterminés en effectuant des analyses locales des valeurs SHAP des
entrées dans le modèle de prédiction. Les préférences des consommateurs peuvent être analysées
en fonction des valeurs de ces attributs, ce qui reflète les tendances actuelles.

b. Prévision des ventes en utilisant les tendances :

Plusieurs modifications peuvent être effectuer au modèle MBSCI pour améliorer les
performances de ce système pour effectuer des prévisions à court terme, telles que le :

 Remplacement du modèle classique basé sur la moyenne des saisonnalités, utilisé


actuellement, par un modèle de prévision plus avancé afin de pouvoir effectuer une
prévision plus précise de la courbe des ventes potentielles, notamment pour des
prévisions à court terme.
 Remplacement du modèle de prévision des coefficients correctifs par un autre modèle
d’apprentissage automatique plus performant permettant une meilleure modélisation
des influences des variables explicatives.
 Élargissement de l'horizon de prévision de quelques semaines afin d'évaluer l'influence
des tendances détectées sur les ventes sur une plus longue période.

D’autres perspectives intéressantes méritent d’être testées pour évaluer l’importance de la


combinaison des tendances avec les données transactionnelles. A titre d’exemple, une
méthodologie de prévision des ventes par article utilisant les caractéristiques de l’article avec les
évolutions de tendances des attributs correspondants (motif, couleur, matière, etc.) pourra mieux
mettre en relief la valeur ajoutée des tendances dans les systèmes de prévision de ventes. En effet,
les tendances détectées à un moment donné doivent avoir une influence sur les ventes des articles
de mode dont les caractéristiques sont alignées avec ces tendances. Une méthodologie pouvant
intégrer les tendances du marché dans un système de prévision des ventes par article est illustrée
dans la Figure P 1. Cette méthodologie est inspirée par le système de prévision proposé dans [42]
dans lequel les variables exogènes considérés, outre les caractéristiques des produits, sont les
évolutions avec le temps des variables correspondantes aux vacances, événements sociaux, météo
et soldes. En utilisant comme variables exogènes les évolutions temporelles des tendances

155
correspondantes aux attributs du produit considéré (détectées dans le premier système proposé
dans le chapitre III de cette thèse), ce modèle pourrait prendre en considération l’influence de ces
tendances sur la prévision des ventes du produit à l’instant t, et ainsi améliorer ses performances
de prévisions.

Figure P 1 : Proposition d'un système de prévision de ventes par article intégrant les tendances du marché

156
Références
[1] V. Steele, Encyclopedia of clothing and fashion, vol. 3. Charles Scribner’s Sons, 2005.
[2] F. Godart, Unveiling fashion: business, culture, and identity in the most glamorous industry.
Springer, 2012.
[3] M. Christopher, R. Lowson, and H. Peck, “Creating agile supply chains in the fashion
industry,” Int. J. Retail Distrib. Manag., vol. 32, no. 8, pp. 367–376, 2004.
[4] A. Cholachatpinyo, B. Fletcher, I. Padgett, and M. Crocker, “A conceptual model of the
fashion process–part 1: the fashion transformation process model,” J. Fash. Mark. Manag.
An Int. J., 2002.
[5] L. D. Burns, K. K. Mullet, and N. O. Bryant, The business of fashion: Designing,
manufacturing, and marketing. Bloomsbury Publishing USA, 2016.
[6] P. Smith, “Revenue of the apparel market worldwide from 2013 to 2026,” 2022. [Online].
Available: https://www.statista.com/forecasts/821415/value-of-the-global-apparel-market.
[7] K.-J. Jung and B.-H. Jeon, “The Negative Effect of the Covid-19 Pandemic on the
Acceleration of Startup Innovation in the Retail Supply Chain,” J. Distrib. Sci., 2021.
[8] S. McIntosh, “Coronavirus: Why the fashion industry faces an ‘existential crisis,’” BBC
News, 2020. [Online]. Available: https://www.bbc.com/news/entertainment-arts-52394504.
[9] R. Jones, The Apparel Industry, 2nd Edition. Blackwell Publishing, 2006.
[10] T. H. Aims, “The emergence of supply chain management as a critical success factor for
retail organisations,” in International Retail Marketing, Routledge, 2007, pp. 128–142.
[11] R. Čiarniene and M. Vienazindiene, “Management of Contemporary Fashion Industry:
Characteristics and Challenges,” Procedia - Soc. Behav. Sci., vol. 156, Nov. 2014.
[12] M. Lavanga, “Designer fashion industry and globalization; the changing role of the
intermediaries,” 2012.
[13] A. Kieser, “Rhetoric and myth in management fashion,” Organization, vol. 4, no. 1, pp. 49–
74, 1997.
[14] C. R. Wasson, “How predictable are fashion and other product life cycles?,” J. Mark., vol.
32, no. 3, pp. 36–43, 1968.
[15] “Basic, Fashion, and Fad Products.” [Online]. Available:
https://courses.cit.cornell.edu/cuttingedge/lifeCycle/03.htm.
[16] ResearchAndMarkets.com, “$99 Billion Worldwide Fast Fashion Industry Report to 2031
- Identify Growth Segments for Investment,” 2022. [Online]. Available:
https://www.businesswire.com/news/home/20220420005724/en/99-Billion-Worldwide-
Fast-Fashion-Industry-Report-to-2031---Identify-Growth-Segments-for-Investment---
ResearchAndMarkets.com.

157
[17] “DressingRoom.” [Online]. Available: https://www.the-dressingroom.com/.
[18] K. Niinimäki, G. Peters, H. Dahlbo, P. Perry, T. Rissanen, and A. Gwilt, “The
environmental price of fast fashion,” Nat. Rev. Earth Environ., vol. 1, no. 4, pp. 189–200,
2020.
[19] M. E. Nenni, L. Giustiniano, and L. Pirolo, “Demand Forecasting in the Fashion Industry:
A Review,” Int. J. Eng. Bus. Manag., vol. 5, p. 37, Jan. 2013.
[20] T.-M. Choi, C.-L. Hui, and Y. Yu, “Intelligent time series fast forecasting for fashion sales:
A research agenda,” in International conference on machine learning and cybernetics,
2011, vol. 3, pp. 1010–1014.
[21] T.-M. Choi, Y. Yu, and K.-F. Au, “A hybrid SARIMA wavelet transform method for sales
forecasting,” Decis. Support Syst., vol. 51, no. 1, pp. 130–140, 2011.
[22] C.-C. Chern, C.-P. Wei, F.-Y. Shen, and Y.-N. Fan, “A sales forecasting model for
consumer products based on the influence of online word-of-mouth,” Inf. Syst. E-bus.
Manag., vol. 13, no. 3, pp. 445–473, 2015.
[23] M. Green and P. J. Harrison, “Fashion Forecasting for a Mail Order Company Using a
Bayesian Approach,” J. Oper. Res. Soc., vol. 24, no. 2, pp. 193–205, Jun. 1973.
[24] P. M. Yelland and X. Dong, “Forecasting demand for fashion goods: a hierarchical Bayesian
approach,” in Intelligent fashion forecasting systems: Models and applications, Springer,
2014, pp. 71–94.
[25] S. Ren, T.-M. Choi, and N. Liu, “Fashion Sales Forecasting With a Panel Data-Based
Particle-Filter Model,” IEEE Trans. Syst. Man, Cybern. Syst., vol. 45, no. 3, pp. 411–421,
2015.
[26] T. Sébastien, H. Michel, and C. Jean-Marie, “Mean-term textile sales forecasting using
families and items classification,” Stud. Informatics Control, vol. 12, no. 1, pp. 41–52, 2003.
[27] C. Li and A. Lim, “A greedy aggregation–decomposition method for intermittent demand
forecasting in fashion retailing,” Eur. J. Oper. Res., vol. 269, no. 3, pp. 860–869, 2018.
[28] J. D. Croston, “Forecasting and stock control for intermittent demands,” J. Oper. Res. Soc.,
vol. 23, no. 3, pp. 289–303, 1972.
[29] A. A. Syntetos and J. E. Boylan, “The accuracy of intermittent demand estimates,” Int. J.
Forecast., vol. 21, no. 2, pp. 303–314, 2005.
[30] R. H. Teunter, A. A. Syntetos, and M. Z. Babai, “Intermittent demand: Linking forecasting
to inventory obsolescence,” Eur. J. Oper. Res., vol. 214, no. 3, pp. 606–615, 2011.
[31] L. M. Sztandera, C. Frank, and B. Vemulapali, “Predicting women’s apparel sales by soft
computing,” in International Conference on Artificial Intelligence and Soft Computing,
2004, pp. 1193–1198.
[32] C. Hui, T. Lau, S. Ng, and C. Chan, “Learning‐based fuzzy colour prediction system for
more effective apparel design,” Int. J. Cloth. Sci. Technol., 2005.

158
[33] C. Frank, A. Garg, L. Sztandera, and A. Raheja, “Forecasting women’s apparel sales using
mathematical modeling,” Int. J. Cloth. Sci. Technol., 2003.
[34] A. Chawla, A. Singh, A. Lamba, N. Gangwani, and U. Soni, “Demand Forecasting Using
Artificial Neural Networks—A Case Study of American Retail Corporation,” Adv. Intell.
Syst. Comput., 2018.
[35] K.-F. Au, T.-M. Choi, and Y. Yu, “Fashion retail forecasting by evolutionary neural
networks,” Int. J. Prod. Econ., vol. 114, no. 2, pp. 615–630, 2008.
[36] A. L. D. Loureiro, V. L. Miguéis, and L. F. M. da Silva, “Exploring the use of deep neural
networks for sales forecasting in fashion retail,” Decis. Support Syst., vol. 114, pp. 81–93,
2018.
[37] S. Cheriyan, S. Ibrahim, S. Mohanan, and S. Treesa, “Intelligent sales prediction using
machine learning techniques,” in 2018 International Conference on Computing, Electronics
& Communications Engineering (iCCECE), 2018, pp. 53–58.
[38] T. Au and G. Phan, “Sales forecasting in fashion retail chain: A case study in Vietnam,”
Master Thesis, Norwegian School of Economics, 2022.
[39] A. Heino, “New Product Demand Forecasting in Retail : Applying Machine Learning
Techniques to Forecast Demand for New Product Purchasing Decisions,” Tampere
University, 2021.
[40] C. Giri, S. Thomassey, J. Balkow, and X. Zeng, “Forecasting new apparel sales using deep
learning and nonlinear neural network regression,” in 2019 International Conference on
Engineering, Science, and Industrial Applications (ICESI), 2019, pp. 1–6.
[41] C. Giri and Y. Chen, “Deep Learning for Demand Forecasting in the Fashion and Apparel
Retail Industry,” Forecasting, vol. 4, no. 2, pp. 565–581, 2022.
[42] V. Ekambaram, K. Manglik, S. Mukherjee, S. S. K. Sajja, S. Dwivedi, and V. Raykar,
“Attention Based Multi-Modal New Product Sales Time-Series Forecasting,” in
Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery
& Data Mining, 2020, pp. 3110–3118.
[43] L. Aburto and R. Weber, “Improved supply chain management based on hybrid demand
forecasts,” Appl. Soft Comput., vol. 7, no. 1, pp. 136–144, 2007.
[44] Q. Wu, “The hybrid forecasting model based on chaotic mapping, genetic algorithm and
support vector machine,” Expert Syst. Appl., vol. 37, no. 2, pp. 1776–1783, 2010.
[45] P. Vroman, M. Happiette, and C. Vasseur, “A hybrid neural model for mean-term sales
forecasting of textile items,” Stud. Informatics Control, vol. 10, no. 2, pp. 149–168, 2001.
[46] Y. Ni and F. Fan, “A two-stage dynamic sales forecasting model for the fashion retail,”
Expert Syst. Appl., vol. 38, no. 3, pp. 1529–1536, 2011.
[47] T.-M. Choi, C.-L. Hui, S.-F. Ng, and Y. Yu, “Color trend forecasting of fashionable
products with very few historical data,” IEEE Trans. Syst. Man, Cybern. Part C
(Applications Rev., vol. 42, no. 6, pp. 1003–1010, 2011.

159
[48] G. P. Zhang, “Time series forecasting using a hybrid ARIMA and neural network model,”
Neurocomputing, vol. 50, pp. 159–175, 2003.
[49] A. Sfetsos and C. Siriopoulos, “Time series forecasting with a hybrid clustering scheme and
pattern recognition,” IEEE Trans. Syst. Man, Cybern. A Syst. Humans, vol. 34, no. 3, pp.
399–405, 2004.
[50] F. Pan, H. Zhang, and M. Xia, “A hybrid time-series forecasting model using extreme
learning machines,” in 2009 Second International Conference on Intelligent Computation
Technology and Automation, 2009, vol. 1, pp. 933–936.
[51] W. Lee, B. Shih, and C. Chen, “A hybrid artificial intelligence sales‐forecasting system in
the convenience store industry,” Hum. Factors Ergon. Manuf. Serv. Ind., vol. 22, no. 3, pp.
188–196, 2012.
[52] P. Vroman, M. Happiette, and B. Rabenasolo, “Fuzzy adaptation of the holt–winter model
for textile sales-forecasting,” J. Text. Inst., vol. 89, no. 1, pp. 78–89, 1998.
[53] S. Thomassey, M. Happiette, N. Dewaele, and J. M. Castelain, “A short and mean term
forecasting system adapted to textile items’ sales,” J. Text. Inst., vol. 93, no. 3, pp. 95–104,
2002.
[54] S. Thomassey, M. Happiette, and J.-M. Castelain, “A global forecasting support system
adapted to textile distribution,” Int. J. Prod. Econ., vol. 96, no. 1, pp. 81–95, 2005.
[55] E. Yesil, M. Kaya, and S. Siradag, “Fuzzy forecast combiner design for fast fashion demand
forecasting,” in 2012 International Symposium on Innovations in Intelligent Systems and
Applications, 2012, pp. 1–5.
[56] S. Thomassey and M. Happiette, “A neural clustering and classification system for sales
forecasting of new apparel items,” Appl. Soft Comput., vol. 7, no. 4, pp. 1177–1187, 2007.
[57] J. M. Chae and H. K. Eun, “Sales Forecasting Model for Apparel Products Using Machine
Learning Technique : A Case Study on Forecasting Outerwear Items,” Fash. Text. Res. J.,
vol. 23, pp. 480–490, 2021.
[58] R. M. van Steenbergen and M. R. K. Mes, “Forecasting demand profiles of new products,”
Decis. Support Syst., p. 113401, 2020.
[59] A. Aksoy, N. Ozturk, and E. Sucky, “A decision support system for demand forecasting in
the clothing industry,” Int. J. Cloth. Sci. Technol., 2012.
[60] Y. Yu, T.-M. Choi, and C.-L. Hui, “An intelligent fast sales forecasting model for fashion
products,” Expert Syst. Appl., vol. 38, no. 6, pp. 7373–7379, 2011.
[61] M. Xia, Y. Zhang, L. Weng, and X. Ye, “Fashion retailing forecasting based on extreme
learning machine with adaptive metrics of inputs,” Knowledge-Based Syst., vol. 36, pp.
253–259, 2012.
[62] Y. Yu, C.-L. Hui, and T.-M. Choi, “An empirical study of intelligent expert systems on
forecasting of fashion color trend,” Expert Syst. Appl., vol. 39, no. 4, pp. 4383–4389, 2012.
[63] A. F. Tehrani and D. Ahrens, “Enhanced predictive models for purchasing in the fashion

160
field by using kernel machine regression equipped with ordinal logistic regression,” J.
Retail. Consum. Serv., vol. 32, pp. 131–138, 2016.
[64] L. Baardman, I. Levin, G. Perakis, and D. Singhvi, “Leveraging comparables for new
product sales forecasting,” Available SSRN 3086237, 2017.
[65] H. SHANSHAN, “Forecasting demand for new products,” National University of
Singapore, 2021.
[66] I.-F. Chen and C.-J. Lu, “Demand Forecasting for Multichannel Fashion Retailers by
Integrating Clustering and Machine Learning Algorithms,” Processes, vol. 9, no. 9, p. 1578,
2021.
[67] M. J. Basallo-Triana, J. A. Rodríguez-Sarasty, and H. D. Benitez-Restrepo, “Analogue-
based demand forecasting of short life-cycle products: a regression approach and a
comprehensive assessment,” Int. J. Prod. Res., vol. 55, no. 8, pp. 2336–2350, Apr. 2017.
[68] D. Chen, W. Liang, K. Zhou, and F. Liu, “Sales Forecasting for Fashion Products
Considering Lost Sales,” Appl. Sci., vol. 12, no. 14, p. 7081, 2022.
[69] S. Ren, H.-L. Chan, and P. Ram, “A comparative study on fashion demand forecasting
models with multiple sources of uncertainty,” Ann. Oper. Res., vol. 257, no. 1, pp. 335–355,
2017.
[70] I. Lee, “Big data: Dimensions, evolution, impacts, and challenges,” Bus. Horiz., vol. 60, no.
3, pp. 293–303, 2017.
[71] D. Laney, “3D data management: Controlling data volume, velocity and variety,” META
Gr. Res. note, vol. 6, no. 70, p. 1, 2001.
[72] G. Firican, “The 10 Vs of Big Data,” 2017. [Online]. Available:
https://tdwi.org/articles/2017/02/08/10-vs-of-big-data.aspx.
[73] D. Rigby and B. Bilodeau, “Management tools & trends. Bain & Company,” Inc. Boston,
MA, USA, 2018.
[74] L. Alton, “How Big Data Is Reshaping the Fashion Industry,” 2017. [Online]. Available:
https://datafloq.com/read/how-big-data-is-reshaping-the-fashion-industry/.
[75] R. B. Ferguson, “How analytics is giving fashion a makeover,” MIT Sloan Manag. Rev.,
vol. 55, no. 2, p. 1, 2014.
[76] A. D. Landmark and B. Sjøbakk, “Tracking customer behaviour in fashion retail using
RFID,” Int. J. Retail Distrib. Manag., 2017.
[77] S. Murray, “Data analytics is on trend with fashion houses,” Financial Times, 2016.
[Online]. Available: https://www.ft.com/content/621d20c0-7033-11e6-a0c9-
1365ce54b926.
[78] D. Shah, “How data science can change the way we buy clothes,” 2020. [Online]. Available:
https://yourstory.com/2020/03/data-science-change-way-buy-clothes-fashion/amp.
[79] R. Fox, M. Goldrick, A. Peng, and K. Whittington, “Geek meets chic: Four actions to jump-

161
start advanced analytics in apparel,” McKinsey & Company, 2018. [Online]. Available:
https://www.mckinsey.com/industries/retail/our-insights/geek-meets-chic-four-actions-to-
jump-start-advanced-analytics-in-apparel.
[80] EDITED, “Market analytics”, 2019. [Online]. Available: https://edited.com/.
[81] Trendalytics, “Powering the future of commerce,” 2019. [Online]. Available:
https://www.trendalytics.co/.
[82] V. Jain, P. Kitchen, B. E. Ganesh, A. Garg, and M. Shelat, “Discovering surrogate branding
via online image development: a case from India,” Int. J. Manag. Concepts Philos., vol. 12,
2019.
[83] Y. Ma, X. Yang, L. Liao, Y. Cao, and T.-S. Chua, “Who, where, and what to wear?
extracting fashion knowledge from social media,” in Proceedings of the 27th ACM
International Conference on Multimedia, 2019, pp. 257–265.
[84] A. Poorthuis, D. Power, and M. Zook, “Attentional social media: Mapping the spaces and
networks of the fashion industry,” Ann. Am. Assoc. Geogr., vol. 110, no. 4, pp. 941–966,
2020.
[85] S.-H. Hsiao, Y.-Y. Wang, T. Wang, and T.-W. Kao, “How social media shapes the fashion
industry: The spillover effects between private labels and national brands,” Ind. Mark.
Manag., vol. 86, pp. 40–51, 2020.
[86] F. Cabiddu, C. Dessì, and M. Floris, “Social media communication strategies in fashion
industry,” in Exploring Digital Ecosystems, Springer, 2020, pp. 393–405.
[87] Mintel, “Women’s Clothing - US - July 2017,” 2017. [Online]. Available:
https://reports.mintel.com/display/793169/?fromSearch=%3Ffreetext%3DWomen%25E2
%2580%2599s%2520Clothing%25202017%26sortBy%3Drecent.
[88] Facebook, “Facebook, Instagram and the changing world of fashion shopping,” Facebook,
2017. [Online]. Available: https://www.facebook.com/business/news/insights/facebook-
instagram-and-the-changing-world-of-fashion-shopping.
[89] S. Asur and B. A. Huberman, “Predicting the Future with Social Media,” in 2010
IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent
Technology, 2010, vol. 1, pp. 492–499.
[90] V. Dhar and E. A. Chang, “Does Chatter Matter? The Impact of User-Generated Content
on Music Sales,” J. Interact. Mark., vol. 23, no. 4, pp. 300–307, 2009.
[91] E. Gilbert and K. Karahalios, “Widespread worry and the stock market,” in Fourth
International AAAI Conference on Weblogs and Social Media, 2010.
[92] X. Zhang, H. Fuehres, and P. A. Gloor, “Predicting Stock Market Indicators Through
Twitter ‘I hope it is not as bad as I fear,’” Procedia - Soc. Behav. Sci., vol. 26, pp. 55–62,
2011.
[93] D. Gayo-Avello, P. Metaxas, and E. Mustafaraj, “Limits of electoral predictions using social
media data,” in Proceedings of the Fifth International AAAI Conference on Weblogs and

162
Social Media, 2011.
[94] A. Bermingham and A. Smeaton, “On using Twitter to monitor political sentiment and
predict election results,” in Proceedings of the Workshop on Sentiment Analysis where AI
meets Psychology (SAAIP 2011), 2011, pp. 2–10.
[95] Y. Yuan and W. Lam, “Sentiment Analysis of Fashion Related Posts in Social Media,” in
Proceedings of the Fifteenth ACM International Conference on Web Search and Data
Mining, 2022, pp. 1310–1318.
[96] M. N. K. Boulos, A. P. Sanfilippo, C. D. Corley, and S. Wheeler, “Social Web mining and
exploitation for serious applications: Technosocial Predictive Analytics and related
technologies for public health, environmental and national security surveillance,” Comput.
Methods Programs Biomed., vol. 100, no. 1, pp. 16–23, 2010.
[97] Google, “Google Trends,” 2014. [Online]. Available:
http://www.google.org/flutrends/about/how.html.
[98] S. Goel, J. M. Hofman, S. Lahaie, D. M. Pennock, and D. J. Watts, “Predicting consumer
behavior with Web search,” Proc. Natl. Acad. Sci., vol. 107, no. 41, pp. 17486–17490, 2010.
[99] G. Kulkarni, P. K. Kannan, and W. Moe, “Using online search data to forecast new product
sales,” Decis. Support Syst., vol. 52, no. 3, pp. 604–611, 2012.
[100] S. Beheshti-Kashi and K.-D. Thoben, “The usage of social media text data for the demand
forecasting in the fashion industry,” in Dynamics in Logistics, Springer, 2016, pp. 723–727.
[101] New Gen Apps, “Bringing Analytics in Design: 7 Novel Ways of Using Big Data in
Fashion,” 2017. [Online]. Available: https://www.newgenapps.com/blog/7-ways-using-
big-data-in-fashionindustry-retail-merchandising.
[102] S. Vittayakorn, K. Yamaguchi, A. C. Berg, and T. L. Berg, “Runway to realway: Visual
analysis of fashion,” in 2015 IEEE Winter Conference on Applications of Computer Vision,
2015, pp. 951–958.
[103] E. S. Silva, H. Hassani, D. Ø. Madsen, and L. Gee, “Googling fashion: forecasting fashion
consumer behaviour using google trends,” Soc. Sci., vol. 8, no. 4, p. 111, 2019.
[104] M. DuBreuil and S. Lu, “Traditional vs. big-data fashion trend forecasting: an examination
using WGSN and EDITED,” Int. J. Fash. Des. Technol. Educ., vol. 13, no. 1, pp. 68–77,
2020.
[105] W. H. Reynolds, “Cars and clothing: understanding fashion trends,” J. Mark., vol. 32, no.
3, pp. 44–49, 1968.
[106] K. Matzen, K. Bala, and N. Snavely, “Streetstyle: Exploring world-wide clothing styles
from millions of photos,” arXiv Prepr. arXiv1706.01869, 2017.
[107] W. Yang, P. Luo, and L. Lin, “Clothing co-parsing by joint image segmentation and
labeling,” in Proceedings of the IEEE conference on computer vision and pattern
recognition, 2014, pp. 3182–3189.
[108] K. Yamaguchi, M. H. Kiapour, L. E. Ortiz, and T. L. Berg, “Parsing clothing in fashion

163
photographs,” in 2012 IEEE Conference on Computer vision and pattern recognition, 2012,
pp. 3570–3577.
[109] K. Yamaguchi, M. Hadi Kiapour, and T. L. Berg, “Paper doll parsing: Retrieving similar
styles to parse clothing items,” in Proceedings of the IEEE international conference on
computer vision, 2013, pp. 3519–3526.
[110] N. Joshi, “Big data is stepping into the fashion world,” 2018. [Online]. Available:
https://www.bbntimes.com/technology/big-data-is-stepping-into-the-fashion-world.
[111] C. Rousso, Fashion forward: A guide to fashion forecasting. New York: Fairchild Books,
2012.
[112] M. H. Kiapour, K. Yamaguchi, A. C. Berg, and T. L. Berg, “Hipster wars: Discovering
elements of fashion styles,” in European conference on computer vision, 2014, pp. 472–
488.
[113] G. B. Sproles, “Analyzing fashion life cycles—Principles and perspectives,” J. Mark., vol.
45, no. 4, pp. 116–124, 1981.
[114] S. Chakraborty, M. S. Hoque, N. Rahman Jeem, M. C. Biswas, D. Bardhan, and E. Lobaton,
“Fashion recommendation systems, models and methods: A review,” in Informatics, 2021,
vol. 8, no. 3, p. 49.
[115] F. Al-Obeidat, A. B. Hani, E. Benkhelifa, O. Adedugbe, and M. Majdalawieh, “A sentiment
analysis approach of data volatility for consumer satisfaction in the fashion industry,” in
2019 Sixth International Conference on Social Networks Analysis, Management and
Security (SNAMS), 2019, pp. 262–267.
[116] “WGSN.” [Online]. Available: https://www.wgsn.com/.
[117] Y. Lin and H. Yang, “Predicting Next-Season Designs on High Fashion Runway,” arXiv
Prepr. arXiv1907.07161, 2019.
[118] D. Crane, Fashion and its social agendas: Class, gender, and identity in clothing.
University of Chicago Press, 2012.
[119] R. He and J. McAuley, “Ups and downs: Modeling the visual evolution of fashion trends
with one-class collaborative filtering,” in proceedings of the 25th international conference
on world wide web, 2016, pp. 507–517.
[120] T. Furukawa, C. Miura, K. Mori, S. Uchida, and M. Hasegawa, “Visualisation for analysing
evolutionary dynamics of fashion trends,” Int. J. Fash. Des. Technol. Educ., vol. 12, no. 2,
pp. 247–259, 2019.
[121] T. Jackson, “The process of trend development leading to a fashion season,” Fash. Mark.,
pp. 168–187, 2007.
[122] K. M. Law, Z. Zhang, and C. Leung, “Fashion change and fashion consumption: the chaotic
perspective,” J. Fash. Mark. Manag. An Int. J., 2004.
[123] A. F. Tehrani and D. Ahrens, “Improved forecasting and purchasing of fashion products
based on the use of big data techniques,” in Supply management research, Springer, 2016,

164
pp. 293–312.
[124] A. Israeli and J. Avery, “Predicting consumer tastes with big data at Gap,” Harvard Bus.
Sch. Publ., pp. 1–27, 2018.
[125] S. Chaudhuri, “H&M pivots to big data to spot next big fast-fashion trends,” Wall Str. J.,
2018.
[126] R. Fox, M. Goldrick, A. Peng, and K. Whittington, “Geek meets chic: Four actions to jump-
start advanced analytics in apparel,” McKinsey & Company, San Francisco, 2018.
[127] J. Gaimster, “The changing landscape of fashion forecasting,” Int. J. Fash. Des. Technol.
Educ., vol. 5, no. 3, pp. 169–178, 2012.
[128] L. Sun and L. Zhao, “Technology disruptions: Exploring the changing roles of designers,
makers, and users in the fashion industry,” Int. J. Fash. Des. Technol. Educ., vol. 11, no. 3,
pp. 362–374, 2018.
[129] R. L. Blaszczyk and B. Wubs, The fashion forecasters: A hidden history of color and trend
prediction. Bloomsbury Publishing, 2018.
[130] E. J. Park, E. Y. Kim, V. M. Funches, and W. Foxx, “Apparel product attributes, web
browsing, and e-impulse buying on shopping websites,” J. Bus. Res., vol. 65, no. 11, pp.
1583–1589, 2012.
[131] J. A. King, “Colour trends and selection in fashion design,” in Colour design, Elsevier,
2012, pp. 535–550.
[132] T.-M. Choi, C.-L. Hui, N. Liu, S.-F. Ng, and Y. Yu, “Fast fashion sales forecasting with
limited data and time,” Decis. Support Syst., vol. 59, pp. 84–92, 2014.
[133] G. Ambrose and P. Harris, The visual dictionary of fashion design. Bloomsbury Publishing,
2007.
[134] M. L. Resnick and R. Montania, “Perceptions of customer service, information privacy, and
product quality from semiotic design features in an online web store,” Int. J. Hum. Comput.
Interact., vol. 16, no. 2, pp. 211–234, 2003.
[135] H. Blumer, “Fashion: From class differentiation to collective selection,” Sociol. Q., vol. 10,
no. 3, pp. 275–291, 1969.
[136] M. Bronfenbrenner, “Trends, cycles, and fads in economic writing,” Am. Econ. Rev., vol.
56, no. 1/2, pp. 538–552, 1966.
[137] D. J. Tigert, L. J. Ring, and C. W. King, “Fashion involvement and buying behavior: A
methodological study,” ACR North Am. Adv., 1976.
[138] B. D. Belleau, “Cyclical fashion movement: Women’s day dresses: 1860-1980,” Cloth.
Text. Res. J., vol. 5, no. 2, pp. 15–20, 1987.
[139] Q. XIONG, S. KITAGUCHI, and T. SATO, “Color Feature of Luxury Brand Clothing, and
its Change in Recent 10 Years,” Int. J. Affect. Eng., vol. 16, no. 3, pp. 203–211, 2017.
[140] J. S. Yun and S. J. Kim, “A study on the analysis of fashion fabric trend and the acceptance
165
by collection-focus on domestic and international collections in 2007 S/S~ 2010 S/S,” Fash.
Text. Res. J., vol. 17, no. 5, pp. 704–717, 2015.
[141] M.-S. Rhee and S.-I. Park, “A research on floral pattern analysis and fashion trend
application appearing in fashion collections-Focusing on the 2012 S/S~ 2017 S/S seasons,”
J. Korea Fash. Costume Des. Assoc., vol. 19, no. 2, pp. 129–144, 2017.
[142] T. J. Gordon, “The delphi method,” Futur. Res. Methodol., vol. 2, no. 3, pp. 1–30, 1994.
[143] J.-A. Song and M.-K. Park, “Analysis on the types of jacket in 2000 women’s fashion,”
Fash. Text. Res. J., vol. 19, no. 5, pp. 608–619, 2017.
[144] S. C. Hidayati, K.-L. Hua, W.-H. Cheng, and S.-W. Sun, “What are the fashion trends in
new york?,” in Proceedings of the 22nd ACM international conference on multimedia,
2014, pp. 197–200.
[145] E. Simo-Serra, S. Fidler, F. Moreno-Noguer, and R. Urtasun, “Neuroaesthetics in fashion:
Modeling the perception of fashionability,” in Proceedings of the IEEE conference on
computer vision and pattern recognition, 2015, pp. 869–877.
[146] Z. Al-Halah, R. Stiefelhagen, and K. Grauman, “Fashion forward: Forecasting visual style
in fashion,” in Proceedings of the IEEE international conference on computer vision, 2017,
pp. 388–397.
[147] U. Mall, K. Matzen, B. Hariharan, N. Snavely, and K. Bala, “GeoStyle: Discovering
Fashion Trends and Events,” in IEEE/CVF International Conference on Computer Vision
(ICCV), 2019.
[148] V. Gabale and A. P. Subramanian, “How to extract fashion trends from social media? a
robust object detector with support for unsupervised learning,” arXiv Prepr.
arXiv1806.10787, 2018.
[149] O. Zimmer and Y. Horwitz, “Google Fashion Trends Report (U.S.),” 2015.
[150] E. Pantano, S. Giglio, and C. Dennis, “Making sense of consumers’ tweets: Sentiment
outcomes for fast fashion retailers through Big Data analytics,” Int. J. Retail Distrib.
Manag., 2018.
[151] P. Wu, X. Li, S. Shen, and D. He, “Social media opinion summarization using emotion
cognition and convolutional neural networks,” Int. J. Inf. Manage., vol. 51, p. 101978, 2020.
[152] S. Beheshti-Kashi, M. Lutjen, L. Stoever, and K.-D. Thoben, “TrendFashion-A framework
for the identification of fashion trends,” Inform. 2015, 2015.
[153] H. An and M. Park, “A study on the evaluation of fashion design based on big data text
analysis-Focus on semantic network analysis of design elements and emotional terms,” J.
Korean Soc. Cloth. Text., vol. 42, no. 3, pp. 428–437, 2018.
[154] P. Liu, “Intermittent demand forecasting for medical consumables with short life cycle
using a dynamic neural network during the COVID-19 epidemic,” Health Informatics J.,
vol. 26, no. 4, pp. 3106–3122, Sep. 2020.
[155] S. Thomassey, M. Happiette, and J. M. Castelain, “A short and mean-term automatic

166
forecasting system––application to textile logistics,” Eur. J. Oper. Res., vol. 161, no. 1, pp.
275–284, 2005.
[156] S. Jiang, K.-S. Chin, L. Wang, G. Qu, and K. L. Tsui, “Modified genetic algorithm-based
feature selection combined with pre-trained deep neural network for demand forecasting in
outpatient department,” Expert Syst. Appl., vol. 82, pp. 216–230, 2017.
[157] P.-C. Chang, Y.-W. Wang, and C.-Y. Tsai, “Evolving neural network for printed circuit
board sales forecasting,” Expert Syst. Appl., vol. 29, no. 1, pp. 83–92, 2005.
[158] M. Mohammadhassani, H. Nezamabadi-Pour, M. Z. Jumaat, M. Jameel, and A. Arumugam,
“Application of artificial neural networks (ANNs) and linear regressions (LR) to predict the
deflection of concrete deep beams,” Comput. Concr., vol. 11, no. 3, pp. 237–252, 2013.
[159] H.-I. Suk, “An introduction to neural networks and deep learning,” in Deep Learning for
Medical Image Analysis, Elsevier, 2017, pp. 3–24.
[160] L. Bottou, “Stochastic gradient learning in neural networks,” Proc. Neuro-Nımes, vol. 91,
no. 8, p. 12, 1991.
[161] D. P. Kingma and J. Ba, “Adam: A method for stochastic optimization,” arXiv Prepr.
arXiv1412.6980, 2014.
[162] M. V Valueva, N. N. Nagornov, P. A. Lyakhov, G. V Valuev, and N. I. Chervyakov,
“Application of the residue number system to reduce hardware costs of the convolutional
neural network implementation,” Math. Comput. Simul., vol. 177, pp. 232–243, 2020.
[163] L. Wen, X. Li, L. Gao, and Y. Zhang, “A new convolutional neural network-based data-
driven fault diagnosis method,” IEEE Trans. Ind. Electron., vol. 65, no. 7, pp. 5990–5998,
2017.
[164] A. Krizhevsky, I. Sutskever, and G. E. Hinton, “Imagenet classification with deep
convolutional neural networks,” Commun. ACM, vol. 60, no. 6, pp. 84–90, 2017.
[165] A. Vaswani et al., “Attention is all you need,” Adv. Neural Inf. Process. Syst., vol. 30, 2017.
[166] J. Devlin, M.-W. Chang, K. Lee, and K. Toutanova, “Bert: Pre-training of deep bidirectional
transformers for language understanding,” arXiv Prepr. arXiv1810.04805, 2018.
[167] L. Breiman, “Random Forests,” Mach. Learn., vol. 45, no. 1, pp. 5–32, 2001.
[168] J. Ali, R. Khan, N. Ahmad, and I. Maqsood, “Random Forests and Decision Trees,” Int. J.
Comput. Sci. Issues(IJCSI), vol. 9, Sep. 2012.
[169] K. Fawagreh, M. M. Gaber, and E. Elyan, “Random forests: from early developments to
recent advancements,” Syst. Sci. Control Eng., vol. 2, no. 1, pp. 602–609, Dec. 2014.
[170] A. K. Jain, “Data clustering: 50 years beyond K-means,” Pattern Recognit. Lett., vol. 31,
no. 8, pp. 651–666, 2010.
[171] T. M. Kodinariya and P. R. Makwana, “Review on determining number of Cluster in K-
Means Clustering,” Int. J., vol. 1, no. 6, pp. 90–95, 2013.
[172] P. J. Rousseeuw, “Silhouettes: A graphical aid to the interpretation and validation of cluster
167
analysis,” J. Comput. Appl. Math., vol. 20, pp. 53–65, 1987.
[173] Y. Liu et al., “Roberta: A robustly optimized bert pretraining approach,” arXiv Prepr.
arXiv1907.11692, 2019.
[174] L. Martin et al., “CamemBERT: a tasty French language model,” arXiv Prepr.
arXiv1911.03894, 2019.
[175] J. H. Holland, “Glossary of Important Symbols”, in Adaptation in Natural and Artificial
Systems, Book Chapter, 1992.
[176] T. Vallée and M. Yildizoğlu, “Présentation des algorithmes génétiques et de leurs
applications en économie,” Rev. Econ. Polit., pp. 711–745, 2004.
[177] S. N. Sivanandam and S. N. Deepa, Introduction to Genetic Algorithms (Google eBook).
2007.
[178] S. M. Lundberg and S.-I. Lee, “A Unified Approach to Interpreting Model Predictions,” in
Proceedings of the 31st International Conference on Neural Information Processing
Systems, 2017, pp. 4768–4777.
[179] S. Baskarada and A. Koronios, “Data, Information, Knowledge, Wisdom (DIKW): A
Semiotic Theoretical and Empirical Exploration of the Hierarchy and its Quality
Dimension,” Australas. J. Inf. Syst., vol. 18, Nov. 2013.
[180] S. Laato, A. K. M. N. Islam, A. Farooq, and A. Dhir, “Unusual purchasing behavior during
the early stages of the COVID-19 pandemic: The stimulus-organism-response approach,”
J. Retail. Consum. Serv., vol. 57, p. 102224, Nov. 2020.
[181] S. Mehta, T. Saxena, and N. Purohit, “The New Consumer Behaviour Paradigm amid
COVID-19: Permanent or Transient?,” J. Health Manag., vol. 22, p. 097206342094083,
Jul. 2020.
[182] S. Thomassey and A. Fiordaliso, “A hybrid sales forecasting system based on clustering
and decision trees,” Decis. Support Syst., vol. 42, no. 1, pp. 408–421, 2006.
[183] I. Rish, “An empirical study of the naive Bayes classifier,” IJCAI 2001 workshop on
empirical methods in artificial intelligence, pp. 41–46. IBM New York, 2001.
[184] J. A. K. Suykens and J. Vandewalle, “Least Squares Support Vector Machine Classifiers,”
Neural Process. Lett., vol. 9, no. 3, pp. 293–300, 1999.
[185] M. W. Gardner and S. R. Dorling, “Artificial neural networks (the multilayer perceptron)—
a review of applications in the atmospheric sciences,” Atmos. Environ., vol. 32, no. 14, pp.
2627–2636, 1998.
[186] S. Punia, K. Nikolopoulos, S. P. Singh, J. Madaan, and K. Litsiou, “Deep learning with long
short-term memory networks and random forests for demand forecasting in multi-channel
retail,” Int. J. Prod. Res., pp. 1–16, Mar. 2020.
[187] T. Fischer and C. Krauss, “Deep learning with long short-term memory networks for
financial market predictions,” Eur. J. Oper. Res., vol. 270, no. 2, pp. 654–669, 2018.

168
Publications
1. Rita Sleiman, Kim-Phuc Tran, and Sébastien Thomassey. "Long Term Demand
Forecasting System for Demand Driven Manufacturing." In IFIP International Conference
on Advances in Production Management Systems, pp. 13-20. Springer, 2021.

2. Rita Sleiman, Kim-Phuc Tran, and Sébastien Thomassey. "Natural Language Processing
for Fashion Trends Detection," 2022 International Conference on Electrical, Computer and
Energy Technologies (ICECET), Prague, Czech Republic, 2022, pp. 1-6, 2022.

3. Rita Sleiman, Ahmad Mazyad, Moez Hamad, Kim-Phuc Tran, and Sébastien Thomassey.
"Forecasting Sales Profiles of Products in an Exceptional Context: COVID-19 Pandemic."
In International Journal of Computational Intelligence Systems 15, no. 1, pp. 1-17, 2022.

169
Résumé / Abstract
Détection de tendances et prévision de la demande d’articles de mode par les données massives et
l’intelligence artificielle
Sur le marché de la mode, l'émergence de l'Internet et des données massives ont profondément modifié
l’environnement concurrentiel et les relations avec les clients. En effet, à l'ère du Big Data, les réseaux sociaux, les
applications mobiles et les diverses technologies récentes permettent de collecter des quantités massives de données
en temps réel à faible coût. Il est donc devenu crucial pour les enseignes de mode d’optimiser l’exploitation de ces
données, issues de leurs systèmes d’information ou des réseaux sociaux, afin d’extraire des informations pertinentes
pour les différentes prises de décision telles que l’optimisation de l’assortiment des collections et des quantités à
réapprovisionner en magasin.
Plus précisément dans le cadre de cette thèse, les données massives et les outils issus de l’intelligence
artificielle sont utilisés pour répondre aux problématiques de détection des tendances de mode et de prévision de
ventes, dans différents contextes. Le modèle proposé s’appuie sur différents types de données pour prédire les
tendances et les demandes à court terme : (i) Les données internes à l’entreprise telles que les données transactionnelles
historiques et les données relatives aux collections précédentes, et (ii) les données externes à l’entreprise, données
issues des réseaux sociaux, telles que les images et les textes provenant de différentes sources. La méthodologie
développée est composée de trois étapes. Premièrement, l’extraction et le traitement de données issues des réseaux
sociaux permet d’identifier et quantifier les tendances de mode les plus pertinentes. Deuxièmement, les données
transactionnelles historiques internes à l'entreprise permettent d’établir des prévisions de ventes en prenant en compte
l’influence des facteurs maitrisés par l’entreprise tels que les actions commerciales, les variations de prix, les périodes
de ventes, etc. Enfin, les tendances de mode détectées sont intégrées aux prévisions de ventes établies précédemment
afin de prévoir plus précisément les demandes futures, et par conséquent, évaluer l’utilité de l’analyse des données
hétérogènes pour la prévision de la demande de mode. Le modèle proposé peut être utilisé pour prévoir les
réapprovisionnements des magasins en produits actuels et/ou pour générer un approvisionnement à court terme de
nouveaux produits. Le modèle proposé est mis en œuvre et évalué sur des données réelles d’une enseigne de prêt à
porter Française.

Mots clés : Analyse des données, Détection des tendances, Intelligence Artificielle, Prévision de la demande,
Données massives, Industrie de la mode.

Trend detection and demand forecasting for fashion items using Big Data and artificial intelligence
In the fashion market, the emergence of the Internet and Big Data has profoundly changed the competitive
environment as well as the relationships with clients. Indeed, in the era of Big Data, social networks, mobile
applications, and various recent technologies allow the collection of massive amounts of data in real-time at a low
cost. It has therefore become crucial for fashion retailers to optimize the exploitation of this data, extracted from their
information systems or from social networks, in order to retrieve relevant information for the various decision-making
processes such as the optimization of the assortment of collections and the quantities to be restocked in stores.
More precisely, within the scope of this thesis, massive data and artificial intelligence tools are used to answer
the problems of fashion trends detection and sales forecasting, in different contexts. The proposed model relies on
different types of data to predict short-term trends and demands: (i) Internal company data such as historical
transactional data and data from previous collections, and (ii) External data from social networks, such as images and
texts from different sources. The methodology developed is composed of three steps. First, the extraction and
processing of data from social networks allow the identification and quantification of the most relevant fashion trends.
Secondly, historical transactional data from within the company is used to establish sales forecasts by taking into
account the influence of factors controlled by the company such as commercial actions, price variations, sales periods,
etc. Finally, the detected fashion trends are integrated with the previously established sales forecasts in order to more
accurately predict future demands, and consequently, evaluate the usefulness of heterogeneous data analysis for
fashion demand forecasting. The proposed model can be used to forecast store replenishments of current products
and/or to generate a short-term supply of new products. The proposed model is implemented and evaluated on real
data from a French ready-to-wear retailer.

Keywords: Data Analysis, Trends' detection, Artificial Intelligence, Demand forecasting, Big Data, Fashion
industry.

170

Vous aimerez peut-être aussi