Thse Mnassri
Thse Mnassri
Thse Mnassri
net/publication/281184194
CITATIONS READS
0 82
1 author:
Baligh Mnassri
Aix-Marseille Université
15 PUBLICATIONS 189 CITATIONS
SEE PROFILE
All content following this page was uploaded by Baligh Mnassri on 08 April 2017.
CITATIONS READS
0 113
1 author:
Baligh Mnassri
Aix-Marseille Université
15 PUBLICATIONS 55 CITATIONS
SEE PROFILE
All content following this page was uploaded by Baligh Mnassri on 08 April 2017.
THÈSE
présentée et soutenue publiquement le 12 octobre 2012
pour l’obtention du
par
Baligh MNASSRI
Composition du jury
Je n’oublie pas dans mes remerciements tous ceux et celles qui ont contribué à la
réussite de ces travaux, en particulier, Madame Bouchra ANANOU, Maı̂tre de Conférences
à l’Université d’Aix-Marseille.
Je remercie mes amis et mes collègues de laboratoire, pour l’ambiance conviviale qu’ils
ont contribuée à entretenir, les bons moments passés en leur compagnie ainsi que leur
sympathie.
Enfin, je ne saurais oublier de trop remercier mes parents pour leur soutien le long de
ce parcours.
i
ii
À mes très chers parents.
À ma femme et mon petit Yamène.
À mon frère et mes sœurs.
iii
iv
Table des matières
Références personnelles xi
Notations xiii
Introduction générale
1 Contexte et objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2 Organisation du rapport de thèse . . . . . . . . . . . . . . . . . . . . . . . 3
Chapitre 1
Supervision, surveillance et diagnostic
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Supervision des processus . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 Concepts associés à la supervision des processus . . . . . . . . . . . 7
1.2.2 Les étapes de la supervision . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Théorie de la surveillance et du diagnostic . . . . . . . . . . . . . . . . . . 10
1.3.1 La surveillance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2 Diagnostic de défauts . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.3 Critères de performance pour la détection et le diagnostic . . . . . . 14
1.4 Techniques statistiques pour la détection et le diagnostic . . . . . . . . . . 15
1.4.1 Cartes de contrôle univariées . . . . . . . . . . . . . . . . . . . . . . 15
1.4.2 Limitations des cartes univariées . . . . . . . . . . . . . . . . . . . 20
1.4.3 Extensions multivariées des cartes univariées . . . . . . . . . . . . . 21
1.4.4 Méthodes de projection . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.4.5 Interprétations des situations hors contrôle . . . . . . . . . . . . . . 25
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
v
Table des matières
Chapitre 2
Modélisation par analyse en composantes principales
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2 Analyse en composantes principales linéaire . . . . . . . . . . . . . . . . . 29
2.3 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.1 Modélisation en absence de bruit . . . . . . . . . . . . . . . . . . . 34
2.3.2 Modélisation en présence de bruit . . . . . . . . . . . . . . . . . . . 36
2.4 Détermination d’une structure optimale du modèle ACP . . . . . . . . . . 36
2.4.1 Critères de la théorie de l’information . . . . . . . . . . . . . . . . . 36
2.4.2 Critères heuristiques . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.3 Minimisation de la variance de l’erreur de reconstruction . . . . . . 41
2.5 Etude comparative des différents critères . . . . . . . . . . . . . . . . . . . 45
2.5.1 Présentation et interprétation de l’exemple simulé . . . . . . . . . . 46
2.5.2 Interprétations des critères basés sur des seuils . . . . . . . . . . . . 48
2.5.3 Interprétations des critères minimisés . . . . . . . . . . . . . . . . . 51
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Chapitre 3
Contribution au choix d’un modèle optimal par la variance non recons-
truite
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.2 Détection et détectabilité de défauts . . . . . . . . . . . . . . . . . . . . . 64
3.2.1 Détectabilité généralisée de défauts . . . . . . . . . . . . . . . . . . 64
3.2.2 Influence de la modélisation sur la détectabilité de défauts . . . . . 71
3.3 Différentes variances non reconstruites . . . . . . . . . . . . . . . . . . . . 73
3.3.1 Principe de la reconstruction unidimensionnelle . . . . . . . . . . . 73
3.3.2 Variance non reconstruite généralisée . . . . . . . . . . . . . . . . . 74
3.3.3 Comportements des différents critères VNR . . . . . . . . . . . . . 76
3.4 Nouveaux critères VNR . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.4.1 VNR utilisant un nouvel indice combiné . . . . . . . . . . . . . . . 81
3.4.2 Changement de représentation des données . . . . . . . . . . . . . . 83
3.5 Résultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
vi
Chapitre 4
Théorie d’un diagnostic de défauts par ACP
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.2 Isolation et isolabilité de défauts par reconstruction . . . . . . . . . . . . . 98
4.2.1 Généralisation de l’isolation et l’isolabilité de défauts . . . . . . . . 98
4.2.2 Analyse d’isolabilité par reconstruction de l’indice combiné versus
celles de SPE et T2 de Hotelling . . . . . . . . . . . . . . . . . . . 105
4.3 Diagnostic de défauts simples par les contributions . . . . . . . . . . . . . 107
4.3.1 Contributions par décomposition complète : CDC . . . . . . . . . . 109
4.3.2 Contributions par décomposition partielle : PDC . . . . . . . . . . 109
4.3.3 Contributions diagonales : DC . . . . . . . . . . . . . . . . . . . . . 112
4.3.4 Contributions par reconstruction : RBC . . . . . . . . . . . . . . . 112
4.3.5 Contributions par angle : ABC . . . . . . . . . . . . . . . . . . . . 113
4.3.6 Analyse de diagnosticabilité . . . . . . . . . . . . . . . . . . . . . . 113
4.4 Nouvelles approches pour un diagnostic de défauts multiples . . . . . . . . 115
4.4.1 Contributions par reconstruction multidimensionnelle . . . . . . . . 116
4.4.2 RBC ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.5 Exemple de synthèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.5.1 Diagnostic d’un défaut simple . . . . . . . . . . . . . . . . . . . . . 122
4.5.2 Diagnostic de défauts multiples . . . . . . . . . . . . . . . . . . . . 123
4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
vii
Table des matières
viii
Table des figures
2.1 Allures des critères de sélection pour l’ensemble A dont les variables sont
entachées par un bruit i.i.d. de variance σ 2 = 0.002 . . . . . . . . . . . . . 49
2.2 Allures des critères de sélection pour l’ensemble B dont les variables sont
entachées par un bruit i.i.d. de variance σ 2 = 0.002 . . . . . . . . . . . . . 49
2.3 Allures des critères de sélection pour l’ensemble C dont les variables sont
entachées par un bruit i.i.d. de variance σ 2 = 0.002 . . . . . . . . . . . . . 50
2.4 Allures des critères de sélection pour l’ensemble D dont les variables sont
entachées par un bruit i.i.d. de variance σ 2 = 0.002 . . . . . . . . . . . . . 50
ix
Table des figures
4.5 Diagnostic du défaut F{3} par différentes méthodes basées sur l’indice SWE 124
4.6 Diagnostic du défaut F{3} par différentes méthodes basées sur l’indice T2 . 125
4.7 Diagnostic du défaut F{3} par différentes méthodes basées sur l’indice ϕ . . 125
4.8 Diagnostic du défaut F{3} par différentes méthodes basées sur l’indice D . 126
4.9 Diagnostic du défaut F{1,7} par différentes méthodes basées sur l’indice SPE 126
4.10 Diagnostic du défaut F{1,7} par différentes méthodes basées sur l’indice SWE 127
4.11 Diagnostic du défaut F{1,7} par différentes méthodes basées sur l’indice T2 127
4.12 Diagnostic du défaut F{1,7} par différentes méthodes basées sur l’indice ϕ . 128
4.13 Diagnostic du défaut F{1,7} par différentes méthodes basées sur l’indice D . 128
4.14 Diagnostic du défaut F{6,8} par différentes méthodes basées sur l’indice SPE 129
4.15 Diagnostic du défaut F{6,8} par différentes méthodes basées sur l’indice SWE 129
4.16 Diagnostic du défaut F{6,8} par différentes méthodes basées sur l’indice T2 130
4.17 Diagnostic du défaut F{6,8} par différentes méthodes basées sur l’indice ϕ . 130
4.18 Diagnostic du défaut F{6,8} par différentes méthodes basées sur l’indice D . 131
x
Références personnelles
Conférences nationales
– B. Mnassri, E.M. El Adel, B. Ananou, and M. Ouladsine. Détection et Identification
de défauts par Analyse en Composantes Principales. In 3èmes Journées Doctorales
/ Journées Nationales MACS, Angers, France, 2009.
– B. Mnassri. Diagnostic de Défauts par Analyse en Composantes Principales. In
6èmes Journées des Doctorants du LSIS, Giens, Hyères, France, 2009.
Conférences internationales
– B. Mnassri, B. Ananou, E.M. El Adel, M. Ouladsine and F. Gasnier. Détection
et localisation de défauts des Wafers par des approches statistiques multivarièes et
calcul des contributions. In Conférence Internationale Francophone d’Automatique,
Bucarest, Romanie, 2008.
– B. Mnassri and E.M. El Adel and M. Ouladsine. Fault Localization Using Principal
Component Analysis Based on a New Contribution to the Squared Prediction Error.
In 16th IEEE Mediterranean Conference on Control and Automation, pages 65–70,
Ajaccio, France, 2008.
– B. Mnassri, E.M. El Adel, B. Ananou, and M. Ouladsine. Fault Detection and
Diagnosis Based on PCA and a New Contribution Plots. In 7th IFAC Symposium
on Fault Detection, Supervision and Safety of Technical Processes, pages 834–839,
Barcelona, Spain, 2009.
– B. Mnassri, E.M. El Adel, B. Ananou, and M. Ouladsine. A Generalized Variance of
Reconstruction Error Criterion for Determining the Optimum Number of Principal
Components. In 18th IEEE Mediterranean Conference on Control and Automation,
pages 868–873, Marrakech, Morocco, 2010.
– B. Mnassri, E.M. El Adel, M. Ouladsine and B. Ananou. Selection of the Number
of Principal Components Based on the Fault Reconstruction Approach Applied to
a New Combined Index. In 49th IEEE Conference on Decision and Control, pages
3307–3312, Atlanta, Georgia, USA, 2010.
– B. Mnassri, E.M. El Adel and M. Ouladsine. New VRE Criterion to Select the Opti-
mum Number of PCs. In 11th International conference on Sciences and Techniques
of Automatic control & computer engineering, pages 1–13, Monastir, Tunisia, 2010.
– B. Mnassri, E.M. El Adel and M. Ouladsine. Une généralisation sur les conditions
xi
Références personnelles
xii
Notations
xiii
Notations
xiv
Introduction générale
1 Contexte et objectifs
L’anticipation et la correction à temps des pannes et des défaillances dues générale-
ment à des anomalies dans les procédés évitent sans doute la baisse de productivité des
processus industriels. En revanche, le moindre dysfonctionnement dans un processus peut
entraı̂ner de lourdes conséquences dans un monde économiquement parlant très concur-
rentiel où la qualité et plus particulièrement le rendement sont des atouts cruciaux. En
l’occurrence, le génie de l’homme qui est au service des besoins de celui-ci a été l’origine
des progrès industriels durant les derniers siècles favorisant pour autant les essors des
industries à risques. Celles-ci présentent des dangers potentiels qui ont plus ou moins dé-
frayé la chronique en émergeant ainsi le monde dans un tourbillonnement de mesures sur
la prévention de tels risques. Outre les enjeux économiques et ceux de la qualité des pro-
duits, il y a en réalité d’autres intérêts plus prioritaires afin d’assurer un fonctionnement
normal de processus. En effet, la détection ou même l’anticipation d’une défaillance au
début de son apparition peut éviter de grands dommages et catastrophes. Par conséquent,
la détection et le diagnostic de défauts des processus industriels représentent un intérêt
capital.
La connaissance profonde de la dynamique des processus est indispensable pour une
interprétation de leurs déréglages. En l’occurrence, les systèmes industriels se complexi-
fient avec l’automatisation des processus ainsi que d’autres facteurs. Malgré la complexité,
ils doivent assurer quand même les fonctions pour lesquelles ils ont été conçus, notam-
ment la sûreté de leur fonctionnement. Les processus complexes se caractérisent par un
environnement ouvert où l’incertitude, l’imprédictibilité et la dynamique des phénomènes
rendent les décisions difficiles (Gentil, 2007). Entre autres, et pour de tels processus ou
ceux de types boites noires, il est souvent compliqué de créer des modèles mathématiques.
Même si la réalisation de tels modèles est possible, les approches analytiques présentent
une description insuffisante des fonctionnements de processus. Néanmoins, les approches
permettant de définir les états de fonctionnement en s’appuyant sur l’analyse statistique
des données de ces processus peuvent jouer un rôle important pour la détection et le
diagnostic des défauts. Ainsi, les statistiques multivariées ont été l’origine de nombreuses
techniques exploitées pour un contrôle statistique.
En effet, les cartes de contrôle sont les outils finaux d’une mise en œuvre d’un contrôle
statistique de processus. Elles permettent la visualisation de l’évolution temporelle d’un
processus afin de détecter les changements susceptibles de modifier ses performances. En
revanche, la dimensionnalité des processus et les colinéarités qui peuvent exister entre les
1
Introduction générale
2
2. Organisation du rapport de thèse
critères ont-ils pris de différentes formes ? Sur quelles hypothèses sont-ils basés et quelles
sont leurs limitations ? Ces dernières sont-elles prouvables mathématiquement et ont-elles
un rapport avec un type particulier de variables ? Existe-t-il un inconvénient commun ?
La modélisation a-t-elle une influence sur la détectabilité de défauts et quelles solutions
pouvons-nous apporter ?
Un diagnostic de défauts par ACP est généralement basé sur deux principales ap-
proches. La première et la plus classique représente le calcul des contributions aux indices
de détection. La deuxième approche est fondée sur le principe de reconstruction de tels
indices. Sous cette optique, nos objectifs s’articulent autour des questions suivantes :
qu’est-ce qu’une contribution et pourquoi a-t-elle été proposée pour des indices particu-
liers et non pas pour d’autres ? Peut-elle garantir un diagnostic correct et pour quels types
de défauts est-elle valable ? Que pouvons-nous proposer comme améliorations ? Dans le
cadre de l’ACP, le concept d’isolabilité de défauts par reconstruction des indices de détec-
tion est négligemment étudié en le développant par reconstruction uniquement de l’indice
SP E. Pour cela, est-il possible d’étendre un tel concept aux autres indices ? Pour quelle
raison ?
La reconstruction aboutit à des indices de détection insensibles aux défauts et ayant
une forme quadratique permettant d’établir des seuils de tolérances pour l’isolation de
défauts complexes. Entre autre, quelques approches de contributions disposent aussi d’une
forme quadratique, ce qui permet d’établir des limites de contrôle. Dans ce cadre, on se
demande si ces limites sont-elles valides ? Sinon, que peut-on envisager comme solution
afin d’isoler les défauts complexes en utilisant le principe de contribution ? Enfin, peut-on
décider laquelle est meilleure pour un diagnostic fiable, l’approche des contributions ou
celle de reconstruction d’indices ?
3
Introduction générale
cadre, quelques critères de choix parmi les plus connus dans la littérature sont étudiés
et comparés les uns aux autres à travers un exemple simulé. Ce chapitre présente deux
démonstrations montrant les limitations de deux critères en concluant également que
le problème souvent rencontré par l’utilisation de tels critères est lié à la présence des
variables indépendantes et quasi-indépendantes.
Le troisième chapitre présente principalement nos contributions dans le choix d’un
modèle ACP en s’appuyant sur le principe de la variance de l’erreur de reconstruction.
Afin de prouver l’importance de la précision dans le choix de la dimension d’un tel modèle,
les concepts de la détection ainsi que la détectabilité de défauts sont introduits. L’objectif
étant de montrer les influences de la modélisation suite à une sous-estimation comme
une surestimation du modèle sur la qualité de la détection de défauts. En essayant de
remédier à l’inconvénient du critère classique de la variance non reconstruite dans le choix
du modèle, plusieurs autres variances sont révélées et analysées théoriquement. Cela a
permis la distinction d’un premier critère empirique suivi par la proposition d’un deuxième
nouveau critère du même principe mais basé sur la variance de l’erreur de reconstruction
d’un nouvel indice combiné. En s’appuyant sur un changement de représentation des
données, un troisième nouveau critère faisant la particularité est également proposé en
établissant théoriquement les conditions de son efficacité. Les performances des différents
critères proposés sont illustrées à travers l’exemple de simulation du deuxième chapitre.
Le quatrième et dernier chapitre est dédié à la théorie d’un diagnostic de défauts par
ACP en s’appuyant plus particulièrement sur deux principales approches telles que les
contributions et la reconstruction des indices de détection. Cette dernière garantit l’iden-
tification de tout type de défauts. Néanmoins, l’isolation de ces défauts n’est garantie que
sous une condition établie à l’aide d’un concept d’isolabilité de défauts. Celui-ci représente
un des principaux objectifs de ce chapitre. Un tel concept est étendu à tous les indices
de détection en permettant l’élaboration d’une analyse théorique d’isolabilité de défauts
par reconstruction de l’indice combiné versus une reconstruction des indices SP E et T 2
de Hotelling. Les contributions sont dédiées au diagnostic des défauts simples. Dans ce
cadre, une nouvelle méthode de contribution par décomposition de l’indice SP E est pro-
posée. Ce chapitre est également enrichi par deux nouvelles approches de contributions
dans l’objectif est de garantir un diagnostic correct de défauts multiples ayant de grandes
amplitudes et l’isolation de défauts plus complexes. Un exemple de synthèse est utilisé
pour appliquer les différentes méthodes proposées.
4
1
Supervision, surveillance et diagnostic
Sommaire
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Supervision des processus . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 Concepts associés à la supervision des processus . . . . . . . . 7
1.2.2 Les étapes de la supervision . . . . . . . . . . . . . . . . . . . . 9
1.3 Théorie de la surveillance et du diagnostic . . . . . . . . . . . 10
1.3.1 La surveillance . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2 Diagnostic de défauts . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2.1 Caractéristiques des défauts . . . . . . . . . . . . . . 12
1.3.2.2 Principe du diagnostic . . . . . . . . . . . . . . . . . . 13
1.3.3 Critères de performance pour la détection et le diagnostic . . . 14
1.4 Techniques statistiques pour la détection et le diagnostic . . 15
1.4.1 Cartes de contrôle univariées . . . . . . . . . . . . . . . . . . . 15
1.4.1.1 Définitions des cartes de contrôle . . . . . . . . . . . . 16
1.4.1.2 Rôle et critères de performance des cartes univariées . 16
1.4.1.3 Aperçu sur les cartes univariées . . . . . . . . . . . . 18
1.4.2 Limitations des cartes univariées . . . . . . . . . . . . . . . . . 20
1.4.3 Extensions multivariées des cartes univariées . . . . . . . . . . 21
1.4.4 Méthodes de projection . . . . . . . . . . . . . . . . . . . . . . 22
1.4.4.1 Intérêt de la projection . . . . . . . . . . . . . . . . . 23
1.4.4.2 Différentes extensions de l’ACP . . . . . . . . . . . . 23
1.4.5 Interprétations des situations hors contrôle . . . . . . . . . . . 25
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5
Chapitre 1. Supervision, surveillance et diagnostic
1.1 Introduction
Dans les processus industriels, la majorité des pannes causant une baisse de la pro-
duction est généralement due à des anomalies dans le procédé qui n’ont pas été corrigées
à temps. En plus des contraintes de la qualité des produits et celles économiques, il y
a plusieurs autres intérêts afin d’assurer un fonctionnement normal pour ces processus.
La détection, ou même l’anticipation d’une défaillance au début de son apparition peut
éviter de grands dommages et catastrophes. Par conséquent, la détection et le diagnostic
des défaillances de processus représentent un intérêt capital.
Pour les processus complexes ou ceux de type boites noires, il est souvent très compli-
qué voire impossible de leur établir des modèles mathématiques. Même si la réalisation de
tels modèles est possible, les approches analytiques présentent toujours une vision insuffi-
sante des fonctionnements des processus (Verron et al., 2008). Une connaissance profonde
de la dynamique de ces processus est un atout primordial pour une interprétation fiable
de leurs déréglages. Dans ce cadre, les approches qui permettent l’identification des états
de fonctionnement en se basant sur l’analyse des informations extraites des données ou
des mesures des processus peuvent apportées une aide avantageuse pour la détection et
le diagnostic de défauts. Plus particulièrement, les approches statistiques sont parmi les
techniques les plus exploitées dans ce contexte.
La surveillance de processus en s’appuyant sur une analyse des mesures a pour but
la détection des variations survenues dans les variables caractéristiques de tels processus.
Pour prendre les actions correctives nécessaires afin d’améliorer le processus, un diagnostic
doit être mené pour l’isolation des défauts causant ces variations. Le principe d’une telle
analyse repose sur une maı̂trise ou un contrôle statistique de processus. Une telle discipline
est la traduction intégrale de celle en anglais statistical process control largement connue
dans la littérature sous l’abréviation du SPC. Le contrôle statistique de processus a été
initié par W.A. Shewhart en 1924 aux Etats-Unis. C’est en étudiant la variabilité des
particules dans des fluides que Shewhart a inventé la célèbre carte de contrôle (Shewhart,
1931). Oubliée depuis, ce n’est qu’à partir des années soixante après la deuxième guerre
mondiale qu’il y a eu réellement regain d’intérêt pour cette discipline, et c’est au Japon
qu’elle a vite pris racine. La maı̂trise statistique de processus a fortement contribué à
l’amélioration de la qualité des produits japonais, ce qui explique entre autre le fabuleux
succès industriel et économique qu’a connu ce pays. Son apparition en Europe débuta à
partir de la fin des années 70, poussée par les effets de la mondialisation, des échanges et
de l’accroissement de la concurrence internationale. Une telle maı̂trise statistique reposait
encore sur des techniques univariées. A cette époque, beaucoup d’améliorations ont été
proposées mais peu de chercheurs s’intéressaient à ces méthodes statistiques. L’activité
de recherche a connu une dynamique très importante à partir des années 80 (Zaı̈di, 1989;
Elbekkaye, 1993).
De nos jours, ces méthodes statistiques sont utilisées dans de nombreux secteurs pour
le contrôle des processus, la détection et la prévention de leurs défauts. Les cartes de
contrôle uni et/ou multivariées sont les outils finaux d’une mise en œuvre d’un contrôle
statistique de processus. Elles servent à visualiser l’évolution temporelle d’un processus
et à détecter les changements susceptibles de modifier ses performances. En revanche,
les corrélations entre les variables ont été une cause principale limitant l’efficacité de
6
1.2. Supervision des processus
l’utilisation de la carte univariée en ouvrant ainsi les portes aux notions multivariées.
La plus célèbre carte de contrôle multivariée est celle de la T 2 de Hotelling (Hotelling,
1947). Le contrôle multivarié a la capacité de combiner des mesures multidimensionnelles
en une seule mesure de performance. Néanmoins, la dimensionnalité des processus et
les colinéarités qui peuvent exister entre les variables limitent également l’efficacité en
termes de détection et d’isolation de défauts par l’interprétation directe de telle carte. La
réduction de la dimension de l’espace des variables en utilisant les méthodes de projection
comme l’analyse en composantes principales peut révéler des informations cachées mieux
interprétables et exploitables.
Ce chapitre tracera, dans la deuxième et la troisième section, les principaux concepts
définissant la supervision et plus particulièrement la surveillance et le diagnostic de pro-
cessus. La quatrième section présentera un sommaire des approches statistiques ainsi que
leurs extensions et évolutions pour la détection et le diagnostic. L’objectif de cette sec-
tion est de mettre en contexte l’intérêt de l’utilisation des méthodes de projection, en
particulier l’analyse en composantes principales linéaire et ses extensions.
7
Chapitre 1. Supervision, surveillance et diagnostic
8
1.2. Supervision des processus
}
Défaut
Défaillance Anomalies
Normal Panne
}
Signe
Observations
Symptôme
Figure 1.1 – Ordonnancement des anomalies selon leur criticité (Adrot, 2000)
9
Chapitre 1. Supervision, surveillance et diagnostic
Supervision
Acquisition Actions
mesures
Processus
semble des étapes que peut inclure. Dans ce cadre, la littérature a offert plusieurs propo-
sitions. Comme exemple, Breuker et Van De Velde (1994) ont fourni une large perspective
en suggérant que les étapes d’une supervision se succèdent en une chaı̂ne de planification,
prédiction, surveillance, diagnostic et affectation des tâches pour le contrôle du processus
et la manipulation des dispositifs. Néanmoins, il y a quelques tâches infaisables en ligne.
Ainsi, Acosta et al. (2001) ont encore utilisé une représentation plus différente en pro-
posant une supervision dite globale constituée de huit étapes fondamentales qui sont : la
surveillance, le diagnostic, l’évaluation d’état, le mode de fonctionnement, le pronostic, la
planification, l’interface HM et la validation des données.
Malgré la diversité des propositions, le plus souvent la supervision prend en compte
trois étapes principales, notamment la surveillance, le diagnostic et la reconfiguration (ou
prise de décision). Ces étapes peuvent être assurées par des algorithmes (machines) comme
par un ou plusieurs opérateurs humains.
L’étape de la surveillance (ou monitoring) traite les données recueillies en ligne afin
d’obtenir l’état de fonctionnement du processus. En présence des anomalies, le diagnostic
consiste à estimer leurs causes afin que des actions de corrections soient prises (reconfi-
guration). Dans ce contexte, la figure 1.2 présente un schéma récapitulatif retraçant les
principales étapes de la supervision d’un processus.
10
1.3. Théorie de la surveillance et du diagnostic
mise en œuvre de méthodes spécifiques. Par exemple, si seules des données entrée/sortie
sont disponibles sur le système, une méthode par apprentissage semblera naturellement
adaptée, par contre si un modèle mathématique est disponible, les méthodes analytiques
pourront être privilégiées.
1.3.1 La surveillance
La surveillance d’un système a pour objectif de déceler les comportements qui diffèrent
d’un fonctionnement normal. De manière générale, les méthodes de surveillance peuvent
être classées en deux catégories : celles pour qui seules les données acquises sur le processus
considéré permettant de caractériser son mode de fonctionnement et celles basées sur un
modèle décrivant le comportement du système à surveiller. Face à la complexité plus
particulièrement des grands systèmes, la surveillance se doit être robuste vis-à-vis des
incertitudes et erreurs qui entachent tant les modèles que les données.
Le rôle de la surveillance est de veiller sur les évolutions du comportement du sys-
tème et de collecter des informations pertinentes pour la prise de décisions dans le cas
d’une défaillance. Elle joue donc un rôle clef dans la phase d’exploitation des systèmes en
regroupant ainsi deux principales fonctions. Le suivi du système a pour objectif l’acqui-
sition de ses données. Ces dernières sont utilisées pour la reconstitution de l’état réel du
système. A partir de l’analyse en temps réel de données recueillies en ligne, la surveillance
nécessite donc une prise de décision rapide et implique, de ce fait, une prise en compte
impérative du facteur temps. La fonction du suivi maintient en permanence un historique
des traitements effectués ainsi qu’une trace des événements observés par la supervision.
En plus de l’acquisition de données, la deuxième fonction qui est la détection consiste
essentiellement à révéler la présence d’un défaut. Ceci implique qu’une telle fonction per-
met de déterminer la normalité ou l’anormalité du fonctionnement de processus. En outre,
elle peut être également révélatrice du moment de l’apparition de l’événement défectueux
(Isermann et Ballé, 1997; Fortuna et al., 2006).
11
Chapitre 1. Supervision, surveillance et diagnostic
La première question que l’on se pose, lorsque l’on conçoit une démarche du diagnostic,
est de savoir ce que l’on veut détecter, c’est-à-dire de définir le type de dysfonctionnement
que l’on veut diagnostiquer et donc les défauts susceptibles d’altérer le bon fonctionnement
du système. Un défaut est défini comme une déviation non autorisée d’au moins une
propriété caractéristique d’une variable de son comportement acceptable. Par conséquent,
le défaut est un événement qui peut mener au dysfonctionnement du système. Dans ce
cadre, l’étude des caractéristiques des défauts a abouti à une distinction entre leurs classes,
types et formes (Isermann, 1997, 2005; Fortuna et al., 2006).
Pour le diagnostic, la façon dont les défauts agissent sur le système (défauts additifs
ou multiplicatifs) revêt un intérêt particulier. Ces classes de défauts sont aussi désignées
dans la littérature de la surveillance par les termes de défauts paramétriques (pour les
défauts multiplicatifs) et non paramétriques (pour les défauts additifs) :
• Défauts additifs : ce sont représentés par des signaux d’entrées du système. Ces
entrées sont inconnues et non contrôlées ;
• Défauts multiplicatifs : désignent un changement de la valeur d’un paramètre du
système (constante de temps d’un capteur par exemple).
Les défauts sont des événements qui apparaissent à différents endroits du système.
Cela a fait l’objet d’une distinction des types de défauts en fonction de leur localisation
ou de leurs sources :
• Défauts capteurs : ce type des défauts est la cause d’une mauvaise image de l’état
physique du système. Un défaut capteur partiel produit un signal avec plus ou moins
d’adéquation avec la valeur vraie de la variable à mesurer. Ceci peut se traduire par
une réduction de la valeur affichée par rapport à la valeur vraie, ou de la présence
d’un biais ou de bruit accru empêchant une bonne lecture. Un défaut capteur total
produit une valeur qui n’est pas en rapport avec la grandeur à mesurer ;
• Défauts actionneurs : ces défauts agissent au niveau de la partie opérative et dété-
riorent le signal d’entrée du système. Ils représentent une perte totale (défaillance)
ou partielle d’un actionneur agissant sur le système. Un exemple de perte totale
d’un actionneur est un actionneur qui est resté bloqué sur une position entraı̂nant
une incapacité à commander le système par le biais de cet actionneur. Les défauts
actionneurs partiels sont des actionneurs réagissant de manière similaire au régime
nominal mais en partie seulement, c’est-à-dire avec une certaine dégradation dans
leur action sur le système (perte de puissance d’un moteur, fuite dans un vérin,
etc.) ;
• Défauts composants ou systèmes : ce type des défauts provient du système lui-même ;
bien souvent les défauts n’appartenant pas à un défaut capteur ou actionneur sont
classés de manière arbitraire dans cette catégorie. Néanmoins, un défaut compo-
sant résulte de la casse ou de l’altération d’un composant du système réduisant les
capacités de celui-ci à effectuer une tâche. En pratique, ceci revient à considérer
une modification des caractéristiques du système proprement dit (une chaufferie est
cassée, un roulement est altéré, etc.).
On peut également citer d’autres types de défauts comme les défauts de l’unité de
traitement ou de commande et les défauts qui sont dus à l’opérateur humain. Qu’il s’agisse
12
1.3. Théorie de la surveillance et du diagnostic
des défauts inhérents aux capteurs, aux actionneurs ou aux composants du système, ils se
manifestent tous par une altération des signaux associés.
L’évolution temporelle des défauts mène à la distinction entre quatre formes tels que
les biais, les dégradations, les dérives et les points aberrants. Généralement, un biais cor-
respond à un saut brutal (brusque) du signal. Cependant, une dérive se manifeste par
une évolution anormale lente et continue du signal donc un éloignement progressif de sa
valeur nominale. Ainsi, les phénomènes de dérive sont plus longs à détecter du fait de
leur faible amplitude à l’origine et de leur lente évolution. En revanche, les dégradations
prennent souvent des valeurs aléatoires et n’obéissent à aucune loi de distribution. Les va-
leurs aberrantes sont des défauts dits fugitifs. Ces derniers affectent le système de manière
instantanée et leur cause est souvent due à un parasite, par exemple une perturbation élec-
tromagnétique. Les valeurs aberrantes correspondent à un écart important par rapport à
la valeur nominale du signal.
13
Chapitre 1. Supervision, surveillance et diagnostic
14
1.4. Techniques statistiques pour la détection et le diagnostic
manière indiscernable. En s’appuyant sur tous ces facteurs, l’isolabilité peut être définie
comme suit :
• L’isolabilité est la capacité du diagnostic à remonter directement à l’origine de la
défaillance. Cette dernière engendre souvent une cascade d’alarmes et il peut être
difficile de remonter au composant défaillant. Par conséquent, le degré d’isolabilité
des défaillances est lié à la structure des résidus rendus disponibles et à la méthode
mise en œuvre.
D’autres critères sont également à prendre en considération. Les coûts économiques
contraignent généralement la démarche adoptée pour un diagnostic. Les contraintes posées
ont pour objectif d’apporter des réponses à quelques interrogations comme : le diagnostic
nécessite-t-il des composants trop chers pour sa réalisation, le temps de développement
est-il trop important ? En effet, autant de points à vérifier afin de satisfaire le cahier des
charges.
15
Chapitre 1. Supervision, surveillance et diagnostic
pour le contrôle d’un processus font appel à la théorie de l’échantillonnage afin de savoir
si le processus a probablement dérivé en moyenne ou en dispersion. Dans ce contexte, il
convient tout d’abord de choisir une ou plusieurs caractéristiques représentant la qualité
du produit à contrôler. Pour chacune des caractéristiques retenues, un échantillon doit
être constitué périodiquement dans des conditions fixées à l’avance. Les résultats obte-
nus sur ces échantillons sont résumés par une ou plusieurs valeurs appelées statistiques
d’échantillon pouvant être par exemple la moyenne, l’écart type ou l’étendue. Ces statis-
tiques peuvent alors être portées sur un tracé, appelé carte de contrôle, où l’on reporte
généralement les statistiques d’échantillon par rapport à des limites de contrôle. La carte
de contrôle a été largement utilisée pour distinguer les causes des variations. Ainsi, un
point sur cette carte représente l’état du processus à un moment donné.
16
1.4. Techniques statistiques pour la détection et le diagnostic
LS de Contrôle (3 sigma)
LS de Surveillance (2 sigma)
Cible
Observations (Temps)
17
Chapitre 1. Supervision, surveillance et diagnostic
18
1.4. Techniques statistiques pour la détection et le diagnostic
l’ensemble ou une partie des observations à des instants antérieurs à t comme le cas des
cartes CUSUM, MA et EWMA.
Les cartes CUSUM ont été initialement introduites par Page (1954). Elles sont parmi
les méthodes les plus efficaces, en accord avec les propriétés de leurs ARL, dans la détection
d’un changement d’ampleur connue dans la moyenne (Basseville et Nikiforov, 1993). En
effet, elles utilisent toutes les observations considérées durant l’échantillonnage. La carte
CUSUM consiste à représenter pour chaque variable la somme cumulée suivante :
t
X
(xi (k) − µi ) (1.1)
k=1
19
Chapitre 1. Supervision, surveillance et diagnostic
20
1.4. Techniques statistiques pour la détection et le diagnostic
x1
UCL
x2
Cible
LCL
Observations (Temps) Observations (Temps)
Cible
UCL
LCL
21
Chapitre 1. Supervision, surveillance et diagnostic
22
1.4. Techniques statistiques pour la détection et le diagnostic
L’analyse en composantes principales est une étape clé pour une surveillance multiva-
riée de processus. Son efficacité dépend du modèle statistique généré qui dépend également
des données collectées. L’approche classique de l’ACP utilise un calcul préliminaire de la
moyenne des données et de leur matrice de covariance. La moyenne et la variance sont
sensibles à la présence de valeurs aberrantes. Ainsi, les résultats obtenus s’avèrent sou-
vent inexploitables car trop biaisés par l’influence de ces valeurs aberrantes. Pour tolérer
la présence de ces dernières, une ACP robuste peut être conduite en calculant une matrice
23
Chapitre 1. Supervision, surveillance et diagnostic
de covariance des données robuste (Chen et al., 1996; Hubert et al., 2005; Tharrault et al.,
2008).
Une autre extension possible de l’ACP est la prise en compte de la production par lots
(procédé batch). En effet, l’ACP classique fait la supposition que le procédé est stricte-
ment continu. Or, dans l’industrie, il est fréquent de trouver des procédés de fabrication
fonctionnant par lots. La technique la plus étudiée pour traiter ce genre de problème
est l’ACP multiéchelle (multiway PCA) (Nomikos et MacGregor, 1994; Nomikos, 1996;
Smilde et al., 2004). L’ACP multiéchelle est une extension à trois dimensions de l’ACP
classique. Les trois dimensions représentent respectivement les observations, les instants
d’observations et les lots (le raisonnement pour l’ACP classique n’est fait que sur deux
dimensions : les observations et les instants d’observations).
Le suivi de la performance des processus continus en utilisant des méthodes de projec-
tion multivariées comme l’ACP est étendu à des situations où les processus peuvent être
naturellement subdivisés en des sous-blocs. En effet, l’ACP multi-bloc (Kourti et al., 1995;
Qin et al., 2001; Cherry et Qin, 2006) permet d’établir des cartes de suivi pour chacun
des blocs ainsi que pour l’ensemble du processus. Quand un événement ou un défaut se
produit, l’utilisation de l’ACP multi-bloc peut détecter l’événement plus tôt en révélant
le bloc dans lequel l’événement est produit. Dans la même optique, l’ACP offre une autre
possibilité par l’utilisation des modèles partiels. On sous entend par ACP partielle, une
ACP effectuée sur des données collectées en écartant quelques variables. Les résidus géné-
rés pour la détection de défauts sont donc sensibles uniquement aux défauts associés aux
variables utilisées (Huang et al., 2000).
L’ACP classique est une méthode de projection linéaire où seules les dépendances li-
néaires ou quasi-linéaires entre les variables peuvent être révélées. Si les données traitées
présentent des comportements fortement non linéaires, l’ACP linéaire est incapable de
trouver une représentation compacte décrivant ces données. Par conséquent, l’extension
de l’ACP aux problèmes non linéaires a été abordée dans la littérature. Les réseaux neu-
ronaux ainsi que les fonctions noyaux peuvent bien être adaptés pour résoudre ce type de
problèmes.
Une nouvelle méthode d’ACP non linéaire basée sur une couche d’entrée de réseau de
neurones a été proposée par Jia et al. (1998), conjointement avec des cartes de contrôle non
paramétriques. Un autre algorithme d’ACP non linéaire utilisant les réseaux neuronaux
et les ondelettes a été proposé par Shao et al. (1999) pour le suivi des performances de
processus. En effet, la plupart des approches utilisent les réseaux de neurones MLP pour
l’obtention du modèle ACP non linéaire. Néanmoins, on rencontre souvent des problèmes
d’optimisation non linéaires telles que la convergence et l’initiation de ce type de réseaux.
Pour cette raison, Harkat (2003) et Harkat et al. (2007) ont proposé une approche d’ACP
non linéaire où le problème d’apprentissage se ramène à un problème de régression linéaire,
ainsi qu’un algorithme permettant de déterminer le nombre de composantes non linéaires
à retenir dans le modèle.
Une ACP à noyaux non linéaires à été initialement proposée par Schölkopf et al.
(1998). On peut calculer les composantes principales de manière efficace dans un espace
de dimension plus élevée lié à l’espace d’entrée par certaines fonctions noyaux. Une ACP
linéaire est ensuite appliquée sur les données projetées dans le nouvel espace (Lee et al.,
2004; Choi et al., 2005; Sun et al., 2007). L’ACP à noyaux peut être considérée comme
24
1.4. Techniques statistiques pour la détection et le diagnostic
une généralisation de l’ACP linéaire et particulièrement adaptée pour extraire des carac-
téristiques non linéaires de données. Néanmoins, un problème persistant dans le cadre de
l’ACP à noyaux réside dans le choix de la fonction noyau.
25
Chapitre 1. Supervision, surveillance et diagnostic
1.5 Conclusion
Dans ce chapitre, nous avons présenté les différents concepts et définitions sur lesquels
se basent généralement la surveillance et le diagnostic de défauts d’un système. Parmi les
approches existantes dans la littérature, nous sommes plus particulièrement intéressés à
celles basées sur une analyse de données. Nous avons présenté des notions, très générales,
concernant les cartes de contrôle. Ainsi, nous avons évoqué la nécessité de l’application
des techniques relevant du contrôle statistique multivarié afin d’assurer le contrôle des
processus qui ne disposent pas d’un modèle mathématique qui soit complet. Nous avons
présenté, d’une manière non exhaustive, quelques unes des cartes de contrôle multivariées
les plus utilisées. Malgré leurs avantages par rapport aux cartes de contrôle univariées, un
problème très important qui reste à résoudre est la manière d’identifier la variable ou les
variables responsable(s) d’un fonctionnement anormal de processus.
Le nombre de variables surveillées dans un système ainsi que la corrélation limitent le
choix des méthodes utilisées pour l’obtention d’un diagnostic fiable. Dans ce cas, les mé-
thodes de projection peuvent être utilisées, en particulier l’ACP qui a l’avantage d’élaborer
un nombre réduit de cartes de contrôle ce qui peut faciliter l’analyse. Pour l’identification
des variables responsables de défauts, les méthodes de contributions ainsi que celle de
reconstruction sont liées aux paramètres de modèle ACP. Par conséquent, la fiabilité de
la détection et du diagnostic de défauts en s’appuyant sur l’ACP est principalement basée
sur l’optimalité de tel modèle. Dans le chapitre suivant, nous allons décrire plus en détail
l’approche d’ACP ainsi que la problématique liée au choix de modèle.
26
2
Modélisation par analyse en composantes
principales
Sommaire
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2 Analyse en composantes principales linéaire . . . . . . . . . . 29
2.3 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.1 Modélisation en absence de bruit . . . . . . . . . . . . . . . . . 34
2.3.2 Modélisation en présence de bruit . . . . . . . . . . . . . . . . 36
2.4 Détermination d’une structure optimale du modèle ACP . . 36
2.4.1 Critères de la théorie de l’information . . . . . . . . . . . . . . 36
2.4.2 Critères heuristiques . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.2.1 Critère IE . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.2.2 Pourcentage cumulé de la variance . . . . . . . . . . . 38
2.4.2.3 Scree Test . . . . . . . . . . . . . . . . . . . . . . . . 38
2.4.2.4 Critère de Guttman . . . . . . . . . . . . . . . . . . . 39
2.4.2.5 Autocorrélation . . . . . . . . . . . . . . . . . . . . . 40
2.4.2.6 Validation croisée . . . . . . . . . . . . . . . . . . . . 40
2.4.3 Minimisation de la variance de l’erreur de reconstruction . . . . 41
2.4.3.1 Critère VNR . . . . . . . . . . . . . . . . . . . . . . . 42
2.4.3.2 Consistance théorique du critère VNR . . . . . . . . . 43
Cas de bruit i.i.d. . . . . . . . . . . . . . . . . . . . . . . 44
Cas de bruit coloré . . . . . . . . . . . . . . . . . . . . . 45
2.5 Etude comparative des différents critères . . . . . . . . . . . . 45
2.5.1 Présentation et interprétation de l’exemple simulé . . . . . . . 46
2.5.2 Interprétations des critères basés sur des seuils . . . . . . . . . 48
2.5.3 Interprétations des critères minimisés . . . . . . . . . . . . . . 51
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
27
Chapitre 2. Modélisation par analyse en composantes principales
2.1 Introduction
L’Analyse en Composantes Principales (ACP) est une méthode statistique multivariée
qui permet d’extraire les corrélations d’un ensemble de données à travers un ensemble de
fonctions empiriques orthogonales. Elle représente une méthode descriptive permettant
d’étudier les relations linéaires entre les variables sans tenir compte a priori d’une quel-
conque structure (Jolliffe, 2002). Ses origines historiques peuvent être remontées jusqu’aux
œuvres de E. Beltrami en Italie (1873) et C. Jordan en France (1874) puisque ce sont eux
qui ont formulé la décomposition en valeurs singulières (SVD) d’une matrice carrée (Cinar
et al., 2007). Cependant, la première application pratique de l’ACP peut être attribuée
au travail de Pearson (1901) en biologie, puis elle a été de nouveau développée et forma-
lisée par Hotelling (1933). Ensuite, elle est devenue une technique multivariée standard
(Jackson, 1991; Jolliffe, 2002).
Depuis les années 1970, de nombreux travaux ont proposé d’utiliser l’ACP comme
une technique de modélisation de processus à partir de laquelle un modèle ACP peut
être obtenu (Kresta et al., 1991; MacGregor et Kourti, 1995; Jolliffe, 2002). Ce modèle
est extrait en se basant sur un ensemble de données qui sont issues d’un fonctionnement
normal. Il permet d’estimer les variables ou les paramètres du processus à surveiller.
Ainsi, il peut être utilisé pour détecter les valeurs aberrantes dans les données, fournir la
réconciliation de données et surveiller les écarts par rapport à un fonctionnement normal.
L’utilisation fréquente de l’ACP dans plusieurs domaines s’est justifiée par sa réduc-
tion des données caractérisant un espace de grande dimension en un ensemble de com-
posantes principales (CPs) constituant un sous-espace de dimension réduite. Cependant,
l’optimalité d’une telle réduction réside dans la détermination du nombre de CPs les plus
significatives. Dans ce cadre, plusieurs critères et règles ont été proposés dans la littérature
afin de définir la dimension optimale d’un modèle ACP (Jackson, 1991; Valle et al., 1999;
Jolliffe, 2002). D’une façon non exhaustive, Jolliffe (2002) distingue selon son point de vue
trois différentes catégories de critères.
La première famille constitue des critères empiriques ou heuristiques dont la justifi-
cation de leur utilisation, malgré quelques tentatives pour les mettre sur une base plus
formelle, reste subjective comme le pourcentage de la variance totale ou également le test
du coude (Scree Test) proposé par Cattell (1966). Contrairement, la fonction d’imbedded
error (IE) de Malinowski (1977) et beaucoup d’autres critères qui proviennent générale-
ment de la communauté de la chimiometrie disposent des règles de décision plus objec-
tives et simples. Ces règles se basent souvent sur la minimisation d’un critère par rapport
au nombre des CPs. En revanche, la subjectivité s’exprime dans la théorie du critère
lui-même. La deuxième catégorie représente des approches basées sur une série de tests
d’hypothèses qui sont généralement très sophistiquées et surestiment souvent la dimen-
sion du modèle. A titre d’exemple, Bartlett (1954) et Lawley (1956) ont développé une
méthode dont le problème confronté est associé au choix des niveaux des seuils pour les
différents tests. La troisième catégorie constitue des critères basés sur des méthodes de
calculs intensifs comme la validation croisée qui permet le calcul d’un critère dit PRESS
(Wold, 1978; Eastment et Krzanowski, 1982). En effet, ce critère est fondé sur la capacité
prédictive des différents modèles ACP.
Notamment, la littérature a offert une autre catégorie de critères qu’on ne peut pas
28
2.2. Analyse en composantes principales linéaire
ignorer. Une telle catégorie intitulée la théorie de l’information est principalement issue
du domaine du traitement du signal. Notamment, elle est constituée de deux critères qui
sont communément connus sous les noms d’Akaike Information Criterion (AIC, Akaike
(1973)) et Minimum Description Lenght (MDL, Schwarz (1978) et Rissanen (1978)).
Différemment aux principes des critères classiques, de nouvelles approches proposent
de définir un modèle ACP afin d’assurer une meilleure détection et localisation des défauts
plutôt que d’offrir une meilleure approximation des données. Pour obtenir le modèle ACP
le plus sensible à un défaut, Wang et al. (2004) ont proposé d’utiliser un indice prenant
en compte l’amplitude minimale du défaut nécessaire afin d’assurer sa détection. Notam-
ment, cette approche nécessite une connaissance a priori sur les défauts. Plus récemment,
Tamura et Tsujita (2007) ont proposé une procédure permettant de définir la dimension
d’un modèle ACP en fonction des directions des défauts afin de leur offrir une meilleure
sensibilité. Puisque ces directions sont généralement inconnues, les mêmes auteurs sug-
gèrent de définir plusieurs modèles ACP. Par conséquent, une telle approche semble être
plus pratique en considérant uniquement les défauts simples. Cependant, elle est difficile-
ment utilisable dans le cas de défauts multiples où un grand nombre de modèles doivent
être considérés.
Le critère qui représente un intérêt majeur dans nos travaux de recherche se base sur
la minimisation de la variance de l’erreur de reconstruction également appelée la variance
non reconstruite (VNR) (Dunia et Qin, 1998b,c,a; Qin et Dunia, 2000). Son expression
représente la variance en fonction du nombre de CPs, de la différence entre une mesure
observée et son estimée obtenue en utilisant l’ensemble des mesures des autres variables.
En effet, nous montrerons que ce critère aide à identifier le nombre des axes principaux
uniquement entre les variables qui sont linéairement corrélées.
Ce chapitre présentera un rappel du principe mathématique de l’ACP linéaire dans
la deuxième section. Etant donné que cette méthode est considérée comme un outil de
modélisation, la problématique souvent confrontée lors de son utilisation représente le
choix de la dimension du modèle ACP. Pour cela, la troisième section définira quelques
propriétés liées à la détermination d’un modèle ACP en absence puis en présence de bruit.
Dans la pratique, le bruit de mesures ne peut pas être négligé, ce qui compliquera la
détermination de la structure optimale du modèle. Dans ce contexte, la quatrième section
présentera quelques critères de sélection parmi les plus connus dans la littérature. Ensuite,
une étude comparative des critères choisis sera présentée dans l’avant dernière section. Ceci
en considérant un exemple de synthèse. A travers ce dernier, nous contribuons par deux
démonstrations montrant les limitations de deux critères. Finalement, nous concluons ce
chapitre.
29
Chapitre 2. Modélisation par analyse en composantes principales
système étudié. Ces données peuvent être représentées par une matrice
X = [x(1), · · · , x(N )]T ∈ RN ×m (2.1)
où N représente le nombre des observations et m représente le nombre des variables
mesurées. Chaque ligne de la matrice de données X représente une observation sous forme
d’un vecteur de mesures collectées à un instant k, généralement centrées
x(k) = [x1 (k), · · · , xm (k)]T ∈ Rm (2.2)
où xj (k) avec j = {1, · · · , m} représente la mesure de la variable j à l’instant k. Par
définition, la matrice de covariance est donnée par :
1
Σ = E xxT = XT X ∈ Rm×m
(2.3)
N
Selon le principe de l’ACP, on suppose qu’un vecteur de composantes t̂ ∈ R` est
associé à chaque vecteur d’observation dont il optimise la représentation au sens de la
minimisation de l’erreur d’estimation de x ou la maximisation de la variance de t̂. A
chaque instant k, les vecteurs t̂ et x sont liés par une transformation linéaire de type
t̂(k) = P̂ T x(k) telle que la matrice de transformation P̂ ∈ Rm×` vérifie la condition
d’orthogonalité P̂ T P̂ = I` ∈ R`×` .
Les colonnes de la matrice P̂ sont les vecteurs d’une base orthonormée d’un sous-espace
`
R de représentation réduite des données initiales. La transformation linéaire se traduit
par la projection des données originelles exprimées dans un espace de dimension m vers
un sous-espace orthogonal de dimension `. Les composantes tj (k) avec j = {1, · · · , `}
du vecteur t̂(k) sont les projections des éléments du vecteur de données x(k) dans le
sous-espace R` .
L’optimisation de la représentation en se basant sur la matrice de projection P̂ est
obtenue par la minimisation de l’erreur quadratique d’estimation de x. Notons par P̂ la
matrice optimale de représentation, celle-ci peut être donnée par :
n o
P̂ = arg min Je (P̂ ) (2.4)
P̂
où Je représente le critère de l’erreur d’estimation par ACP qui devrait être minimisé.
Sous la contrainte d’orthogonalité de la matrice de projection P̂ , nous pouvons écrire :
2
2 T
Je (P̂ ) = E kx − x̂k = E x − P̂ P̂ x
T n o
T T
= E x − P̂ t̂ x − P̂ t̂ = E x x − t̂ t̂
n T
o n T o
= E tr xxT − t̂ t̂ = tr {Σ} − E t̂ t̂
30
2.2. Analyse en composantes principales linéaire
Pour déterminer les vecteurs colonnes de la matrice P̂, on note par t ∈ R la projection
du vecteur de données x le long d’une direction représentée par un vecteur unitaire p ∈ Rm .
La composante t est obtenue par le produit scalaire t = xT p = pT x sous la contrainte
kpk2 = pT p = 1. Notamment, elle représente une nouvelle variable ayant une moyenne et
une variance qui dépendent des propriétés statistiques de x comme suit :
E {t} = E pT x = pT E {x} = 0
(2.8)
= E pT x xT p = pT E xxT p
= pT Σp (2.9)
L(p, λ) = Jv (p) − λ pT p − 1 = pT Σp − λ pT p − 1
(2.10)
où Det {.} représente le déterminant d’une matrice carrée. Im est la matrice identité
d’ordre m. Les solutions de l’équation précédente représentent les valeurs propres de Σ.
A chaque valeur propre λ est associé un vecteur propre p vérifiant (Σ − λIm )p = 0.
Ceci permet d’avoir m vecteurs propres pi associés aux m valeurs propres λi de la ma-
trice Σ vérifiant ainsi la relation Σpi = λi pi avec i = {1, · · · , m}. Sous forme matricielle,
une telle relation mène à écrire ce qui suit :
ΣP = PΛ (2.13)
31
Chapitre 2. Modélisation par analyse en composantes principales
La notation sous forme matricielle nous permet de définir la matrice des CPs comme
suit :
T = [t(1), · · · , t(N )]T = XP ∈ RN ×m (2.18)
La détermination du vecteur de données x(k) à partir du vecteur associé des CPs t(k)
est donnée par :
Xm
x(k) = Pt(k) = pj tj (k) (2.19)
j=1
La réduction des données est réalisée à travers les ` premières CPs ayant les plus
grandes variances. En conséquence, les ` premiers vecteurs propres forment le sous-espace
vectoriel réduit pour les données initiales. L’estimation x̂(k) du vecteur de données x(k)
dans ce sous-espace réduit (souvent appelé sous-espace de représentation ou principal et
noté Ŝ) est donnée par :
T
x̂(k) = P̂t̂(k) = P̂P̂ x(k) = Ĉx(k) (2.20)
où la matrice optimale de représentation exprimée dans l’équation (2.7) est définie comme
suit :
P̂ = [p1 , · · · , p` ] ∈ Rm×` (2.21)
32
2.3. Propriétés
T
t̂(k) = P̂ x(k) ∈ R` représente le vecteur des ` premières CPs. La matrice Ĉ ∈ Rm×m
caractérise ainsi le modèle ACP.
Toutefois, la réduction de dimension engendre généralement une perte d’informations
qui sont récupérées dans un vecteur résiduel x̃(k). Ce dernier est exprimé dans un sous-
espace résiduel S̃ constitué par le reste des CPs associées aux (m − `) derniers vecteurs
propres :
T
x̃(k) = P̃t̃(k) = P̃P̃ x(k) = C̃x(k) (2.22)
avec
P̃ = p`+1 , · · · , pm ∈ Rm×(m−`)
(2.23)
et
T
C̃ = P̃P̃ = Im − Ĉ (2.24)
La matrice C̃ ∈ Rm×m décrit le modèle résiduel. On entrevoit ici que l’ACP est une
approche de modélisation permettant ainsi l’obtention d’un modèle ACP d’un système
étudié.
L’interprétation du principe de la modélisation par ACP représente un partitionnement
de l’espace Rm des mesures x(k) en un sous-espace principal Ŝ et un sous-espace résiduel
S̃. Par conséquent, le vecteur de mesures x(k) est décomposé comme suit :
2.3 Propriétés
Généralement, la présence de bruit de mesures est inévitable dans les données. Sous
l’hypothèse de l’absence de perturbations et de défauts, il est possible de considérer que
le vecteur x est perturbé par un bruit v ∈ Rm de moyenne nulle :
33
Chapitre 2. Modélisation par analyse en composantes principales
ˆ
où Λ̊ ∈ Rq×q représente la matrice diagonale composée des q valeurs propres non nulles :
ˆ
Λ̊ = diag{λ̊1 , · · · , λ̊q } (2.32)
λ̊` , avec ` = {1, · · · , q}, décrit la variance de la `ème CP des données étudiées en
l’absence de bruit de mesures. D’après l’équation (2.31), on peut déduire ce qui suit :
˜ ˜
P̊T Σ̊P̊ = 0(m−q) ∈ R(m−q)×(m−q) (2.33)
Ainsi, la substitution de la matrice Σ̊ par son expression donnée dans (2.29) mène à
la relation suivante :
˜ T ˜ ˜ T ˜
P̊T X̊ X̊ P̊ = X̊ P̊ X̊ P̊ = 0(m−q) (2.34)
34
2.3. Propriétés
35
Chapitre 2. Modélisation par analyse en composantes principales
Ainsi, Anderson (1963) a montré que les vecteurs propres des matrices Σ et Σ̊ sont
identiques. Pour ` = q CPs, il est alors possible d’exprimer la matrice C̃ comme suit :
˜˜
C̃ = P̊ P̊T (2.45)
Par conséquent, le vecteur résiduel ainsi que celui estimé d’une observation bruitée
x(k) sont respectivement exprimés de la manière suivante :
et
x̂(k) = Ĉ (x̊(k) + v(k)) (2.47)
En présence de bruit i.i.d., le modèle ACP est constitué de q CPs. Dans ce cas et
d’après l’équation (2.46), les données sans bruit ne sont pas projetées dans le sous-espace
résiduel. En effet, ce dernier ne peut contenir que le bruit de mesures. Cependant, le
sous-espace principal peut contenir les données non bruitées ainsi que le bruit.
36
2.4. Détermination d’une structure optimale du modèle ACP
nombre des signaux non corrélés. En effet, un vecteur d’observation peut être modélisé
comme une superposition d’un nombre fini de signaux noyés dans un bruit additif. L’ob-
jectif est d’identifier ces signaux. Sous l’hypothèse que le bruit de mesures est i.i.d., sa
variance doit correspondre aux plus petites valeurs propres de la matrice de covariance. En
se basant sur le principe de la vraisemblance, deux critères AIC (Akaike, 1973) et MDL
(Rissanen, 1978) et (Schwarz, 1978) ont été proposés puis reformulés et adaptés par Wax
et Kailath (1985) afin d’être utiles dans le choix du nombre des CPs significatives. En
effet, le nombre des signaux non corrélés à identifier doit correspondre aux minima des
critères AIC et MDL dont les expressions sont respectivement données par :
2.4.2.1 Critère IE
L’analyse factorielle est une méthode conçue pour résoudre les problèmes multidi-
mensionnels. Elle exprime un ensemble de données sous forme d’une somme linéaire des
produits de fonctions. Ainsi, une réduction est réalisée afin de reproduire ces données à
partir d’un sous-espace composé uniquement des variables latentes significatives qui ont
été déterminées par l’analyse factorielle. Notamment, la première étape dans le processus
de cette méthode fait appelle à l’ACP qui consiste à déterminer ce nombre de facteurs
cachés. Puisque la reproduction des données engendre nécessairement des erreurs, Mali-
nowski (1977) distingue trois types d’erreurs qui sont : real error (RE), imbedded error
37
Chapitre 2. Modélisation par analyse en composantes principales
38
2.4. Détermination d’une structure optimale du modèle ACP
Ce critère présente une allure décroissante en `. Son principe est fondé sur l’idée
que la variance résiduelle devrait atteindre un état stationnaire lorsque les CPs ignorées
ressemblent à des erreurs aléatoires. Ainsi, le nombre des CPs à retenir est relatif au
premier point d’inflexion détecté sur la courbe.
On observe le graphique du critère PVR et on ne retient que les valeurs qui se trouvent
à gauche du point d’inflexion. Graphiquement, on part des composantes qui se trouvent
à droite, apportant le moins d’informations. On relie par une droite les points presque
alignés et on ne retient que les CPs qui sont au dessus de cette ligne. La mise en œuvre de
cette méthode est relativement facile, cependant dans certains cas il est difficile de trouver
un point d’inflexion ou le coude si la courbe décroı̂t lentement.
KG(`) = λ` (2.55)
Chaque CP retenue dans le modèle ACP contribue par sa variance. Ainsi, sa contri-
bution est considérée significative si elle dépasse la moyenne totale, sinon elle devrait être
écartée. Cette idée est justifiée par Guttman (1954) afin de fournir une borne inférieure
pour le nombre des variables latentes représentatives en considérant une matrice de cor-
rélation. Plus intuitivement, l’argument a été avancé afin d’exprimer qu’aucune CP dont
la variance est inférieure à celle d’une variable originelle ne peut être considérée comme
représentative.
La popularité du critère KG, par rapport à d’autres plus opérationnels et mieux jus-
tifiables, apparaı̂t plus particulièrement dans sa simplicité d’utilisation. Dans un cadre
d’une étude par simulation, Yeomans et Golder (1982) ont examiné de plus près le com-
portement de ce critère afin de montrer l’ampleur probable des erreurs introduites par son
utilisation sans précautions. Le seul cas où ce critère est efficace semble bien être lorsque
le nombre des composantes représentatives est beaucoup moins inférieur que celui des
variables originelles. Ainsi, la proportion de la variance de chaque variable, expliquée par
les CPs retenues, doit être élevée.
39
Chapitre 2. Modélisation par analyse en composantes principales
2.4.2.5 Autocorrélation
L’autocorrélation est une méthode qualitative proposée pour le choix d’un modèle
ACP. Généralement, les allures des CPs les plus significatives doivent être lisses tandis que
les autres liées principalement aux bruits présentent des fluctuations rapides et aléatoires.
Dans ce cadre, Shrager et Hendler (1982) ont proposé la fonction d’autocorrélation du
premier ordre comme une mesure quantitative de ce comportement :
N −1
E{t` (k)t` (k + 1)} 1 X
AC(`) = = t(k, `)t(k + 1, `) (2.56)
Var{t` (k)} (N − 1)λ` k=1
où t(k, `) représente la kème valeur de la `ème colonne de la matrice des CPs notée T
dans l’équation (2.18).
Lorsqu’une CP est significative, son autocorrélation sera importante car il y aura
certainement une corrélation entre ses éléments qui correspondent aux différentes obser-
vations. En revanche et si elle est principalement associée à un bruit de mesures, peu de
corrélation est attendue entre ses éléments qui sont fortement aléatoires. Par conséquent,
son autocorrélation sera relativement faible. D’après Shrager et Hendler (1982), une valeur
d’autocorrélation supérieure à 0.5 indique que la CP correspondante est significative. Dans
le cas contraire, la composante en question est constituée principalement de bruit. Dans
ce cas, elle ne devrait pas être incluse dans le model. Le choix de la valeur d’un tel seuil est
considérablement arbitraire, ce qui représente l’inconvénient de ce critère. En outre, une
CP ayant une grande variance peut correspondre à une faible valeur d’autocorrélation, ce
qui lui risque d’être exclue du modèle.
(`)
où x̂i (k) représente la prédiction de xi (k), qui correspond à la kème mesure de la ième
variable, en utilisant un modèle ACP constitué de ` CPs.
Toutefois, on distingue dans la littérature deux façons différentes pour le calcul de ce
critère, car la manière de la prédiction proposée par Wold (1978) diffère de celle proposée
par Eastment et Krzanowski (1982). Indépendamment de cette différence, il est important
40
2.4. Détermination d’une structure optimale du modèle ACP
de mentionner que ce critère présente une complexité dans son implémentation ainsi qu’un
coût de calcul important.
Par ailleurs, Besse et Ferré (1993) ont montré théoriquement que l’usage du critère
PRESS n’apporte pas une règle de décision plus objective que les critères heuristiques.
Sous l’hypothèse que le nombre d’observations considérées est très important, un déve-
loppement de Taylor a permis à ces auteurs de montrer que la quantité PRESS peut être
approximée comme suit :
m
1 X
PRESS(`) ≈ λ (2.58)
m a=`+1 a
Ce critère est alors décroissant en `. Par conséquent, l’idée d’identifier la CP qui
correspond au minimum de PRESS ne peut servir dans le choix d’un modèle ACP. En
outre, ce critère est équivalent à ceux prenant simplement la part de la variance résiduelle
en particulier le critère PVR. Tandis que, Wold (1978) et Eastment et Krzanowski (1982)
ont également proposé l’investigation d’autres critères issues de la quantité PRESS qui
sont respectivement le ratio R et le critère W. L’utilisation des ces derniers pour le
choix de la dimension d’un modèle ACP est basée sur une comparaison de leurs valeurs à
des seuils jugés arbitraires dans la littérature limitant par conséquence de leurs efficacités.
Malgré la célébrité de la validation croisée, cette dernière n’est plus considérée avantageuse
par rapport aux restes des critères heuristiques. Pour cette raison, elle ne présentera pas
l’objectif de notre étude dans ce chapitre.
41
Chapitre 2. Modélisation par analyse en composantes principales
où fˆj (k) est l’estimée de f (k) dans la direction de la jème variable. En effet, l’estimation de
l’amplitude f est optimale par minimisation de l’erreur quadratique résiduelle kC̃xj (k)k2
comme suit :
n o
fˆj (k) = arg min kC̃xj (k)k2
f (k)
42
2.4. Détermination d’une structure optimale du modèle ACP
Dans le but d’éviter les problèmes d’échelles des variances non reconstruites, il est
important de pondérer chaque σj2 par ξjT Σξj qui représente la variance originelle de la
jème variable. Evidemment, si les variables étudiées sont réduites alors ξjT Σξj = 1.
Le choix d’un modèle ACP en se basant sur ce critère s’est justifié par une sélection
du nombre optimal (`op ) des CPs offrant la meilleure reconstruction. Autrement dit, `op
doit assurer une variance non reconstruite minimale :
`op = arg min {VNR(`)} (2.65)
`
43
Chapitre 2. Modélisation par analyse en composantes principales
Cas de bruit i.i.d. D’après (2.44), la matrice des valeurs propres, en présence d’un
bruit de mesures i.i.d. de variance σ 2 , peut être introduite de la façon suivante :
" #
ˆ 2
2
Λ = Λ̊ + σ Im = Λ̊ + σ Iq 0 (2.71)
0 σ 2 I(m−q)
ˆ
où Λ̊ et Λ̊ sont données respectivement par les équations (2.31) et (2.32).
T
Pour ` ≥ q, on a ξjT C̃ΣC̃ξj = σ 2 ξjT P̃P̃ ξj ce qui implique que la variance non recons-
truite de la jème variable peut s’exprimer comme suit :
σ2
σj2 (`) = T
∀`≥q (2.72)
ξjT P̃P̃ ξj
σ2
σj2 (q) = T
(2.73)
ξjT P̃q P̃q ξj
d’où
arg min {VNR(`)} = q ∀`≥q (2.79)
`
Cette égalité prouve que le critère VNR ne surestime plus la dimension d’un modèle
ACP en présence de bruit i.i.d.
Par ailleurs et dans le cas où ` < q, la matrice des vecteurs propres P̃q sera englobée
dans P̃ comme suit :
P̃ = p`+1 , · · · , pq , P̃q pour ` < q (2.80)
44
2.5. Etude comparative des différents critères
Cas de bruit coloré Il semblerait que l’hypothèse qui consiste à considérer que le
bruit est blanc ne soit pas toujours adaptée. Il se peut qu’on préfère modéliser le bruit
différemment en le colorant i.e. soit en relâchant la contrainte que les variances sont
identiques soit que le bruit est indépendant, soit les deux. Dans la pratique, les variances
du bruit ne sont pas nécessairement identiques. Dans ce cas, la matrice des valeurs propres
prend la forme suivante :
2 2
Λ = diag{λ1 , λ2 , · · · , λq , σq+1 , · · · , σm } (2.83)
où les σi2 sont les variances du bruit. En suivant le même principe que celui du cas de
bruit i.i.d., Valle et al. (1999) ont montré que le critère VNR atteint son minimum à
` = q CPs si :
2 T
σq+1 ξjT P̃q P̃q ξj
2
≤ T
pour ` ≥ q (2.84)
σm ξ T P̃P̃ ξ j j
et
T !
ξjT P̃P̃ ξj 2
λq ≥ 1+ T
σq+1 pour ` < q (2.85)
ξjT P̃q P̃q ξj
L’interprétation de la première inégalité implique que l’étendue des variances du bruit
doit être faible ce qui implique également que ces variances doivent avoir des valeurs très
proches. Cependant, la deuxième condition indique que la qème CP qui est la dernière
supposée être théoriquement retenue doit avoir une variance au moins deux fois plus
supérieure que celle de la (q + 1)ème CP.
45
Chapitre 2. Modélisation par analyse en composantes principales
k
x̊1 (k) = 3 + exp(cos( 15π ))
1 k
x̊2 (k) = cos( 2πk ) sin( 2π )
x̊3 (k) = arctan(50πk) log(1 + x̊2 (k)2 )
x̊4 (k) = x̊1 (k) + 3x̊2 (k)
x̊5 (k) = x̊1 (k) − x̊2 (k)
x̊6 (k) = x̊1 (k) + x̊3 (k)
x̊7 (k) = x̊2 (k) + 3x̊3 (k)
10 π
x̊8 (k) = π arctan(tan( 200 (k − 100)))
x̊9 (k) = 10 cos(7πk)
x̊10 (k) = 2x̊8 (k) + x̊9 (k)
x̊11 (k) = −2x̊8 (k) + 3x̊9 (k)
x̊12 (k) = x̊2 (k) + x̊8 (k)
x̊13 (k) = (2 + cos(0.2πk))−1
40 9π
x̊14 (k) = π cos(7πk) arctan(tan( 200 (k − 900)))
x̊15 (k) = sgn(sin(0.007πk))
Σ̊ = E x̊x̊T x̊(k) = [x̊1 (k), · · · , x̊13 (k)]T ∈ R13
où, à l’instant k (2.87)
B
Σ̊ = E x̊x̊T x̊(k) = [x̊1 (k), · · · , x̊14 (k)]T ∈ R14
où, à l’instant k (2.88)
C
46
2.5. Etude comparative des différents critères
Σ̊ = E x̊x̊T x̊(k) = [x̊1 (k), · · · , x̊15 (k)]T ∈ R15
où, à l’instant k (2.89)
D
47
Chapitre 2. Modélisation par analyse en composantes principales
Table 2.3 – Valeurs propres des matrices de corrélation des quatre ensembles de variables
en absence du bruit de mesures et pour N = 1500 observations
maux des CPs qui constituent les modèles ACP dans chaque ensemble étudié de variables,
doivent correspondre aux nombres des valeurs propres non nulles du tableau 2.3.
Les courbes des critères étudiés pour la sélection du nombre des CPs dans les ensembles
de variables A, B, C et D dont chacun est constitué de 1500 observations, sont illustrées
respectivement par les figures 2.1, 2.2, 2.3 et 2.4. On note que les critères AIC, MDL, IE
et VNR sont exprimées en coordonnées semi-logarithmique afin que leurs courbes soient
mieux lisibles. Notamment, une majorité des critères étudiés est basée sur des données
initialement normalisées donc en utilisant les valeurs propres des matrices de corrélation.
Néanmoins, les critères AIC, MDL et IE utilisent des données non réduites puisqu’ils
ont été définis valables uniquement avec les valeurs propres des matrices de covariance.
48
2.5. Etude comparative des différents critères
0
2 4 6 8 10 12 2 4 6 8 10 12
100
80
2 4 6 8 10 12 2 4 6 8 10 12
43
60
40
4536"#
0
20 10
0
2 4 %$'&)6(+*-,/./021 8 10 12 2 4 %$'&)6(+*-,/./021 8 10 12
Figure 2.1 – Allures des critères de sélection pour l’ensemble A dont les variables sont
entachées par un bruit i.i.d. de variance σ 2 = 0.002
0
2 4 6 8 10 12 2 4 6 8 10 12
100
80
2 4 6 8 10 12 2 4 6 8 10 12
43
60
2
40 10
20 4536"#
0
2 4 %6$'&)(+*-,/./8021 10 12 2 4 %6$'& ( *-,/./8021 10 12
Figure 2.2 – Allures des critères de sélection pour l’ensemble B dont les variables sont
entachées par un bruit i.i.d. de variance σ 2 = 0.002
49
Chapitre 2. Modélisation par analyse en composantes principales
0
2 4 6 8 10 12 14 2 4 6 8 10 12 14
80
2 4 6 8 10 12 14 2 4 6 8 10 12 14
43
60
2
40 10
20 4:3;"#
0
2 4 %6 $'&)(+*-,/8./021 10 12 14 2 4 56 $6&7(8*,/8./091 10 12 14
Figure 2.3 – Allures des critères de sélection pour l’ensemble C dont les variables sont
entachées par un bruit i.i.d. de variance σ 2 = 0.002
0.8
0.6
4
0.4 10
0.2
0
2 4 6 8 10 12 14 2 4 6 8 10 12 14
0
2 4 6 8 10 12 14 2 4 6 8 10 12 14
80
2 4 6 8 10 12 14 2 4 6 8 10 12 14
80 43 10
5
60
40
20 4536"#
0
2 4 %$'&)(+8*-,/./021 10
6 12 14 2 4 %$'& ( 8-* ,/./021 10
6 12 14
Figure 2.4 – Allures des critères de sélection pour l’ensemble D dont les variables sont
entachées par un bruit i.i.d. de variance σ 2 = 0.002
50
2.5. Etude comparative des différents critères
51
Chapitre 2. Modélisation par analyse en composantes principales
peut ne pas exprimer continuellement le même minimum pour chaque critère. Pour cette
raison, chaque jeu de données a été simulé 1500 fois afin d’exprimer en pourcentage le
nombre des CPs retenues par chaque critère.
Le tableau 2.4 illustre les pourcentages des CPs retenues par les critères considérés
pour des jeux de données dont chacun est composé de N = 1500 observations. En re-
joignant les remarques données par Wax et Kailath (1985), ce tableau prouve que le
critère AIC surestime souvent le nombre des CPs. Pour un bruit i.i.d. de faible variance
(σ 2 = 0.002), le minimum d’un tel critère correspond dans 76.80%, 74.33%, 78.53% et
75.26% des réalisations à 5, 6, 7 et 8 CPs respectivement dans les ensembles A, B, C et D.
Malgré la légère variance du bruit considéré, ce critère a retenu dans approximativement
25% des cas des nombres de CPs supérieures à ceux nécessaires. Par conséquent, son in-
convénient se manifeste dans la surestimation de la structure du modèle. L’augmentation
de la variance du bruit modifie les relations entre les variables en causant certainement
l’apparition de nouvelles variables indépendantes. A ce stade, il est difficile de connaı̂tre
les nombres optimaux de CPs dans les jeux de données qui correspondent aux deux autres
variances du bruit. Cependant, et d’après les pourcentages exprimés dans le tableau 2.4,
le comportement du critère AIC est toujours fluctuant.
D’après le même tableau, nous remarquons que le critère VNR présente avec 100% des
réalisations un minimum pour 5 CPs dans les ensembles A, B, C et D qui correspondent
aux deux premiers cas des variances du bruit qui sont respectivement σ 2 = 0.002 et
σ 2 = 0.2. En revanche, ce critère indique avec plus de 97% un nombre de 4 CPs dans tous
les ensembles des variables en considérant un bruit de variance plus forte σ 2 = 0.5.
Puisque le premier cas présente des données entachées par un bruit de faible variance,
il peut être considéré comme une référence pour l’évaluation des critères étudiés car on
sait a priori les nombres optimaux des CPs dans chaque ensemble. Dans ce cas, le critère
VNR a défini correctement le nombre optimal des CPs uniquement dans l’ensemble A. En
investiguant la transition réalisée entre les ensembles étudiés, nous remarquons l’existence
d’une variable indépendante ou quasi-indépendante qui s’ajoute à chaque transition d’un
ensemble à l’autre dans le sens de A vers D. Notamment, les variables indépendantes
conservent leurs indépendances quelle que soit la valeur de la variance du bruit i.i.d.
En considérant cette propriété ainsi que les résultats exprimés par le tableau 2.4, on peut
déduire que le critère VNR ne prend pas en compte ce type des variables. Cette déduction
a été illustrée à travers un exemple simulé par Mnassri et al. (2010a). Néanmoins, elle n’a
pas été prouvée ou montrée théoriquement dans la littérature. Dans le cadre de cette thèse,
nous proposons dans l’annexe A une démonstration théorique prouvant la limitation du
critère VNR dans la sélection des CPs en présence des variables indépendantes et quasi-
indépendantes.
Une telle démonstration justifie les pourcentages donnés par ce critère dans le tableau
2.4 lors du premier cas de la variance du bruit. En augmentant cette variance (σ 2 = 0.2),
nous remarquons que le critère VNR maintient les mêmes résultats. Toutefois, l’augmen-
tation d’une telle variance peut causer l’apparition de variables indépendantes. Originel-
lement, l’ensemble A ne contient pas ce type de variables. Si les résultats de ce critère
sont inchangés en faisant varier la variance du bruit (σ 2 = 0.2), cela ne peut pas nier
la possibilité de leur apparition dans A puisqu’un tel critère est prouvé insensible à leur
présence.
52
Ensemble A Ensemble B Ensemble C Ensemble D
Critère : AIC MDL IE VNR AIC MDL IE VNR AIC MDL IE VNR AIC MDL IE VNR
Bruit i.i.d. :
σ 2 = 0.002
5 CPs (%) 76.80 100 100 100 100 100 100
6 CPs (%) 18.40 74.33 100 100
7 CPs (%) 03.93 20.26 78.53 100 100
8 CPs (%) 00.60 04.53 16.46 75.26 100 100
9 CPs (%) 00.13 00.53 03.46 19.93
10 CPs (%) 00.13 00.26 01.00 03.66
Bruit i.i.d. :
σ 2 = 0.2
5 CPs (%) 77.73 100 100 100 00.33 79.60 100 100 100 100
6 CPs (%) 17.80 76.73 20.40 00.33 79.06 100
7 CPs (%) 03.06 17.80 76.00 20.93 00.20 79.53 100
8 CPs (%) 00.80 03.60 19.53 78.06 20.46
9 CPs (%) 00.46 01.40 03.20 17.40
10 CPs (%) 00.13 00.13 00.73 03.40
Bruit i.i.d. :
σ 2 = 0.5
4 CPs (%) 97.20 97.66 98.20 98.20
5 CPs (%) 75.73 100 100 02.80 47.00 100 100 02.33 01.80 01.80
6 CPs (%) 19.40 42.13 45.80 100 100
7 CPs (%) 03.53 08.53 41.86 44.93 100 100
8 CPs (%) 00.80 01.86 10.00 42.46
9 CPs (%) 00.33 00.46 01.80 10.40
10 CPs (%) 00.53 01.86
Table 2.4 – Pourcentage, par rapport à 1500 réalisations, des nombres de CPs retenues dans les ensembles des données par
les critères minimisés (N = 1500 observations générées selon trois différents cas de bruit i.i.d.)
53
2.5. Etude comparative des différents critères
Chapitre 2. Modélisation par analyse en composantes principales
54
2.5. Etude comparative des différents critères
posées être retenues dans les ensembles étudiés selon les différentes variances du bruit.
Indépendamment des critères utilisés, les ensembles de variables A, B, C et D disposent
respectivement de 5, 6, 7 et 8 CPs dans les trois différents cas du bruit i.i.d.
D’après le tableau 2.4, le critère IE retient avec une certitude de 100% un nombre
approprié de CPs pour chaque ensemble de variables et dans les différents cas du bruit.
En effet, il a correctement défini les nombres optimaux des CPs pour tous les ensembles
de variables durant le premier cas qui correspond à un du bruit de faible variance. Excep-
tionnellement, ce critère a manqué une CP dans les ensembles B, C et D pour les deux
autres cas où la variance du bruit est plus élevée. Plus particulièrement, la CP manquée
se déclare dans l’ensemble B entaché d’un bruit de variance σ 2 = 0.2. En absence de ce
dernier, nous rappelons que l’ensemble B se distingue par rapport à A par la variable in-
dépendante x̊13 (voir tableaux 2.2 et 2.3). Puisque ce critère a convenablement déterminé
le nombre des CPs dans l’ensemble A avec le même bruit, la CP manquée doit nécessaire-
ment correspondre à cette variable indépendante x̊13 . En s’appuyant sur cette déduction,
nous nous interrogeons alors sur la raison pour laquelle le critère IE a retenu les autres
variables indépendantes dans le reste des ensembles.
Nous notons que Malinowski (1977) a montré qu’un tel critère est monotone croissant
en ` en se limitant à l’intervalle [q, m − 1] où q désigne le nombre théorique des CPs
supposées être retenues. Cependant, cela n’implique pas nécessairement que le minimum
de ce critère correspond à q CPs pour toutes valeurs de ` ∈ [1, m − 1]. Pour cette raison,
nous avons établi dans l’annexe B une condition nécessaire et suffisante garantissant le
minimum de ce critère à q CPs. Théoriquement, le critère IE ne surestime pas la dimension
du modèle. Par contre, il peut abandonner quelques CPs dont les valeurs propres en
absence du bruit de mesures ne satisfont pas la condition établie (annexe B).
Avec des données non réduites, la variable indépendante x̊13 abandonnée par ce critère
dispose en l’absence du bruit d’une variance de 0.25. Ainsi, il a été supposé que q = 6
CPs dans l’ensemble B entaché d’un bruit i.i.d. de variance σ 2 = 0.2. En considérant ces
paramètres, nous pouvons prouver que la variance de la variable abandonnée ne satisfait
pas la condition établie par l’inégalité (B.6) dans l’annexe B. De la même manière, nous
pouvons vérifier également que cette variable n’est plus en mesure d’être retenue par le
critère IE non seulement dans l’ensemble B mais également dans C et D pour les deux
cas des variances du bruit (σ 2 = 0.2 et σ 2 = 0.5).
Puisque le critère IE ne surestime pas le nombre des CPs, cela justifie notre raison-
nement par l’apparition d’une variable indépendante qui n’a pas pu être retenue par le
critère VNR dans l’ensemble A contenant un bruit de variance σ 2 = 0.5.
Dans le premier cas qui correspond à un bruit i.i.d. de faible variance (σ 2 = 0.002),
le critère MDL exprime dans 100% des réalisations les nombres corrects de CPs pour
tous les ensembles de données (tableau 2.4). L’investigation du deuxième cas, caractérisé
par un bruit de variance σ 2 = 0.2, montre que ce critère a défini convenablement le
nombre théorique des CPs uniquement dans l’ensemble A. Dans le reste des ensembles, il
a exprimé avec 79% des nombres manquant une CP par rapport aux nombres théoriques
prévus. Dans le troisième cas du bruit, le critère a totalement manqué une CP dans
les ensembles B, C et D. En comparant les résultats de ce critère avec ceux donnés par
IE, nous remarquons que la CP non retenue par MDL est également liée à la variable
indépendante x̊13 .
55
Ensemble A Ensemble B Ensemble C Ensemble D
Critère : AIC MDL IE VNR AIC MDL IE VNR AIC MDL IE VNR AIC MDL IE VNR
Bruit i.i.d. :
σ 2 = 0.002
5 CPs (%) 76.66 100 100 100 100 100 100
Chapitre 2. Modélisation par analyse en composantes principales
56
2.5. Etude comparative des différents critères
Table 2.7 – Pourcentage, par rapport à 1500 réalisations, des nombres de CPs retenues
dans les ensembles des données par le critère MDL (N = 26000 observations générées
selon trois différents cas de bruit i.i.d.)
Néanmoins, Wax et Kailath (1985) ont montré que le nombre des CPs sélectionnées par
le critère MDL converge vers le nombre optimal en considérant un nombre d’observations
N assez important. Dans un premier temps, nous avons reconsidéré les mêmes ensembles
des variables avec les mêmes variances bu bruit mais pour un nombre d’observations N =
6000. Ainsi, nous avons refait le calcul des pourcentages des nombres de CPs retenues par
les critères étudiés (tableau 2.6). Ce calcul a été réalisé en considérant 1500 réalisations.
La comparaison des résultats du tableau 2.6 à ceux du tableau 2.4 ne montre pas
d’améliorations particulières aux niveaux des sélections par les critères AIC, IE et VNR.
Toutefois, le critère MDL a été remarquablement influencé par l’augmentation du nombre
d’observations en assurant avec une performance de 100% le nombre adéquat des CPs
dans tous les ensembles de variables entachées par un bruit de variance σ 2 = 0.2. Pour
le cas d’une variance σ 2 = 0.5, ce critère manque encore la CP posant le problème du
départ dans les ensembles B, C et D. Par contre, nous remarquons que les pourcentages
de sélection ont quand même subi une très légère modification suite à l’augmentation
du nombre d’observations. Malgré que ces observations soient largement suffisantes pour
décrire correctement le comportement du système étudié, il semblerait encore insuffisantes
pour que le critère MDL définisse correctement le nombre adéquat des CPs.
Dans ce cadre, nous avons augmenté le nombre d’observations à une valeur très im-
portante N = 26000. Les nouveaux pourcentages obtenus pour le critère concerné sont
affichés dans le tableau 2.7. D’après ce dernier, nous remarquons que le critère MDL
converge dans 98% des réalisations vers les nombres souhaités des CPs dans le cas d’un
bruit de variance σ 2 = 0.5. Pour les deux premiers cas du bruit, le critère atteint son
optimal avec un nombre d’observations N moins inférieur.
Il est ainsi clair que la performance du critère MDL est proportionnelle au nombre
d’observations. Dans la pratique, on dispose généralement d’un nombre fini d’observations.
Par conséquent, l’utilisation d’un tel critère malgré son efficacité prometteuse ne garantit
57
Chapitre 2. Modélisation par analyse en composantes principales
pas la convergence vers le nombre convenable des CPs. Si les observations disponibles sont
insuffisantes pour ce critère, ce dernier abandonne généralement les CPs qui correspondent
aux variables indépendantes ou quasi-indépendantes ayant de faibles variances.
2.6 Conclusion
Le principe mathématique d’une ACP des données sans bruit de mesures nous a permis
d’avoir une idée claire sur la définition d’une structure optimale d’un modèle ACP. Dans
la pratique, la détermination d’une telle structure n’est pas assez simple qu’on l’imagine
à cause de la présence du bruit dans les données. En se référant aux critères de choix de
la structure adaptée du modèle ACP qui existent dans la littérature, nous avons choisi
d’une manière non exhaustive quelques critères parmi les plus connus pour une évaluation
de leur performance sur un exemple simulé. Selon le principe d’utilisation de ces critères,
nous avons distingué deux principales familles.
La première présente des critères heuristiques qui se basent généralement sur des seuils
pour la sélection du nombre optimal des CPs tels que l’autocorrélation (AC), le critère de
Kaiser-Guttman (KG), le pourcentage cumulé de la variance (PCV) et le pourcentage
de la variance résiduelle (PVR). Dans ce chapitre, ces critères ont été utilisés sur des
données normalisées. Nous avons conclu à travers l’exemple de simulation qu’une décision
basée sur les deux critères PCV et PVR se complique avec l’augmentation du nombre
de variables étudiées ainsi que la variance du bruit. En effet, les allures des courbes
représentant les valeurs propres peuvent devenir très lentes, ce qui favorise l’inexistence
du point d’inflexion pour le critère PVR. Ceci implique également une multitude des
nombres de CPs dans l’intervalle de sélection pour le critère PCV. Quant à la décision
basée sur le critère KG, on constate qu’elle est discriminante car elle a éliminé les variables
indépendantes et quasi-indépendantes. En ce qui concerne le critère AC, son inconvénient
se résume principalement dans le fait qu’une CP significative peut avoir une faible valeur
d’autocorrélation qui ne lui permis pas d’être retenue par un tel critère. Malgré leurs
popularités, ces critères sont subjectifs et largement restreints en termes de décisions et
efficacités respectivement.
La deuxième famille est constituée des critères qui se basent sur la minimisation pour
déterminer la dimension du modèle ACP. Les trois premiers critères, notamment AIC,
MDL et IE possèdent deux points communs. Premièrement, leur utilisation n’est valable
qu’avec des données non réduites. Deuxièmement, le bruit de mesures est supposé être
indépendant et identiquement distribué. Le quatrième critère de cette famille représente la
variance non reconstruite (VNR). Ce dernier peut être utilisé aussi bien sur des données
réduites ou non réduites. Dans le cadre d’une ACP, il est cependant préférable que les
données soient exprimées dans la même échelle. Nous avons étudié le comportement du
critère VNR en considérant des données normalisées car il est en relation directe avec les
paramètres fournis par l’ACP.
Puisque les bruits de mesures représentent des variables aléatoires, une seule simulation
ne permet pas de juger l’efficacité de ces critères. Pour cette raison, nous avons établi des
pourcentages sur les nombres des CPs retenues par tous les critères en considérant 1500
réalisations. Ainsi, notre étude comparative a pris en compte plusieurs facteurs tels que
58
2.6. Conclusion
59
Chapitre 2. Modélisation par analyse en composantes principales
60
3
Contribution au choix d’un modèle optimal
par la variance non reconstruite
Sommaire
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.2 Détection et détectabilité de défauts . . . . . . . . . . . . . . . 64
3.2.1 Détectabilité généralisée de défauts . . . . . . . . . . . . . . . . 64
3.2.1.1 Indice T2 de Hotelling . . . . . . . . . . . . . . . . . 66
3.2.1.2 Indice SPE . . . . . . . . . . . . . . . . . . . . . . . . 67
3.2.1.3 Indice SWE . . . . . . . . . . . . . . . . . . . . . . . 68
3.2.1.4 Indice combiné . . . . . . . . . . . . . . . . . . . . . . 69
3.2.1.5 Indice de Mahalanobis . . . . . . . . . . . . . . . . . . 70
3.2.2 Influence de la modélisation sur la détectabilité de défauts . . . 71
3.2.2.1 Effet d’une sous-estimation du modèle . . . . . . . . . 71
3.2.2.2 Effet d’une surestimation du modèle . . . . . . . . . . 72
3.3 Différentes variances non reconstruites . . . . . . . . . . . . . 73
3.3.1 Principe de la reconstruction unidimensionnelle . . . . . . . . . 73
3.3.2 Variance non reconstruite généralisée . . . . . . . . . . . . . . . 74
3.3.3 Comportements des différents critères VNR . . . . . . . . . . . 76
3.3.3.1 VNR utilisant l’indice SPE . . . . . . . . . . . . . . 76
3.3.3.2 VNR utilisant l’indice SWE . . . . . . . . . . . . . . 76
3.3.3.3 VNR utilisant l’indice T2 de Hotelling . . . . . . . . 77
3.3.3.4 VNR utilisant l’indice de Mahalanobis . . . . . . . . 78
3.3.3.5 VNR utilisant un indice exprimé dans le sous-espace
principal . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.3.3.6 VNR utilisant l’indice combiné . . . . . . . . . . . . 80
3.4 Nouveaux critères VNR . . . . . . . . . . . . . . . . . . . . . . 81
3.4.1 VNR utilisant un nouvel indice combiné . . . . . . . . . . . . 81
3.4.2 Changement de représentation des données . . . . . . . . . . . 83
61
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
62
3.1. Introduction
3.1 Introduction
Les méthodes de détection et de localisation de défauts en s’appuyant sur l’ACP ont été
largement utilisées pour la surveillance de processus. Le principe de la surveillance basée
sur l’approche de l’ACP repose principalement sur une modélisation du comportement
de processus en fonctionnement normal. Les défauts sont alors détectés en comparant le
comportement observé par rapport à celui donné par le modèle ACP. En effet, la phase
de détection de défauts est liée à une étape de génération de résidus ou d’indices de
détection qui a pour but de générer à partir des mesures observées et d’un modèle ACP,
des signaux révélateurs de la présence de défauts. A partir de l’analyse de ces indices,
l’étape de détection doit alors indiquer l’existence ou non de défauts.
Dans ce cadre, quelques indices typiques pour la détection des fonctionnements anor-
maux ont été proposés dans la littérature (Qin, 2003). En revanche, la plupart des mé-
thodes de diagnostic utilisent plus particulièrement l’erreur quadratique de prédiction
(squared prediction error : SP E) et la statistique T 2 de Hotelling qui sont souvent connues
par les statistiques Q et D respectivement (Kresta et al., 1991; Kourti et MacGregor, 1995;
Dunia et al., 1996; Dunia et Qin, 1998c; Qin, 2003). On note que ces deux indices de détec-
tion jouent des rôles différents dans la stratégie de surveillance par ACP. La statistique T 2
décrit le comportement des variables du processus qui sont corrélées avec les composantes
principales, tandis que la statistique SP E dépend de toutes les variables à surveiller. En
outre, celle-ci représente un test global qui cumule les erreurs de modélisation présentes
sur chaque résidu (Harkat et al., 2006). L’indice SP E est utilisé dans le sous-espace rési-
duel. Tandis que l’indice T 2 de Hotelling est utilisé dans le sous-espace principal. L’indice
TH2 de Hawkins (Hawkins, 1974) aussi appelé SW E (squared weighted error ) représente
aussi les variations des données dans le sous-espace résiduel. Sa particularité par rapport
à l’indice SP E se manifeste par une pondération des résidus par les inverses des valeurs
propres résiduelles. Néanmoins, d’autres indices sensibles à l’ensemble de l’espace de re-
présentation des données ont été également utilisés comme la distance combinée (Yue et
Qin, 2001) et la distance de Mahalanobis. Dans le but d’améliorer les capacités de détec-
tion en utilisant la méthode d’ACP, un test basé sur les dernières composantes principales
a été proposé par Harkat et al. (2002, 2005, 2006).
Une telle description des indices de détection nous permettra de définir dans ce chapitre
de nouveaux critères de sélection du nombre optimal des CPs en se basant sur la variance
non reconstruite afin de remédier aux limitations des critères comparés dans le chapitre
précédent. En effet, toute procédure d’un diagnostic de défauts repose d’une manière
cruciale sur la précision et l’efficacité du critère considéré. Pour cela, nous allons prouver
théoriquement l’influence de la modélisation par ACP sur la détectabilité de défauts. En
s’appuyant sur le principe de la variance de l’erreur de reconstruction, il s’est avéré possible
d’établir une variance non reconstruite associée à chacun de ces indices de détection. Ce
résultat nous a permis de proposer un critère empirique relatif à la distance combinée
(Mnassri et al., 2010a). Ensuite, un nouveau critère de même type, basé sur une nouvelle
statistique combinée représente notre deuxième contribution (Mnassri et al., 2010b). Ces
contributions ont été également enrichies par un critère plus performant. Ce dernier est
basé sur un changement de représentation de données en envisageant que d’autres données
sont beaucoup mieux révélatrices d’informations que les données observées réellement.
63
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
Cela nous a permis de proposer une nouvelle théorie reposant sur une ACP de variances
inversées (ACPVI) (Mnassri et al., 2010c, 2011b). Ainsi, ce troisième critère de sélection,
appelé VNRVI, montrera une efficacité importante en remédiant au problème souvent
rencontré qui est relatif à la présence des variables indépendantes et quasi-indépendantes.
Les résultats de simulation valideront cette nouvelle approche.
tr[(Σ M)2 ]
gγ = (3.3)
tr[Σ M]
64
3.2. Détection et détectabilité de défauts
(tr[Σ M])2
hγ = (3.4)
tr[(Σ M)2 ]
où Σ est la matrice de covariance des données de X. L’expression tr[.] représente la trace
d’une matrice carrée.
Nous rappelons que la présence d’un défaut multiple FJ dans les données a été consi-
dérée par le vecteur de mesures en défaut donné par l’équation (2.59). A partir de cette
dernière et celle de (3.1), le vecteur duquel découle l’indice γ est exprimé par :
1 1 1 1
M 2 x(k) = M 2 (x∗ (k) + ΞJ f(k)) = M 2 x∗ (k) + M 2 ΞJ f(k) (3.5)
Deux conditions nécessaires doivent être considérées afin que le défaut FJ soit détec-
table par l’indice γ :
i. Sa projection dans le sous-espace engendré par les vecteurs colonnes de la matrice
1 1
M 2 ne devrait pas être nulle, i.e. k M 2 ΞJ f(k)k =
6 0;
ii. Son amplitude devrait être suffisamment large afin que l’indice de détection dépasse
sa limite de contrôle, i.e. γ(k) > Γ2 .
Pour déterminer la condition qui garantit la détection du défaut, nous avons besoin
1
d’exprimer la norme euclidienne du vecteur M 2 x(k) comme suit :
1 1 1 1 1
k M 2 x(k)k = k M 2 x∗ (k) + M 2 ΞJ f(k)k ≥ k M 2 ΞJ f(k)k − k M 2 x∗ (k)k (3.6)
Puisque x∗ représente un vecteur de mesures prélevées lors du fonctionnement normal,
alors :
1
k M 2 x∗ (k)k ≤ Γ (3.7)
La substitution de (3.7) dans (3.6) en considérant la positivité de la norme euclidienne
mène à l’inégalité suivante :
1 1
k M 2 x(k)k ≥ k M 2 ΞJ f(k)k − Γ ≥ 0 (3.8)
Afin que le défaut soit suffisamment détectable, la contrainte γ(k) > Γ2 devrait être
satisfaite. On doit alors imposer que
1 1
k M 2 x(k)k2 ≥ (k M 2 ΞJ f(k)k − Γ)2 > Γ2 (3.9)
65
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
Lorsque l’inégalité précédente est satisfaite, alors la détection du défaut FJ est garantie
en utilisant l’indice de détection γ. Cette condition suffisante (sur l’amplitude du défaut)
est valable pour tout indice de détection ayant une forme quadratique. En s’appuyant sur
une telle inégalité, nous allons exprimer dans la suite la détectabilité relative à chaque
indice donné dans le tableau 3.1.
En considérant un tel indice, le processus est supposé sous contrôle à la kème obser-
vation si :
T 2(k) ≤ τ 2 = gT 2 χ2(hT 2 ,α) (3.12)
où gT 2 et hT 2 sont calculés respectivement, à partir de (3.3) et (3.4), comme suit :
T
tr[(ΣP̂Λ̂−1 P̂ )2 ] tr[I` ]
gT 2 = T
= =1 (3.13)
tr[ΣP̂Λ̂−1 P̂ ] tr[I` ]
T
(tr[ΣP̂Λ̂−1 P̂ ])2 (tr[I` ])2
hT 2 = T
= = tr[I` ] = ` (3.14)
tr[(ΣP̂Λ̂−1 P̂ )2 ] tr[I` ]
Si le nombre d’observations N est faible, la limite de contrôle de la statistique T 2 de
Hotelling peut être approximée par la relation suivante :
`(N 2 − 1)
τ2 = F (3.15)
N (N − `) (`,N −`,α)
où F(`,N −`,α) représente la distribution de Fisher avec ` et (N − `) degrés de liberté ainsi
qu’un seuil de signification α.
Afin d’assurer la détection du défaut FJ , la condition suffisante de sa détectabilité par
l’indice T 2 de Hotelling en se référant à (3.10) est donnée par :
1 T
kP̂Λ̂− 2 P̂ ΞJ f(k)k > 2τ (3.16)
Cette condition a été établie par Yue et Qin (2001). D’après (2.46) et (2.47), les mesures
collectées sous des conditions de fonctionnement normal se projettent dans le sous-espace
principal. Par conséquent, la performance de l’indice T 2 de Hotelling dans la détection de
66
3.2. Détection et détectabilité de défauts
défauts peut être limitée car les variations des projections des défauts dans le sous-espace
principal peuvent être masquées par les variations normales. Nous avons montré que si
le choix du modèle ACP est optimal, un tel indice est dédié à la détection de défauts
des variables indépendantes et quasi-indépendantes (Mnassri et al., 2010a,b, 2011b,a).
Sous la contrainte d’optimalité du modèle ACP, les défauts portés par les directions de
ces variables se projettent totalement dans le sous-espace principal. Ainsi, leur détection
n’est possible qu’avec des indices calculés dans ce sous-espace.
La distance SP E est un indicateur global qui somme les résidus sans tenir compte
de leurs variances différentes. Toutefois, les résidus avec forte variance portent les erreurs
de modélisation produites par l’ACP. Ainsi, ils ont plus d’effets sur la quantité SP E
que les résidus ayant une faible variance et qui représentent réellement les relations de
redondance linéaires ou quasi-linéaires. Par conséquent, l’indice SP E est très sensible aux
erreurs de modélisation, ce qui peut entraı̂ner de nombreuses fausses alarmes ou l’absence
de la sensibilité à la détection de défauts en raison d’un seuil théorique élevé (Tharrault,
2008).
Avec un tel indice, le processus est considéré en fonctionnement normal à la kème
observation si :
SP E(k) ≤ δ 2 = gSP E χ2(hSP E ,α) (3.18)
où gSP E et hSP E sont respectivement données en se basant sur les expressions généralisées
(3.3) et (3.4) par :
Xm
λ2a
2 2
tr[(ΣC̃) ] tr[Λ̃ ] a=`+1
gSP E = = = m (3.19)
tr[ΣC̃] tr[Λ̃] X
λa
a=`+1
m
!2
X
λa
(tr[ΣC̃])2 (tr[Λ̃])2 a=`+1
hSP E = = = m (3.20)
tr[(ΣC̃)2 ] tr[Λ̃2 ] X
λ2a
a=`+1
Pm i
où λa représente la aème valeur propre de la matrice Σ. En posant θi = a=`+1 λa ,
nous retrouvons ainsi la formule connue dans la littérature pour le seuil de contrôle de
l’indice SP E. Il est important de mentionner qu’il existe également une autre expression
proposée par Jackson et Mudholkar (1979) pour le calcul d’une telle limite de contrôle.
67
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
Ainsi, Nomikos et MacGregor (1995) ont montré que les deux expressions donnent des
résultats identiques.
Le défaut FJ est garanti détectable par l’indice SP E si son amplitude calculée dans
le sous-espace résiduel respecte d’après (3.10) l’inégalité suivante :
Nous notons également qu’une telle condition a été proposée dans des travaux anté-
rieurs (Dunia et Qin, 1998b,c,a; Yue et Qin, 2001; Qin, 2003). Dans la suite, nous allons
proposer les conditions suffisantes de détectabilité pour le reste des indices en se basant
sur notre étude généralisée développée dans la sous-section 3.2.1.
En se référant aux formules (3.3) et (3.4), les paramètres gSW E et hSW E sont respec-
tivement exprimés comme suit :
T
tr[(ΣP̃Λ̃−1 P̃ )2 ] tr[Im−` ]
gSW E = T
= =1 (3.24)
tr[ΣP̃Λ̃−1 P̃ ] tr[Im−` ]
T
(tr[ΣP̃Λ̃−1 P̃ ])2 (tr[Im−` ])2
hSW E = T
= = tr[Im−` ] = m − ` (3.25)
tr[(ΣP̃Λ̃−1 P̃ )2 ] tr[Im−` ]
68
3.2. Détection et détectabilité de défauts
69
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
m
!2
X
T
τ −2 ` + δ −2 λa
−2 −2 −1 2
(tr[Σ(δ C̃ + τ P̂Λ̂ P̂ )]) a=`+1
hϕ = T
= m (3.32)
tr[(Σ(δ −2 C̃ + τ −2 P̂Λ̂−1 P̂ ))2 ] τ −4 ` + δ −4
X
λ2a
a=`+1
70
3.2. Détection et détectabilité de défauts
où Γ2q représente la limite de contrôle de l’indice γ dans le sous-espace optimal. En effet,
la considération d’un critère quelconque pour le choix du nombre des CPs peut engen-
drer un modèle ACP qui se diffère par rapport à celui optimal suite à une réduction ou
une augmentation du sous-espace optimal de γ. Par conséquent, nos démonstrations se
déroulent en deux étapes.
engendrent le sous-espace réduit considéré optimal par un critère quelconque. Ainsi, nous
montrons que :
1 1 1 1
Md2− Mred
2
= Mred
2
Md2− = 0m ∈ Rm×m (3.42)
71
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
où Γ2red représente le seuil de contrôle de l’indice de détection dans le sous-espace réduit.
Ainsi, le défaut FJ reste garanti détectable suite à une réduction du sous-espace si son
amplitude exprimée dans le sous-espace retranché satisfait l’inégalité suivante :
1
q
k Md− ΞJ f(k)k ≤ 2 Γ2q − Γ2red
2
(3.46)
Cette inégalité n’est valable que si Γ2q ≥ Γ2red qui est généralement vérifiée. Elle re-
présente une condition suffisante sur l’amplitude du défaut dans le sous-espace retranché
afin qu’il reste garanti détectable même en réduisant le sous-espace optimal. Dans cette
optique, nous pouvons conclure que le sous-espace retranché doit être insensible au défaut
considéré. Ainsi, la majoration d’une telle amplitude prouve qu’une conservation de la
qualité de détection de défauts par réduction du sous-espace optimal n’est pas garantie.
Puisque le défaut FJ est garanti détectable dans le sous-espace optimal (3.40), l’in-
égalité suivante est alors vraie :
1 1
k Maug
2
ΞJ f(k)k2 > k Md2+ ΞJ f(k)k2 + 4Γ2q (3.49)
72
3.3. Différentes variances non reconstruites
73
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
Ainsi, une estimation optimale de l’amplitude du défaut est celle qui minimise l’indice
reconstruit γj (k) comme suit :
Cette minimisation est obtenue par l’application du principe des moindres carrés. En
conséquence, l’amplitude estimée du défaut ainsi que le vecteur de données dont la jème
variable est reconstruite sont respectivement exprimés par :
où xj− (k) et xj+ (k) sont respectivement composés des (j−1) premières et (m−j) dernières
mesures du vecteur de données x(k). xj (k) représente la mesure de la jème variable au
kème instant. ξj− ∈ Rj−1 et ξj− ∈ Rm−j sont deux vecteurs nuls. MTj− et MTj+ sont deux
vecteurs composés respectivement des (j − 1) premières et (m − j) dernières valeurs de la
jème ligne de la matrice M. ξjT M ξj est la jème valeur diagonale de la matrice M.
A partir des équations (3.56) et (3.57), le vecteur de données dont la jème variable est
reconstruite peut s’écrire de la façon suivante :
xj− (k)
xj (k) = −(ξjT M ξj )−1 MTj− xj− (k) + MTj+ xj+ (k)
(3.58)
xj+ (k)
D’après cette expression, seules les mesures des variables autres que celles de la variable
en question sont utilisées pour sa reconstruction. En outre, la contribution des autres va-
riables dans la reconstruction dépend de la dimension du modèle ACP considéré. Une
telle contribution peut être illustrée par les coefficients des vecteurs MTj− et MTj+ . Evi-
demment, les valeurs de ces coefficients changent en fonction du nombre des CPs utilisées
dans le modèle ACP.
74
3.3. Différentes variances non reconstruites
Néanmoins, la variance d’une telle variable ne peut être totalement reconstruite. Il est
donc possible d’en extraire une variance non reconstruite qui dépend de la dimension du
modèle ACP et du sous-espace dans lequel l’estimation est réalisée. Nous rappelons que
seule la variance non reconstruite relative à une estimation dans le sous-espace résiduel
a été étudiée dans la littérature (Dunia et Qin, 1998b,c,a; Qin et Dunia, 2000). Dans ce
cadre, nous avons proposé une variance non reconstruite généralisée relative à un indice
de détection quadratique quelconque (Mnassri et al., 2010a). Cette généralisation nous
a permis d’étudier la variance de l’erreur de reconstruction relative à chaque indice de
détection donné dans le tableau 3.1.
Considérons ej (k) ∈ Rm le vecteur qui représente l’erreur de reconstruction de la jème
variable au kème instant. Ainsi, l’erreur de reconstruction de cette variable est donnée
par :
ξjT ej (k) = ξjT (x(k) − xj (k)) = fˆj (k) = (ξjT M ξj )−1 ξjT M x(k) (3.59)
Cette expression montre que l’estimation de la jème variable dans n’importe quel
sous-espace est non biaisée. Puisque les données sont centrées, la moyenne de l’erreur de
reconstruction est nulle :
n o
E ξjT ej = E fˆj = (ξjT M ξj )−1 ξjT M E {x} = 0
(3.60)
L’objectif étant alors de définir le nombre de CPs qui minimise l’expression précédente
pour une meilleure reconstruction d’une variable donnée. En effet, le minimum de la
variance non reconstruite d’une variable correspond à un nombre de CPs qui peut être
diffèrent de celui obtenu pour une reconstruction optimale d’une autre variable. Pour cette
raison, ce compromis peut être résolu par la considération d’une variance non reconstruite
globale. Ainsi, l’objectif sera plutôt de définir un nombre de CPs qui minimise la variance
globale qui peut malheureusement ne pas assurer une variance non reconstruite minimale
pour chacune des variables. Puisque le critère global représente la somme des variances non
reconstruites individuelles des variables, il est préférable de les considérer dans la même
échelle en pondérant chacune par la variance originelle de sa variable. Par conséquent, le
critère de la variance non reconstruite globale relative à l’indice γ est donné par :
m σ 2 (`) m
X γj X ξjT M Σ M ξj
VNRγ (`) = = (3.62)
j=1
ξjT Σξj j=1
(ξjT Σξj )(ξjT M ξj )2
75
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
Dans le cadre d’une utilisation de la variance non reconstruite, nous considérons plus
particulièrement que les données de X sont centrées réduites. Par conséquent, Σ repré-
sente une matrice de corrélation, ce qui implique que ξjT Σξj = 1.
2
ξjT C̃ΣC̃ξj
σSP Ej (`) = = σj2 (`) (3.63)
(ξjT C̃ξj )2
Nous pouvons déduire que la variance non reconstruite d’une variable donnée en uti-
lisant l’indice SP E est égale à celle étudiée dans le deuxième chapitre. Par conséquent,
le critère de la variance globale de l’erreur de reconstruction relative à un tel indice n’est
autre que le critère VNR qui a été l’objet d’une étude dans le chapitre précédent :
m
X m
X
2
VNRSP E (`) = σSP Ej (`) = σj2 (`) = VNR(`) (3.64)
j=1 j=1
En effet, la matrice résiduelle des vecteurs propres ainsi que celle des valeurs propres
peuvent être réécrites respectivement comme suit :
h i
P̃ = p`+1 , P̃r (3.66)
76
3.3. Différentes variances non reconstruites
et
λ 0
Λ̃ = `+1 (3.67)
0 Λ̃r
On peut alors déduire que :
T T
ξjT P̃Λ̃−1 P̃ ξj = λ−1 T T T −1
`+1 ξj p`+1 p`+1 ξj + ξj P̃r Λ̃r P̃r ξj (3.68)
Puisque λ−1 T T
`+1 ξj p`+1 p`+1 ξj ≥ 0, alors
T T
ξjT P̃Λ̃−1 P̃ ξj ≥ ξjT P̃r Λ̃−1
r P̃r ξj (3.69)
donc
1 1
T
≤ T
(3.70)
ξjT P̃Λ̃−1 P̃ ξj ξjT P̃r Λ̃−1
r P̃r ξj
L’inégalité (3.71) prouve que la variance non reconstruite d’une variable donnée en
utilisant l’indice SW E est monotone croissante en `. Ainsi, la variance globale de l’erreur
de reconstruction est également monotone croissante en ` :
m
X m
X
2 2
σSW Ej (`) ≤ σSW Ej (` + 1) (3.72)
j=1 j=1
d’où
VNRSW E (`) ≤ VNRSW E (` + 1) (3.73)
Par conséquent, le minimum d’un tel critère correspond toujours à une seule CP qui
est la première :
min VNRSW E (`) = 1 (3.74)
`
On peut conclure que la variance non reconstruite utilisant l’indice SW E ne peut pas
servir dans le choix d’un nombre optimal de CPs.
77
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
Puisque λ−1 T T
`+1 ξj p`+1 p`+1 ξj ≥ 0, alors
1 1
T
≥ T
(3.79)
ξjT P̂Λ̂−1 P̂ ξj ξjT P̂+ Λ̂−1
+ P̂+ ξj
donc
σT2 2j (`) ≥ σT2 2j (` + 1) (3.80)
et m m
X X
σT2 2j (`) ≥ σT2 2j (` + 1) (3.81)
j=1 j=1
Celle-ci implique que
VNRT 2 (`) ≥ VNRT 2 (` + 1) (3.82)
Cette inégalité prouve que le critère de la variance non reconstruite utilisant à l’indice
T 2 de Hotelling est monotone décroissant en `. En se basant sur ce critère, la meilleure
reconstruction est obtenue en considérant toutes les CPs puisque :
min VNRT 2 (`) = m (3.83)
`
En effet, la variance de l’erreur de reconstruction basée sur l’indice T 2 de Hotelling
est incapable de déterminer un modèle optimal.
78
3.3. Différentes variances non reconstruites
79
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
où I` ∈ R`×` est une matrice identité. Notamment, toutes les valeurs propres de la matrice
diagonale Λ̂ sont supérieures ou égales à λ`+1 ce qui implique que tous les éléments de la
matrice diagonale (λ`+1 I` − Λ̂) sont alors négatifs ou nuls. Par conséquence, la différence
exprimée par l’équation précédente est négative ou nulle, ainsi :
ûj (`) ≥ ûj (` + 1) (3.94)
A partir des inégalités (3.94) et (3.92), nous pouvons déduire que :
ûj (`)v̂j (`) ≥ ûj (`+)v̂j (` + 1) (3.95)
ce qui nous permet également de déduire, d’après (3.86), que :
2 2
σkx̂ 2 (`) ≥ σkx̂ k2 (` + 1) (3.96)
jk j
En posant
m
X
2
VNRkx̂k2 (`) = σkx̂jk
2 (`) (3.97)
j=1
le critère qui représente la variance globale non reconstruite relative à l’indice considéré,
on peut conclure de l’inégalité (3.96) que :
VNRkx̂k2 (`) ≥ VNRkx̂k2 (` + 1) (3.98)
Ce critère est alors monotone décroissant en `. Evidemment, la meilleure reconstruction
est obtenue en considérant toutes les CPs dans le modèle ACP puisque :
min VNRkx̂k2 (`) = m (3.99)
`
Le comportement de cette variance non reconstruite ne peut pas servir pour le choix
d’un nombre optimal de CPs.
Cette expression dépend du nombre ` des CPs retenus. En outre, nous remarquons
qu’une telle variance dépend également des seuils de contrôle des indices SP E et T 2 de
Hotelling. Ces limites sont en fonction de ` et un seuil de signification α. Par conséquent,
la variance non reconstruite globale dépendra également des ces paramètres :
m
X
VNRϕ (`, α) = σϕ2 j (`, α) (3.101)
j=1
80
3.4. Nouveaux critères VNR
Cette équation présente un nouveau critère basé sur la variance non reconstruite rela-
tive à l’indice combiné. Nous notons qu’il n’a pas été étudié auparavant dans la littérature.
Jusqu’à ce stade, nous avons montré théoriquement que tous les critères qui se basent
sur la variance non reconstruite, à l’exception de celui de l’équation (3.101), ne peuvent
pas définir la dimension adaptée d’un modèle ACP voire la plupart de ces critères sont
inutiles pour effectuer une telle tâche. En revanche, l’unique critère dont nous ignorons
son comportement est celui relatif à l’indice combiné. Pour cette raison, ce critère a été
l’objet d’une étude sur un exemple simulé par Mnassri et al. (2010a). Nous avons remarqué
qu’il peut nous renseigner sur la dimension optimale en s’appuyant sur à un choix très
approprié du niveau de confiance (1 − α).
Afin d’assurer la détection de défauts, le seuil de signification α doit généralement
avoir des valeurs voisines de 5%. Malheureusement, ces valeurs sont inadéquates pour le
nouveau critère. En effet, nous avons constaté que α doit être proche de 80% pour que
le minimum de VNRϕ converge modérément vers le nombre désiré des CPs. Ce critère
est conçu pour un objectif primordial qui est la minimisation de la variance de l’erreur
de reconstruction. Toutefois, il est difficile d’expliquer théoriquement son comportement.
Pour cela, nous pouvons le considérer comme un critère empirique puisque son efficacité
s’appuie plus particulièrement sur l’expérience.
−1 T T
B(k) = kP̂Λ̂B 2 P̂ x(k)k2 = xT (k)P̂Λ̂−1
B P̂ x(k) (3.102)
81
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
avec
Λ2
0
ΛB = v (3.103)
0 I(m−v) + Λ(m−v)
où Λ̂B ∈ R`×` est une matrice diagonale constituée des ` premiers éléments de la matrice
diagonale ΛB . Evidemment, ` représente le nombre des CPs à retenir. I(m−v) est une
matrice identité d’ordre (m − v). v = {1, · · · , m} joue le rôle d’un deuxième paramètre
pour le critère proposé en représentant également un nombre de CPs qui servira dans
la minimisation par la suite. Λv ∈ Rv×v et Λ(m−v) ∈ R(m−v)×(m−v) sont deux matrices
diagonales contenant respectivement les v premières et (m − v) dernières valeurs propres
de la matrice Λ.
Nous constatons que cet indice ressemble dans sa forme générale à celui de la T 2 de
Hotelling. La modification est réalisée aux niveaux des valeurs propres de la matrice Λ.
L’utilisation de l’indice B pour la détection de défauts impose qu’on lui propose une limite
de contrôle. Puisque cet indice présente une forme quadratique, son seuil de détection peut
être déterminé en se référant à la théorie de Box (1954). En considérant un tel indice, le
processus est en fonctionnement normal au kème instant si :
avec
T
tr[(ΣP̂Λ̂−1 2
B P̂ ) ]
gB = T
(3.105)
tr[ΣP̂Λ̂−1
B P̂ ]
T
(tr[ΣP̂Λ̂−1
B P̂ ])
2
hB = T
(3.106)
tr[(ΣP̂Λ̂−1 2
B P̂ ) ]
1 SP E(k) B(k)
Ψ(k) = kΥ 2 x(k)k2 = + 2 (3.107)
δ2 b
où
1 −1 T
Υ 2 = δ −1 C̃ + b−1 P̂Λ̂B 2 P̂ (3.108)
Υ représente la matrice du nouvel indice combiné Ψ. Notamment, la reconstruction de
la jème variable en utilisant un tel indice engendre une variance non reconstruite dont
son expression est déterminée en remplaçant dans l’équation (3.61) M par Υ. Ainsi, nous
montrons qu’elle peut s’écrire comme suit :
T
2
b4 ξjT C̃ΣC̃ξj + δ 4 ξjT P̂Λ̂−1
B P̂ ξj
σΨ (`, v, α) = 2 (3.109)
j
2 T 2 T −1 T
b ξj C̃ξj + δ ξj P̂Λ̂B P̂ ξj
82
3.4. Nouveaux critères VNR
Cette variance dépend de deux paramètres principaux qui sont ` et v ainsi qu’un
paramètre de lissage α qui représente le seuil de signification. En revanche, le critère
global dépend uniquement de ` et α :
m X
X m
2
VNRΨ (`, α) = σΨ j
(`, v, α) (3.110)
v=1 j=1
Nous suggérons que le minimum de cette fonction peut correspondre au nombre op-
timal des CPs. En se basant sur un exemple simulé, nous avons observé que ce critère
peut déterminer correctement le nombre désiré des CPs avec des valeurs pour α qui sont
comprises entre 1% et 5% (Mnassri et al., 2010b). Notamment, ce critère montre des ré-
sultats plus corrects que ceux du critère utilisant le classique indice combiné. Cependant,
il demeure un critère empirique car seul l’expérience peut illustrer son efficacité.
83
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
leurs indépendances ainsi que leurs variances même en cas d’inversion de la matrice de
corrélation.
Pour cette raison, l’idée principale s’appuie sur le principe des problèmes inverses
par un changement de représentation des données. Puisque la normalisation des données
influe souvent les relations linéaires entre les variables, nous supposons que les données
normalisées de la matrice X sont initialement issues d’une transformation linéaire d’autres
données Y ∈ RN ×m qui ne sont pas forcément normalisées. En notation vectorielle, cette
hypothèse se traduit par :
x(k) = Ay(k) (3.111)
A ∈ Rm×m est la matrice de transformation. y ∈ Rm représente le vecteur des données
desquelles sont extraites celles du vecteur x. A travers le changement de représentation,
nous devons assurer que les données de X sont normalisées. Dans ce contexte, on peut
établir ce qui suit :
Σ = E xxT = A E yyT AT
= ASAT (3.112)
A=Σ (3.113)
et
S = Σ−1 (3.114)
En présence de bruit de mesures de variances non nulles, la matrice de corrélation
Σ est inversible. Ainsi, Σ−1 représente la matrice de covariance des données de Y. Par
conséquent, le vecteur de données y(k) peut s’écrire comme suit :
84
3.4. Nouveaux critères VNR
où, d’après (2.15), t représente le vecteur des CPs de X. Puisque cesCPs sont caractérisées
par des variances qui sont égales aux valeurs propres de Σ, i.e. E ttT = Λ, on montre
alors que :
E hhT = Λ−1 E ttT Λ−1 = Λ−1
(3.118)
Par conséquent, nous déduisons que les CPs de Y sont les mêmes que celles de X
mais de variances inverses. Pour cette raison, nous avons appelé cette approche analyse
en composantes principales pondérées par leurs variances inversées (ACPVI).
D’après l’équation (3.116), nous remarquons qu’une telle décomposition engendre des
valeurs propres dans l’ordre croissant. Cependant, le principe communément connu par
une ACP est d’organiser les valeurs propres dans un ordre décroissant. Pour cela, l’équa-
tion (3.116) peut se réécrire comme suit :
S = GDGT (3.119)
avec
G = g1 , · · · , gm−q , gm−q+1 , · · · , gm = pm , · · · , pq+1 , pq , · · · , p1 (3.120)
et
Puisque S est une matrice de covariance, cela semblerait contradictoire avec notre
recommandation concernant la nature des données sur lesquelles on doit appliquer un
critère basé sur le principe de la variance non reconstruite. Toutefois, l’organisation des
valeurs propres de cette matrice de covariance qui est obtenue par un changement de
représentation des données présentera un avantage majeur pour notre approche. Ainsi,
ce type de matrice de covariance qui représente l’inverse d’une matrice de corrélation
d’autres données sera le plus adapté pour une utilisation du critère VNR sur des données
non normalisées.
Nous avons supposé que q représente le nombre optimal des CPs pour les données de
X. En présence des variables indépendantes et/ou quasi-indépendantes, la qème CP repré-
sentera certainement l’une de ces variables. Ainsi, l’inversion de la matrice de corrélation
85
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
n’influe pas leurs natures. D’après (3.120) et (3.121), les q CPs significatives dans X se
transforment en des relations de redondance dans Y. Inversement, les (m − q) relations de
redondance dans X se transforment en des CPs significatives dans Y. Ces effets sont dus
aux inverses des valeurs propres résiduelles de Σ qui produisent des valeurs propres très
importantes dans Σ−1 . Evidemment s’il existe un ensemble de variables indépendantes
dans X, elles se mutent dans Y sans modification considérable dans leurs indépendances.
Ainsi, la dernière parmi elles sera associée au vecteur propre gm−q+1 (3.120).
Afin de sélectionner les q CPs de la matrice X, nous envisageons qu’il est plus facile
d’identifier les (m − q) CPs de la matrice Y en utilisant le principe de la variance non
reconstruite.
où ŵi est une estimation de w. Une telle estimation est optimale en minimisant l’erreur
quadratique d’estimation kZ̃yi (k)k2 de la façon suivante :
n o
2
ŵi (k) = arg min kZ̃yi (k)k
w(k)
avec
T
Z̃ = G̃ G̃ (3.125)
Notamment, Z̃ est la matrice de projection dans le sous-espace résiduel de Y. G̃ ∈
m×(m−κ)
R est composée des (m − κ) derniers vecteurs propres de la matrice G et κ repré-
sente le nombre des CPs utilisées dans le modèle.
On note que la ième variable est reconstructible si ζiT Z̃ζi 6= 0, i.e. le vecteur Z̃ζi est
non nul.
Puisque les données de X sont centrées alors celles de Y le sont également. Par consé-
quent, la moyenne de ŵi est nulle. Ainsi, la variance de l’erreur de reconstruction de la
ième variable dans le sous-espace résiduel est définie par :
86
3.4. Nouveaux critères VNR
On peut alors déduire le critère de la variance globale non reconstruite noté VNRVI
et qui dépend de κ comme suit :
m m m T
X σi2 (κ) X ζiT Z̃Σ−1 Z̃ζi X ζiT G̃D̃G̃ ζi
VNRVI(κ) = T −1
= = (3.127)
i=1
ζi Σ ζi i=1
(ζi
T −1
Σ ζi )(ζi
T
Z̃ζi ) 2
i=1
(ζi
T −1
Σ ζi )(ζi
T
Z̃ζi )2
Notons par κop le nombre optimal des CPs dans Y. En se basant sur ce critère, nous
suggérons que son minimum correspond à κop = (m − q) CPs :
Par conséquent, le nombre optimal des CPs de X est déduit de la manière suivante :
Etant donné que la quantité ζiT Σ−1 ζi est une constante qui ne dépend pas de κ, notre
étude du comportement du nouveau critère peut se limiter aux deux termes ũ2i et û2i .
Dans ce cadre, nous avons montré théoriquement dans l’annexe C que la fonction ũ2i est
monotone décroissante en κ. D’autre part, le terme ζiT Z̃ζi tend vers zéro quand κ tend
vers m. Cela implique par conséquent que û2i devient croissante en montant rapidement
quand κ tend vers m. De cette manière, l’expression (3.132) doit avoir nécessairement un
minimum unique qui correspond à un nombre de CPs dans l’intervalle [1, m]. Ainsi, nous
pouvons déduire également que le critère VNRVI aura un seul minimum global pour un
nombre de CPs dans le même intervalle.
En revanche, il est crucial d’établir les conditions qui garantissent d’avoir théorique-
ment ce minimum en (m − q) CPs. Dans ce cadre, il semblerait nécessaire de connaı̂tre
tout d’abord la distribution du bruit dans les données de Y. Selon l’équation (2.28), le
vecteur de données y(k) peut s’écrire comme suit :
87
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
où les vecteurs ẙ(k) et w(k) représentent respectivement les mesures sans bruit et le bruit
au kème instant. Ainsi, la matrice de covariance du bruit dans Y est donnée par :
où E{vvT } représente la matrice de covariance du bruit dans les données de X. D’après
l’équation précédente, nous remarquons que le bruit dans Y dépend fortement de celui
dans X. Néanmoins, la matrice de covariance exprimée par une telle équation est généra-
lement non diagonale ce qui implique que le bruit w est coloré.
D’après la démonstration que nous avons établie dans l’annexe D, le critère VNRVI
garantit son minimum en κ = (m − q) CPs si :
T
dm−q+1 ζiT G̃q G̃q ζi
≤ T
pour κ ≥ m − q (3.135)
dm ζiT G̃ G̃ ζi
et
T
!
ζiT G̃ G̃ ζi
dm−q ≥ 1+ T
dm−q+1 pour κ < m − q (3.136)
ζiT G̃q G̃q ζi
où G̃ ∈ Rm×(m−κ) et G̃q ∈ Rm×q sont deux matrices constituées respectivement par les
(m − κ) et les q derniers vecteurs propres de la matrice G. Notamment, nous pouvons
réécrire les deux inégalités précédentes en fonction des valeurs propres de la matrice Σ.
Selon l’équation (3.121), elles se transforment respectivement comme suit :
T
λ1 ζiT G̃q G̃q ζi
≤ T
pour κ ≥ m − q (3.137)
λq ζiT G̃ G̃ ζi
et
T
!
ζiT G̃ G̃ ζi
λq ≥ 1+ T
λq+1 pour κ < m − q (3.138)
ζiT G̃q G̃q ζi
L’interprétation de l’inégalité (3.138) impose que la variance d’un signal quelconque
doit être plus grande que celle du bruit, ce qui représente une condition très ordinaire.
Cependant, la contrainte exprimée dans (3.137) signifie que les valeurs propres les plus
significatives (λ1 , · · · , λq ) doivent avoir des valeurs très proches les unes des autres. Toute-
fois, la présence des variables indépendantes et/ou quasi-indépendantes peut alléger une
telle contrainte en garantissant un minimum du critère VNRVI en (m − q) CPs pour
κ ≥ m − q. Cette déduction est affirmée grâce à la démonstration de l’annexe A qui
est également valable pour ce nouveau critère. Une telle démonstration prouve que ces
variables sont toujours considérées comme des CPs résiduelles. Effectivement, l’intérêt
de notre approche par la proposition de la matrice Y est d’avoir contrairement au cas
classique, un sous-espace résiduel inversé dont les premières CPs que constituant un tel
sous-espace représentent ce type de variables suivies par les CPs les plus significatives
dans X. Cette particularité du critère VNRVI peut garantir une sélection optimale des
CPs tout en considérant les variables indépendantes et quasi-indépendantes.
88
3.5. Résultats de simulation
89
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
100 100
80 80
60 60
40 40
"! %
& "!
20 20
$# $"! # &"!
0 0
20 40 60 80 100 20 40 60 80 100
100 100
80 80
60 60
40 40
' "! * "!
20 20
# '"! # *"!
0 0
20 40 60 80 100 20 40 60 80 100
100 100
80 80
60
"! 60
$# $"!
40 40
%
& "!
20 20
# &"!
0 0
20 40 60 80 100 20 40 60 80 100
100 100
80 80
60 60
40 40
' "! * "!
20 20
# '"! # *"!
0 0
20 40 60 80 100 20 40 60 80 100
90
3.5. Résultats de simulation
100 100
80 80
60 60
40 40
!
# !
20 20
" ! " #!
0 0
20 40 60 80 100 20 40 60 80 100
100 100
80 80
60 60
40 40
$ ! ( !
20 20
" $! " (!
0 0
20 40 60 80 100 20 40 60 80 100
0 1
10 10
2 4 6! 8 10 12 2 4 68! 10 12
2
10
"$&%#')( *)89% ./21 6 77 3 "$%#')( *)89% ./21 6 77
10
2
10
0
10
2 4 6! 8 10 12 2 4 6 8! 10 12
0
10
"$&%#')( *');% : 77 "$%#')( *');% : 77
: ! : !
2 4 6 8 10 12 2 4 6 8 10 12
Figure 3.4 – Allures des nouveaux critères appliquées sur les ensembles A et B, respec-
tivement en 1ère et 2ème colonne, en considérant un bruit i.i.d. de variance σ 2 = 0.002
91
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
1
10 1
10
2 4 6 !8!" 10 12 14 2 4 6 8!!" 10 12 14
#%'&$(*) +*9& /032 :7 88 #%&$(*) +*9& /032 :7 88
3
10
3
10
2
10
2
10
2 4
; 6 !8 !" 10 12 14 2 4 6
; 8!!"10
12 14
Figure 3.5 – Allures des nouveaux critères appliquées sur les ensembles C et D, respec-
tivement en 1ère et 2ème colonne, en considérant un bruit i.i.d. de variance σ 2 = 0.002
Table 3.2 – Pourcentage, par rapport à 1500 réalisations, des nombres de CPs sélec-
tionnées dans les ensembles des données en se basant sur le critère VNRVI (N = 1500
observations générées selon trois différents cas de bruit i.i.d.)
92
3.6. Conclusion
des CPs. Son efficacité présente un avantage prometteur par rapport aux efficacités des
autres critères de sélection présentés dans cette thèse.
Avec le critère VNRVI, l’optimalité de sélection est assurée par un nombre d’observa-
tions N assez inférieur à celui exigé pour le critère MDL présenté au deuxième chapitre.
En comparant les résultats des tableaux 3.2 et 2.7, nous distinguons clairement la dif-
férence au niveau du nombre d’observations considérées. Dans ce contexte, le paramètre
N est exprimé implicitement dans l’expression du VNRVI car il influe sur les valeurs
et vecteurs propres considérés. Ainsi, cette influence sera négligeable voire nulle pour un
nombre N suffisant et fini dans le sens où la matrice de covariance des données demeure
constante.
3.6 Conclusion
Ce chapitre présente nos contributions dans le thème d’une modélisation optimale par
ACP en utilisant le principe de la variance non reconstruite. Face à l’abondance des critères
de sélection disponibles dans la littérature et qui ont montré effectivement une divergence
remarquable dans les résultats obtenus, nous avons motivé théoriquement l’importance
de la précision dans le choix d’une structure adaptée du modèle ACP. Dans la mesure où
celui-ci n’est pas optimal, une conséquence évidente est prouvée sur la détectabilité de
défauts et qui aura sans doute un effet également sur l’isolabilité de défauts.
En partant du principe de la variance de l’erreur de reconstruction, nous avons établi
une expression généralisée pour une telle variance valable pour tout un indice de détection
ayant une forme quadratique. Dans ce cadre, nous avons présenté les indices de détection
proposés dans la littérature. Ainsi, nous avons établi pour chacun de ces indices sa variance
non reconstruite en s’appuyant sur celle généralisée.
Cela nous a permis de conclure suite à une étude théorique des différentes variances
obtenues que la plupart, exceptant quelques-unes, sont inutiles pour le choix du modèle.
Plus particulièrement, nous avons montré que la variance relative à l’indice SP E n’est
autre que celle exprimée par le critère VNR étudié dans le deuxième chapitre. Ainsi, notre
contribution dans ce cadre est introduite par la variance non reconstruite (VNRϕ ) associée
à l’indice combiné. Celle-ci dépend du nombre des CPs considérées dans le modèle ainsi
qu’un seuil de signification qui caractérise les limites de contrôle des indices de détection.
Malheureusement, l’étude de ce critère n’a pas aboutit à une consistance théorique de
son comportement. En effet, seule l’expérience prouve qu’il est capable de déterminer la
dimension du modèle en se référant à un choix très approprié du seuil de signification
considéré. Dans ce contexte, nous avons proposé un deuxième nouveau critère (VNRΨ )
basé sur une nouvelle distance combinée. L’objectif étant de faciliter la tâche du choix de
la valeur d’un tel seuil. Le nouveau critère montre des résultats plus efficaces et mieux
stationnaires que ceux du VNRϕ . Toutefois, ils restent dans leurs globalités incertains
aussi faut-il disposer d’une connaissance a priori ou d’une expertise pour prendre la
décision convenable. En effet, nous avons considéré que ces critères sont empiriques car
ils s’appuient uniquement sur l’expérience.
La limitation qui a été prouvée théoriquement dans le chapitre précédent pour le cri-
tère VNR, a été un avantage d’une nouvelle proposition. Cette dernière est inspirée du
93
Chapitre 3. Contribution au choix d’un modèle optimal par la variance non reconstruite
94
4
Théorie d’un diagnostic de défauts par ACP
Sommaire
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.2 Isolation et isolabilité de défauts par reconstruction . . . . . 98
4.2.1 Généralisation de l’isolation et l’isolabilité de défauts . . . . . . 98
4.2.1.1 Isolation de défauts . . . . . . . . . . . . . . . . . . . 98
4.2.1.2 Isolabilité de défauts . . . . . . . . . . . . . . . . . . . 101
Isolabilité par reconstruction de l’indice SPE . . . . . . 102
Isolabilité par reconstruction de l’indice SWE . . . . . . 103
Isolabilité par reconstruction de l’indice T2 de Hotelling 103
Isolabilité par reconstruction de l’indice de Mahalanobis 104
Isolabilité par reconstruction de l’indice combiné . . . . 105
4.2.2 Analyse d’isolabilité par reconstruction de l’indice combiné ver-
sus celles de SPE et T2 de Hotelling . . . . . . . . . . . . . . . 105
4.3 Diagnostic de défauts simples par les contributions . . . . . . 107
4.3.1 Contributions par décomposition complète : CDC . . . . . . . 109
4.3.2 Contributions par décomposition partielle : PDC . . . . . . . . 109
4.3.2.1 PDC à l’indice T2 de Hotelling . . . . . . . . . . . . 109
4.3.2.2 PDC à l’indice SPE basée sur les résidus . . . . . . . 110
4.3.2.3 PDC à l’indice SPE basée sur les CPs résiduelles . . 111
4.3.2.4 PDC à un indice quadratique . . . . . . . . . . . . . 111
4.3.3 Contributions diagonales : DC . . . . . . . . . . . . . . . . . . 112
4.3.4 Contributions par reconstruction : RBC . . . . . . . . . . . . . 112
4.3.5 Contributions par angle : ABC . . . . . . . . . . . . . . . . . . 113
4.3.6 Analyse de diagnosticabilité . . . . . . . . . . . . . . . . . . . . 113
4.3.6.1 Diagnosticabilité de défauts par l’approche CDC . . . 114
4.3.6.2 Diagnosticabilité de défauts par l’approche PDC . . . 114
4.3.6.3 Diagnosticabilité de défauts par l’approche DC . . . . 114
4.3.6.4 Diagnosticabilité de défauts par l’approche RBC . . . 115
95
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
96
4.1. Introduction
4.1 Introduction
La détection et le diagnostic de défauts sur les processus forment une démarche essen-
tielle afin de leur assurer un fonctionnement sûr et efficace. Selon Kariwala et al. (2010)
et Kourti (2005), une telle démarche peut se baser généralement sur des modèles quanti-
tatifs, des modèles qualitatifs ou l’historique de processus qui représente l’intérêt de cette
thèse. Dans ce contexte, le contrôle statistique de processus a reçu une attention ainsi
qu’un succès considérables aux niveaux des applications. Ce succès peut être attribué à la
disponibilité en permanence d’une grande quantité de données collectées lors du fonction-
nement normal de processus. Ainsi, ces données favorisent le développement des modèles
statistiques qui peuvent atteindre une grande précision dans la détection de toutes dévia-
tions par rapport à un fonctionnement normal. Dans ce cadre, l’ACP est une approche très
adaptée pour un contrôle statistique de processus. Ainsi, elle a été intensément explorée
dans le suivi et le diagnostic de plusieurs processus (Nomikos et MacGregor, 1995; Qin,
2003; Tharrault et al., 2008).
Dans la littérature, le thème du diagnostic de défauts a quand même reçu une attention
moins considérable que celui de la détection de défauts. L’approche la plus classique et en
même temps très populaire pour un diagnostic est basée sur l’analyse des contributions
(Nomikos et MacGregor, 1995; Yue et Qin, 2001; Qin, 2003; Alcala et Qin, 2009; Kariwala
et al., 2010; Alcala et Qin, 2011). Le principe des contributions s’appuie généralement
sur la quantification de la part de chaque variable dans le calcul d’un indice de détec-
tion donné. Dans ce cadre, nous avons proposé une nouvelle forme de contribution par
décomposition partielle de l’indice SP E (Mnassri et al., 2008b, 2009b). Une analyse de
diagnosticabilité de défauts basée sur les contributions montre que celles-ci garantissent un
diagnostic correct uniquement si les défauts sont simples (unidimensionnels) et de grandes
amplitudes. Dans le cas contraire, les approches des contributions peuvent généralement
considérer d’autres variables en défaut. Ainsi, il sera difficile d’isoler celles réellement en
défaut. En outre, les contributions ne permettent pas d’isolation des défauts multiples
où plusieurs variables sont simultanément en défaut en raison de la corrélation entre les
variables. Cette corrélation a été la clé d’un diagnostic mieux décisif basé sur l’approche
de reconstruction des indices de détection (Dunia et al., 1996; Dunia et Qin, 1998b,c,a;
Yue et Qin, 2001; Qin, 2003; Alcala et Qin, 2009, 2011). Le principe d’une telle méthode
s’est fondé sur l’élimination de l’influence de défauts sur l’indice de détection par une
reconstruction des variables à l’aide d’un modèle ACP.
Le succès de l’utilisation de l’ACP pour le diagnostic de défauts sur les processus en
utilisant l’approche de reconstruction a été enrichi par le développement d’un concept
fondamental qui représente l’isolabilité de défauts. On définit l’isolabilité comme étant la
capacité d’un diagnostic à retrouver les origines de défauts. Dans la littérature, un tel
concept a été négligemment étudié dans le cadre de l’ACP en le développant uniquement
pour une reconstruction de l’indice SP E (Dunia et Qin, 1998b,c,a; Qin, 2003). Ce cha-
pitre a pour objectif d’étendre et d’unifier un tel concept à tout indice de détection ayant
une forme quadratique. Ainsi, cette idée nous a permis la réalisation d’une analyse théo-
rique d’isolabilité de défauts par reconstruction de la distance combinée versus celles des
indice que combine en mettant en avant l’avantage que peut jouer une telle distance dans
l’isolation de défauts plus complexes (Mnassri et al., 2012a).
97
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
98
4.2. Isolation et isolabilité de défauts par reconstruction
où f̂I (k) est une estimation optimale de f(k) qui représente le vecteur d’amplitudes des
composants du défaut dans les directions des variables constituant le Ième ensemble. Une
telle estimation est obtenue par une minimisation d’un indice de détection γI insensible
à un tel défaut :
f̂I (k) = arg min {γI (k)} (4.2)
f(k)
où
1
γI (k) = k M 2 xI (k)k2 (4.3)
On peut déduire que l’estimé du vecteur d’amplitudes du défaut supposé ainsi que
le vecteur de données reconstruites projeté dans le sous-espace engendré par les vecteurs
colonnes de la matrice M de γ sont respectivement donnés par :
f̂I (k) = (ΞTI M ΞI )−1 ΞTI M x(k) (4.4)
1 1 1 1
M 2 xI (k) = (Im − M 2 ΞI (ΞTI M ΞI )−1 ΞTI M 2 ) M 2 x(k) (4.5)
1
Le Ième ensemble de variables n’est reconstructible que si la matrice M ΞI est de2
plein rang colonne. Cela implique que les variables constituant un tel ensemble ne doivent
pas être colinéaires.
Dans le but d’une simplification d’écritures, une décomposition en valeurs singulières
1
de la matrice M 2 ΞI mene au résultat suivant :
1
M 2 ΞI = ΞoI DI VTI (4.6)
où ΞoI ∈ Rm×r et VI ∈ Rr×r sont deux matrices orthonormées. DI ∈ Rr×r est une matrice
1
diagonale contenant les r valeurs propres de la matrice M 2 ΞI . Ainsi, l’équation (4.5)
peut être réécrite comme suit :
1 1
M 2 xI (k) = (Im − ΞoI ΞoT
I ) M x(k)
2 (4.7)
On note que (Im − ΞoI ΞoT I ) est une matrice idempotente. Par conséquent, l’indice de
détection insensible au défaut supposé peut être exprimé comme suit :
1
γI (k) = k(Im − ΞoI ΞoT
I ) M x(k)k
2
2
1 1
= xT (k) M 2 (Im − ΞoI ΞoT
I ) M x(k)
2 (4.8)
Puisque le numéro I correspond à un ensemble composé de r variables supposées en
défaut, il représente alors un numéro combinatoire de scénarii de défauts à considérer :
m!
I = {1, · · · , } (4.9)
r!(m − r)!
où ! représente l’opérateur factoriel. Dans le cas de défauts simples, I = i = {1, · · · , m}.
En considérant le vecteur d’observation de l’équation (2.59) qui est composé du défaut
réel FJ , l’indice de détection insensible au défaut supposé FI pourra être exprimé en
fonction de celui réel comme suit :
1 1
∗
γI (k) = k(Im − ΞoI ΞoT o oT
I ) M x (k) + (Im − ΞI ΞI )ΞJ M f(k)k
2 2
2
(4.10)
A partir de cette expression, deux déductions sont envisageables :
99
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
où Γ2I=J est un seuil de contrôle défini de la même manière que celui exprimé dans
l’équation (4.13).
L’expression de l’indice γI=J implique que l’influence du défaut réel est complète-
ment annulée. Egalement, les valeurs d’un tel indice reconstruit sont inférieures au
seuil de détection Γ2 donné par l’équation (3.2).
ii. Si la direction de reconstruction ΞI est différente de celle du défaut réel ΞJ alors
l’indice reconstruit est probablement supérieur à un seuil de contrôle approprié.
Autrement dit, le principe de reconstruction assure qu’un défaut assumé FI ne peut
pas être identifié comme un candidat si :
1
γI (k) = k(Im − ΞoI ΞoT 2 2
I ) M x(k)k > ΓI
2 (4.12)
Γ2I représente une limite de contrôle pour l’indice reconstruit γI . Puisque ce dernier
est caractérisé par une forme quadratique, l’expression appropriée d’un tel seuil peut être
déterminée en s’appuyant sur les travaux de Box (1954) :
avec
1 1
tr[(Σ M 2 (Im − ΞoI ΞoT 2 2
I )M ) ]
gγI = 1 1 (4.14)
tr[Σ M 2 (Im − ΞoI ΞoT
I )M ]
2
et
1 1
(tr[Σ M 2 (Im − ΞoI ΞoT
I ) M ])
2 2
hγI = 1 1 (4.15)
tr[(Σ M 2 (Im − ΞoI ΞoT 2 2
I )M ) ]
Ainsi, tout défaut supposé ne vérifiant pas l’inégalité (4.12) est identifié avec celui
du défaut réel. Par conséquent, on peut soupçonner des variables outre celles réellement
en défaut. Selon l’indice γ avec lequel la reconstruction est réalisée, les ensembles Îγ de
variables considérées en défaut sont déterminés en obéissant à l’argument suivant :
100
4.2. Isolation et isolabilité de défauts par reconstruction
1 1
∗
= (Im − ΞoI ΞoT 2
o oT
I ) M x (k) + (Im − ΞI ΞI ) M ΞJ f(k)
2 (4.17)
Puisque (Im −ΞoI ΞoT I ) est une matrice idempotente, on peut donc montrer en se basant
sur l’équation (3.7) que :
1 1
∗ ∗
k(Im − ΞoI ΞoT 2
o oT
I ) M x (k)k ≤ k(Im − ΞI ΞI )k × k M x (k)k ≤ Γ
2 (4.19)
Afin que le défaut actuel FJ soit suffisamment isolable de celui assumé FI , la condition
nécessaire donnée par l’inégalité (4.12) doit être satisfaite. Par conséquent, l’inégalité
suivante doit être vérifiée :
1 1
k M 2 xI (k)k2 ≥ (k(Im − ΞoI ΞoT 2 2
I ) M ΞJ f(k)k − Γ) > ΓI
2 (4.21)
Ainsi, on déduit que l’amplitude du défaut réel doit satisfaire la condition suivante :
1
k(Im − ΞoI ΞoT
I ) M ΞJ f(k)k > Γ + ΓI
2 (4.22)
Néanmoins, le concept de l’isolabilité d’un défaut doit être établi une fois que le défaut
lui-même est garanti détectable. En considérant l’idempotence de la matrice (Im −ΞoI ΞoT I ),
on montre que :
1 1
k(Im − ΞoI ΞoT
I ) M ΞJ f(k)k ≤ k M ΞJ f(k)k
2 2 (4.23)
En se référant à l’inégalité (4.22), on peut déduire que :
1
k M 2 ΞJ f(k)k > Γ + ΓI (4.24)
101
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
donnée par (4.12) est insuffisante pour garantir l’isolabilité d’un défaut. Pour cela, on doit
imposer l’hypothèse suivante :
γI (k) > Γ2 (4.25)
Celle-ci représente la nouvelle condition nécessaire qui doit être considérée plutôt que
celle de donnée par l’inégalité (4.12). Après reformulation du problème en considérant une
telle condition, le défaut réel FJ est garanti isolable de celui assumé FI par reconstruction
d’un indice quadratique γ quelconque si
1
k(Im − ΞoI ΞoT
I ) M ΞJ f(k)k > 2Γ
2 (4.26)
L’inégalité précédente représente la condition suffisante de l’isolabilité d’un défaut tout
en satisfaisant également sa détectabilité. Evidemment, elle représente une expression
unifiée vérifiant tout indice de détection ayant une forme quadratique (Mnassri et al.,
2012a).
En s’appuyant sur cette généralisation, nous pouvons aisément développer dans la
suite le concept d’isolation et isolabilité de défauts relatif à chacun des indices de détection
présentés dans le tableau 3.1.
où les paramètres gSP EI et hSP EI sont déterminés en utilisant respectivement les équations
1
(4.14) et (4.15) et en remplaçant les matrices M 2 et ΞoI respectivement par C̃ et Ξ̃oI .
Notamment, cette dernière est calculée en se basant sur l’équation (4.6), i.e.
T
C̃ΞI = Ξ̃oI D̃I ṼI (4.28)
Le développement des expressions correspondantes aux paramètres gSP EI et hSP EI ,
nous a permis de déduire que :
tr[Λ̃2 ] − 2 tr[P̃Λ̃2 P̃Ξ̃oI Ξ̃oT o oT 2
I ] + tr[(P̃Λ̃P̃Ξ̃I Ξ̃I ) ]
gSP EI = (4.29)
tr[Λ̃] − tr[P̃Λ̃P̃Ξ̃oI Ξ̃oT
I ]
et
(tr[Λ̃] − tr[P̃Λ̃P̃Ξ̃oI Ξ̃oT
I ])
2
hSP EI = (4.30)
tr[Λ̃2 ] − 2 tr[P̃Λ̃2 P̃Ξ̃oI Ξ̃oT o oT 2
I ] + tr[(P̃Λ̃P̃Ξ̃I Ξ̃I ) ]
Par déduction de l’inégalité (4.26), le défaut réel FJ est garanti isolable de celui
supposé FI par l’indice SP E si :
k(Im − Ξ̃oI Ξ̃oT
I )C̃ΞJ f(k)k > 2δ (4.31)
Nous rappelons qu’une telle condition d’isolabilité de défauts par reconstruction de
l’indice SP E est l’unique proposée dans la littérature par Dunia et Qin (1998b,c,a) et
Qin (2003). Dans ce cadre et grâce à l’équation (4.26), nous avons pu étendre une telle
étude au reste des indices (Mnassri et al., 2012a,b).
102
4.2. Isolation et isolabilité de défauts par reconstruction
Une simplification dans les expressions des deux coefficients permet de montrer que :
gT 2I = 1 (4.39)
et
hT 2I = ` − r (4.40)
Par définition, l’équation précédente représente le nombre de degrés de liberté relatifs
à l’indice T 2 où r variables ont été reconstruites. Un tel nombre doit être positif ou nul,
103
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
ce qui implique que le nombre maximal des variables qui peuvent être reconstruites simul-
tanément en utilisant la statistique T 2 de Hotelling doit respecter l’inégalité suivante :
r≤` (4.41)
D’autre part, ` représente le nombre optimal des CPs constituant le modèle ACP. Un
tel nombre est généralement très inférieur au nombre des variables du processus. Cela
peut limiter l’utilisation d’un tel indice dans la procédure d’isolation de défauts plus
particulièrement lorsque le nombre de variables qui sont simultanément en défaut est plus
grand que `.
Selon l’inégalité (4.26), l’indice T 2 de Hotelling peut garantir l’isolation du défaut réel
FJ de celui supposé FI si :
−2 1 T
k(Im − Ξ̌oI Ξ̌oT
I )P̂Λ̂ P̂ ΞJ f(k)k > 2τ (4.42)
En s’appuyant sur l’équation (4.6), la matrice Ξ̆oI est calculée comme suit :
1 T
Σ− 2 ΞI = Ξ̆oI D̆I V̆I (4.44)
Les paramètres gDI et hDI sont déterminés en utilisant respectivement les équations
1 1
(4.14) et (4.15) et en remplaçant les matrices M 2 et ΞoI respectivement par Σ− 2 et Ξ̆oI .
Cela nous a permis de déduire que :
gDI = 1 (4.45)
et
hDI = m − r (4.46)
Selon l’équation précédente, nous remarquons que le seul indice de détection permet-
tant une reconstruction simultanée d’un maximum de nombre des variables (r ≤ m) est
celui de Mahalanobis. Etant donné que le défaut réel est FJ , celui-ci est garanti isolable
de celui assumé FI au travers un tel indice si :
1
−2
k(Im − Ξ̆oI Ξ̆oT
I )Σ ΞJ f(k)k > 2% (4.47)
104
4.2. Isolation et isolabilité de défauts par reconstruction
Evidemment, la matrice orthonormée Ξ̄oI ∈ Rm×r est obtenue en vérifiant selon (4.6)
l’équation suivante :
1 T T
(δ −1 C̃ + τ −1 P̂Λ̂− 2 P̂ )ΞI = Ξ̄oI D̄I V̄I (4.49)
1
En substituant dans les équations (4.14) et (4.15) les matrices M 2 et ΞoI respective-
1 T
ment par (δ −1 C̃ + τ −1 P̂Λ̂− 2 P̂ ) et Ξ̄oI , on peut déterminer les expressions associées aux
paramètres gϕI et hϕI comme suit :
1 T 1 T
tr[(Σ(δ −1 C̃ + τ −1 P̂Λ̂− 2 P̂ )(Im − ΞoI ΞoT −1
I )(δ C̃ + τ
−1
P̂Λ̂− 2 P̂ ))2 ]
gϕI = T
(4.50)
tr[Σ(δ −2 C̃ + τ −2 P̂Λ̂−1 P̂ )(Im − ΞoI ΞoT
I )]
et
T
(tr[Σ(δ −2 C̃ + τ −2 P̂Λ̂−1 P̂ )(Im − ΞoI ΞoT
I )])
2
hϕI = 1 T 1 T
(4.51)
tr[(Σ(δ −1 C̃ + τ −1 P̂Λ̂− 2 P̂ )(Im − ΞoI ΞoT −1
I )(δ C̃ + τ
−1 P̂Λ̂− 2 P̂ ))2 ]
105
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
nous limitons dans cette thèse à une analyse d’isolabilité par reconstruction de l’indice
combiné versus celles de SP E et T 2 de Hotelling.
A partir des inégalités (4.31), (4.42) et (4.52), on peut poser les vecteurs ũ(k), ǔ(k) et
ū(k) dont les normes conditionnent à la kème observation l’isolabilité du défaut réel FJ
de celui supposé FI par reconstruction des indices SP E, T 2 et ϕ respectivement :
−2 1 T
ǔ(k) = (Im − Ξ̌oI Ξ̌oT
I )P̂Λ̂ P̂ ΞJ f(k)
o oT
= (Im − Ξ̌I Ξ̌I )Ξ̌J f(k) (4.54)
−1 −1 1 T
ū(k) = (Im − Ξ̄oI Ξ̄oT
I )(δ C̃ + τ P̂Λ̂− 2 P̂ )ΞJ f(k)
= (Im − Ξ̄oI Ξ̄oT
I )Ξ̄J f(k) (4.55)
avec
u(k) = (δ −1 Ξ̃oI Ξ̃oT
I Ξ̃J + τ
−1 o oT
Ξ̌I Ξ̌I Ξ̌J − Ξ̄oI Ξ̄oT
I Ξ̄J )f(k) (4.57)
En montrant également qu’à tout instant k, les vecteurs ũ, ǔ et u sont orthogonaux
deux à deux :
ũ(k)⊥ǔ(k), ũ(k)⊥u(k) et ǔ(k)⊥u(k) (4.58)
D’après (4.58), (4.56) et (4.52), la garantie d’isolabilité du défaut réel FJ de celui
assumé FI par reconstruction de la distance combinée peut être réécrite de la manière
suivante :
kū(k)k2 = (δ −1 kũ(k)k)2 + (τ −1 kǔ(k)k)2 + ku(k)k2 > (2β)2 (4.59)
Puisque la norme euclidienne est positive ou nulle, le domaine de définition de l’inéga-
lité précédente représente la zone externe d’un quart de sphère de rayon 2β et caractérisée
par ses trois variables principales telles que δ −1 kũ(k)k, τ −1 kǔ(k)k et ku(k)k (voir figure
4.1). Ainsi, le vecteur ū(k) peut être exprimé dans une base orthonormée B d’un espace
vectoriel euclidien E3 de dimension 3 comme suit :
−1
δ kũ(k)k
ū(k) = τ −1 kǔ(k)k (4.60)
ku(k)k
Autrement dit, tout défaut réel FJ est garanti isolable de celui supposé FI par recons-
truction de l’indice combiné si le point correspondant ayant comme coordonnées celles du
vecteur (4.60) est situé en dehors du quart de la sphère (figure 4.1). En particulier, un
tel défaut n’est garanti isolable ni par l’indice SP E ni par la distance T 2 de Hotelling
si δ −1 kũ(k)k ≤ 2 et τ −1 kǔ(k)k ≤ 2 respectivement. Lorsqu’un tel point est situé dans la
106
4.3. Diagnostic de défauts simples par les contributions
zone bleue en dessus du quart de la sphère de la figure 4.1, cela implique que le défaut
considéré est isolable uniquement par reconstruction de l’indice combiné. Par conséquent,
on peut déduire qu’il peut exister des défauts qui ne sont isolables ni par l’indice SP E ni
par celui de T 2 de Hotelling mais ils sont isolables par la distance combinée. Si β ≤ 1 et
le défaut est garanti isolable par reconstruction de l’indice SP E et/ou T 2, alors le même
défaut est également garanti isolable par reconstruction de l’indice combiné.
Bien qu’un tel indice combine les statistiques SP E et T 2 de Hotelling, on constate
théoriquement que son avantage en terme d’isolabilité de défauts par reconstruction ne
dépend pas de ceux des indices que combine. En outre, la distance combinée peut encore
être privilégiée dans ce cadre lorsque sa limite de contrôle β est faible.
107
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
Méthode Indice
SP E T2 ϕ γ
CDC Miller et al. (1998) Wise et al. (2006) Alcala et Qin (2011)
DC Alcala et Qin (2011) Qin et al. (2001) Cherry et Qin (2006) Alcala et Qin (2011)
108
4.3. Diagnostic de défauts simples par les contributions
où ` est le nombre des CPs constituant le sous-espace principal. ta (k) représente la kème
mesure de la aème CP. λa est la aème valeur propre. pai désigne le ième élément du aème
vecteur propre. xi (k) représente la kème mesure de la ième variable.
1/2 2
(t /λ )
Posons ci a a comme étant la contribution de la ième variable dans le calcul du
carré de la aème CP normalisée :
(t /λa )2
1/2 ta (k)
ci a (k) = p x (k) (4.65)
λa ai i
109
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
où c̃ni représente le nème élément de la ième colonne de la matrice C̃. x̃n (k) est la nème
mesure du vecteur résiduel x̃(k).
Notamment, une telle contribution peut avoir des valeurs négatives. Pour cela, Mnassri
x̃2
et al. (2008b,a) ont décidé d’annuler toute valeur négative donnée par ci n (k) (4.69) afin
qu’elle ne soit pas opposée au signe du carré du résidu correspondant.
110
4.3. Diagnostic de défauts simples par les contributions
Dans ce cadre, Mnassri et al. (2009b,a) ont montré que la contribution de la ième
variable dans le calcul du carré de la aème CP résiduelle est donnée par :
t2
cia (k) = ta (k)pai xi (k) (4.73)
Afin qu’une telle contribution soit positive ou nulle, Mnassri et al. (2009b,a) ont pro-
posé d’annuler toute valeur négative donnée par l’expression (4.73) car elle est opposée
au signe du carré de la CP correspondante.
On remarque qu’avec une telle écriture on ne peut pas appliquer le principe d’annula-
tion des contributions négatives par rapport à une CP normalisée.
Pour les deux formes de contributions proposées par décomposition partielle de l’indice
SP E en s’appuyant sur les résidus (4.71) ou sur les CPs résiduelles (4.74), nous avons
montré d’après l’annexe F qu’elles sont identiques. Toutefois, la différence dans leurs
résultats apparaı̂tra quand on annule les contributions négatives d’une variable donnée
relativement à un résidu ou à une CP résiduelle selon le principe de la technique utilisée.
Sans considération de ces annulations, nous avons montré que :
D’après les équations (4.75) et (4.76), on peut déduire que tout indice de détection γ
ayant une forme quadratique peut se décomposer partiellement comme suit :
m
X
γ(k) = xT (k) M ξi ξiT x(k) (4.77)
i=1
111
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
Ainsi, Alcala et Qin (2011) ont eu l’idée de déduire que la ième variable contribue par
décomposition partielle d’un indice quelconque ayant une forme quadratique par :
On note que ce type des contributions peut donner des valeurs négatives.
Une telle contribution a été utilisée pour la surveillance d’un bloc donné qui est supposé
indépendant des autres blocs. Par conséquent, les contributions diagonales se réduisent
à une surveillance univariée. Dans le cas où un processus n’est pas décomposable en des
blocs, ces contributions ne sont pas recommandées pour une détection de défaut car elles
ignorent les corrélations entre les variables. Cependant, elles peuvent être utilisées comme
des techniques d’analyse des contributions pour un diagnostic de défauts.
D’après Alcala et Qin (2011), la contribution diagonale de la ième variable à un indice
γ ayant une forme quadratique peut se présenter comme suit :
112
4.3. Diagnostic de défauts simples par les contributions
où fi est une estimation optimale de l’amplitude du défaut dans la direction de la ième
variable par reconstruction de l’indice γ. Le vecteur ξio est déterminé en utilisant le principe
de l’équation (4.6).
Selon Alcala et Qin (2009), la contribution de la ième variable par reconstruction de
l’indice γ représente le carré de la norme de l’amplitude estimée du défaut comme suit :
1
RBCiγ (k) = k M 2 ξi fˆi (k)k2
= xT (k) M ξi (ξiT M ξi )−1 ξiT M x(k)
xT (k) M ξi ξiT M x(k)
= (4.82)
ξiT M ξi
RBCiγ (k)
= (4.83)
γ(k)
On note que la contribution par reconstruction et celle par angle ne diffèrent que par
une constante prés qui est l’indice γ. Ce dernier est indépendant de la ième variable.
Par conséquent, les résultats d’un diagnostic de défauts basé sur ces deux approches
sont identiques. Dans le reste du chapitre, seule la contribution par reconstruction sera
considérée.
113
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
par rapport aux mesures obtenues lors du fonctionnement normal. Ainsi, le vecteur d’ob-
servation en défaut se réécrit comme suit :
Ainsi, le diagnostic d’un tel défaut est garanti correct par l’utilisation de l’approche
CDC si :
1 1
(ξjT M 2 ξj )2 ≥ (ξiT M 2 ξj )2 (4.86)
Malheureusement, une telle inégalité n’est pas toujours vérifiée. Par conséquent, la
méthode CDC ne peut pas garantir un diagnostic correct de défauts.
D’après cette équation, on constate que seule la variable réellement en défaut qui
contribue. Cela implique qu’une telle approche garantit un diagnostic correct de défauts
simples de grandes amplitudes.
114
4.4. Nouvelles approches pour un diagnostic de défauts multiples
1 1
!2
(ξjT M ξi )2 (M 2 ξj )T (M 2 ξi )
= 1
ξiT M ξi k M 2 ξi k
1 1
!2
k M 2 ξj k k M 2 ξi k
≤ 1 = ξjT M ξj (4.90)
k M ξi k
2
Cette inégalité implique que les défauts simples d’importantes amplitudes sont garantis
correctement diagnosticables en utilisant la méthode RBC.
Pour un tel type de défauts, et selon les équations (4.87), (4.88) et (4.89), les contri-
butions qui correspondent à la variable réellement en défaut sont identiques en utilisant
les approches P DC, RBC et DC. En outre, les variables qui ne sont pas en défaut ne
contribuent pas en se basant plus particulièrement sur les deux méthodes P DC et DC.
Une telle propriété présente un avantage car la variable en défaut peut se distinguer plus
facilement des autres variables en utilisant ces deux approches plutôt que la RBC.
115
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
où les vecteurs ξj1 et ξj2 représentent respectivement les j1 ème et j2 ème colonnes de la ma-
trice identité. Les scalaires fj1 (k) et fj2 (k) correspondent aux amplitudes des composants
du défaut réel dans les directions de la j1 ème et la j2 ème variable respectivement.
La substitution de l’équation (4.92) dans celle de (4.82) nous permet de déduire que :
γ
(ξjT1 M ξj2 )2
RBCi=j (k) = ξjT1 M ξj1 fj21 (k) + 2ξjT1 M ξj2 fj1 (k)fj2 (k) + fj22 (k) (4.94)
1 ξjT1 M ξj1
γ
(ξjT1 M ξj2 )2
RBCi=j (k) = ξjT2 M ξj2 fj22 (k) + 2ξjT1 M ξj2 fj1 (k)fj2 (k) + fj21 (k) (4.95)
2 ξjT2 M ξj2
Les équations (4.93), (4.94) et (4.95) représentent les contributions par reconstructions
unidimensionnelles respectivement de la ième variable qui n’est pas en défaut, de la j1 ème
et la j2 ème variable réellement toutes les deux en défaut. Malgré que le défaut est carac-
térisé par une grande amplitude, l’analyse de la relation entre ces équations montre que
les contributions des variables en défaut ne peuvent pas être garanties supérieures à celles
des variables saines. Par conséquent, la contribution par reconstruction unidimensionnelle
ne garantit pas un diagnostic correct de défauts multiples.
Puisque le défaut réel FJ est inconnu, on adopte le même principe que dans la
deuxième section de ce chapitre en supposant un défaut assumé FI affectant un Ième
ensemble de variables. D’après l’équation (4.8), l’indice insensible à un tel défaut peut
être exprimé comme suit :
1 1
γI (k) = xT (k) M x(k) − xT (k) M 2 ΞoI ΞoT
I M x(k)
2
1 1
= γ(k) − xT (k) M 2 ΞoI ΞoT
I M x(k)
2 (4.96)
116
4.4. Nouvelles approches pour un diagnostic de défauts multiples
Par déduction, Mnassri et al. (2012b) ont proposé que la contribution du Ième en-
semble de variables par reconstruction multidimensionnelle de l’indice γ est la suivante :
1 1
RBCIγ (k) = k M 2 ΞI f̂I (k)k2 = kΞoI ΞoT
I M x(k)k
2
2
1 1
= xT (k) M 2 ΞoI ΞoT
I M x(k)
2 (4.97)
1 1
Puisque kΞoI ΞoT
I M ΞJ f(k)k ≤ k M ΞJ f(k)k, alors :
2 2
117
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
Afin de remédier aux problèmes de diagnostic liés aux défauts complexes, nous avons
proposé une nouvelle approche de diagnostic plus performante en s’appuyant sur la RBC
multidimensionnelle comme suit :
γ(k)
RBCrIγ (k) = (4.100)
RBCIγ (k) + Γ2I
avec Γ2I représente le seuil de contrôle (4.13) de l’indice insensible au défaut supposé FI .
Nous avons appelé cette méthode par RBC ratio (Mnassri et al., 2012b) car elle dispose
de l’indice γ au numérateur comme un facteur commun pour les RBC ratio de tous les
ensembles de variables. Cependant, les termes de son dénominateur dont principalement
la RBC dépendent de l’ensemble de variables étudiées.
La théorie d’une diagnosticabilité de défauts en se basant sur cette méthode se dérou-
lera en deux étapes. Pour cet objectif, il est possible d’exprimer la RBCr en fonction des
indices γ et γI comme suit :
γ(k) γ(k)
RBCrIγ (k) = γ 2
= (4.101)
γ(k) − γ(k) + RBCI (k) + ΓI γ(k) − (γI (k) − Γ2I )
• 1er cas : I = J
A partir de l’inégalité (4.11), nous pouvons montrer que :
γ(k) γ(k)
2
≤ =1 (4.103)
γ(k) − (γI=J (k) − ΓI=J ) γ(k)
ainsi
γ
RBCrI=J (k) ≤ 1 (4.104)
• 2ème cas : I =6 J
L’inégalité (4.25) présente la condition nécessaire afin que le défaut réel FJ soit
garanti isolable de celui assumé FI . Par conséquent, on peut montrer que :
0 ≤ γ(k) − (γI (k) − Γ2I ) < γ(k) − (Γ2 − Γ2I ) ≤ γ(k) (4.106)
118
4.5. Exemple de synthèse
Il est clair que la limite de contrôle de l’approche proposée est égale à l’unité. La
diagnosticabilité de défauts par une telle méthode montre que les valeurs de la RBCr des
variables réellement en défaut sont garanties inférieures à un tel seuil. Autrement dit, le
défaut réel FJ est garanti identifiable. En outre, elle garantit de rejeter la possibilité qu’un
défaut assumé soit identifié comme un candidat si la condition nécessaire d’isolabilité
de défauts de l’inégalité (4.25) est satisfaite. Nous rappelons qu’une telle condition est
équivalente à celle déduite dans l’inégalité (4.26). Par conséquent, les défauts complexes
et qui sont détectables sont garantis identifiables par l’approche RBCr. Ainsi, ils sont
garantis isolables si leurs amplitudes vérifient l’inégalité (4.26). Entre autre, tout ensemble
de variables I ∈ ÎRBCr est considéré en défaut par l’approche RBCr avec ÎRBCr vérifie
l’argument suivante :
ÎRBCr = arg {RBCrIγ (k) ≤ 1} (4.109)
I∈I
On note que u et x̊8 représentent deux variables aléatoires normales centrées et d’écarts
types de 0, 02 et 1 respectivement. Un bruit blanc v constitué de 8 variables aléatoires
indépendantes et identiquement distribuées de moyennes nulles et d’écarts types iden-
tiques de 0, 7 a été superposé aux variables de l’équation (4.110). Ainsi, le kème vecteur
d’observation à 8 composantes est généré de la façon suivante :
où T
x̊(k) = x̊1 (k), . . . , x̊8 (k) (4.112)
et
v(k) ∼ N (08 , (0.7)2 I8 ) (4.113)
I8 représente une matrice identité d’ordre 8.
Une matrice de données X a été constituée de N = 3000 observations dont les 1500
premières qui représentent un fonctionnement normal du processus ont été réservées pour
119
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
3 3
10 10
2 2
10 10
1 2 3 4
5 6 7 8 1 2 3 !4"#$ 5 % 6 7 8
la construction d’un modèle ACP. Notamment, les données d’une telle matrice sont cen-
trées et réduites en utilisant les moyennes et les écarts types des données réservées au
modèle. Selon la figure 4.2, un tel modèle doit être constitué de 4 CPs. Le minimum du
critère VNR correspond à 3 CPs, ce qui implique l’existence de 3 importantes sources de
corrélation. Ainsi, le critère VNRVI indique l’existence d’une variable indépendante. En
effet, son minimum a été atteint pour κop = 4 CPs dans les données transformées de Y,
ce qui signifie selon le principe d’un tel critère que le nombre optimal des CPs dans les
données de X est q = 8 − κop = 4 CPs.
Dans le but d’illustrer un diagnostic de défauts en utilisant les différentes méthodes
décrites dans ce chapitre, trois défauts sont introduits aux données de la matrice X. Le
premier noté F{3} représente un défaut simple ayant une forme d’une dérive affectant la
troisième variable (x3 ) entre les instants 1550 et 1800 :
où Ξ{1,7} est une matrice orthonormée composée de la première (ξ1 ) et la septième (ξ7 )
colonne de la matrice identité. f(k) est un vecteur constitué de fx1 (k) et fx7 (k) qui repré-
sentent les amplitudes au kème instant des composants du défaut dans les directions des
variables correspondantes, avec :
120
4.5. Exemple de synthèse
5
0
1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000
5
0
1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000
5
0
1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000
5
0
1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000
5 2 3
0
1000 1200 1400 1600 18002000
!#"%$'&)(+*-,/.)01#%2200
$ 2400 2600 2800 3000
Pour une interprétation plus facile des résultats, nous suggérons que tout indicateur
ayant pour objectifs la détection ou l’isolation d’un défaut suite à une comparaison par
rapport à un seuil soit pondéré par la valeur d’un tel seuil afin que la comparaison s’effectue
par rapport à l’unité. Pour les méthodes des contributions, l’affichage de leurs courbes
pour toutes les variables est très encombrant rendant ainsi la distinction d’une courbe
parmi d’autres très difficile voire impossible dans la même figure. Puisque nous avons
une connaissance a priori sur les défauts, nous proposons d’afficher dans les figures les
différences entre la contribution de la variable réellement en défaut et celles des autres
variables :
Contγj (k) − Contγi (k) (4.120)
121
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
où Contγj représente une contribution donnée. Dans le cas des défauts simples, j représente
le numéro de la variable réellement en défaut. En revanche et pour le cas des défauts mul-
tiples, l’index j devient J afin d’exprimer l’ensemble des variables réellement en défaut.
Si l’équation (4.120) aboutit à des valeurs négatives, cela implique que la contribution de
la (l’ensemble des) variable(s) réellement en défaut n’est pas la plus grande.
A partir de la figure 4.3, on constate que les défauts F{1,7} et F{6,8} ont été remar-
quablement détectés dès leurs apparitions par tous les indices de détection. Cependant,
celui du F{3} qui représente un défaut simple a été détecté avec des retards. Sa détec-
tion a commencé à partir des instants 1634, 1593, 1645 et 1593 respectivement par les
indicateurs SP E, SW E, ϕ et D. L’amplitude de ce défaut n’a pas permis celui-ci d’être
détectable en très grande partie plus particulièrement par l’indice T 2 de Hotelling.
122
4.5. Exemple de synthèse
Défaut Indice
SP E SW E T2 ϕ D
F{1,7} {1, 7} et {1, 3} {1, 7}, {1, 3} et {3, 7} {1, 7} {1, 7}
F{6,8} {1, 6}, {2, 6}, {3, 6}, {4, 6}, {6, 8} {6, 8} {6, 8}
{5, 6}, {6, 7} et {6, 8}
Table 4.2 – Ensembles des variables identifiés responsables des défauts multiples corres-
pondants par l’approche de reconstruction et la RBCr relativement aux indices
de l’ampleur des contributions peut conduire à des résultats erronés. Cela s’est justifiée
plus particulièrement par les contributions P DC et DC en utilisant les indices SP E,
SW E et D et les contributions CDC et RBC basées sur l’indice D. Ces indices de détec-
tion ont détecté l’existence du défaut F{3} plus tôt avant que celui-ci ne soit correctement
identifié par de telles contributions. Cependant, la méthode de reconstruction des indices
et celle de la RBCr garantissent une identification correcte de la variable en question
dès l’apparition du défaut. Tout dépend de la nature et de l’amplitude d’un tel défaut,
celui-ci peut ne pas être isolable. En effet, ces deux méthodes peuvent identifier également
d’autres variables en défaut.
123
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
4
4 798 % 7:8 %;
2 2
0 0
−2 −2
1500 1600 1700 1800 1900 1500 1600 1700 1800 1900
<>=@?
2.5
4
2 <> =@? A 9 B CED F
A 9B G D H
2 1.5
1
0
0.5
−2 0
1500 1600 1700 1800 1900 1500 1600 1700 1800 1900
4
1
0.8
2
798 9IJKL
0.6
97 8 9I M
0
0.4
−2
1500 !#"%$'1700
1600 &)(*+,.-0/2143.56(+ 1800 1900 1500 1600!#"%$'1700
&)(*+,.-0/2143.56(+ 1800 1900
Figure 4.4 – Diagnostic du défaut F{3} par différentes méthodes basées sur l’indice SPE
5
4 78 $ 798 $:
2
0
−5 −2
1500 1600 1700 1800 1900 1500 1600 1700 1800 1900
2.5 ;=<?>
5 2 ;=<?> @BADCE FHG I
@BADC J G K
1.5
0
1
−5 0.5
0
1500 1600 1700 1800 1900 1500 1600 1700 1800 1900
1
5
0.9
7 8 L P
0.7
−5
0.6
1500 "!$#&1700
1600 %('*),+-/.10243/56'*,+ 1800 1900 1500 1600 "!$#&1700
%('*),+-/.10243/56'*,+ 1800 1900
Figure 4.5 – Diagnostic du défaut F{3} par différentes méthodes basées sur l’indice SWE
124
4.5. Exemple de synthèse
8
6 798 # 7:8 #;
6
4
4
2 2
0 0
−2 −2
1500 1600 1700 1800 1900 1500 1600 1700 1800 1900
8
2.5 <>= ?A@B
6 2 >< = ?A@
CED F
G D H
4 1.5
2 1
0 0.5
−2 0
1500 1600 1700 1800 1900 1500 1600 1700 1800 1900
8
1.5
798 9IJK L
97 8 9I M
6
1
4
2
0.5
0
−2 0
1500 !#"%1700
1600 $'&)(+*,.-0/2143.56&)+* 1800 1900 1500 !#"%1700
1600 $'&)(+*,.-0/2143.56&)+* 1800 1900
Figure 4.6 – Diagnostic du défaut F{3} par différentes méthodes basées sur l’indice T2
6
6 465 475 8
4 4
2 2
0 0
1500 1600 1700 1800 1900 1500 1600 1700 1800 1900
6
6 9; :=< >? @BA C
4
9; :=< > D A E
4
2
2
0
0
1500 1600 1700 1800 1900 1500 1600 1700 1800 1900
6
3
465 6FGH I
4 2 64 5 6F J
2 1
0
0
1500 "1700
1600 !$#&%(')+*-,/.10+23#&(' 1800 1900 1500 "1700
1600 !$#&%(')+*-,/.10+23#&(' 1800 1900
Figure 4.7 – Diagnostic du défaut F{3} par différentes méthodes basées sur l’indice ϕ
125
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
5 10
5
0
0
1500 1600 1700 1800 1900 1500 1600 1700 1800 1900
9;:=<
8
10
9;:=< >@? A
6 B ? C
5
4
0 2
0
1500 1600 1700 1800 1900 1500 1600 1700 1800 1900
40
2.5 465 6IJ
K L
30 2 64 5 6I
20 1.5
M
10 1
0 0.5
−10 0
1500 "1700
1600 !$#&%(')+*-,/.10+23#&(' 1800 1900 1500 1600 D; @1700
!E#&% ')+*F,&.10G2H#& ' 1800 1900
Figure 4.8 – Diagnostic du défaut F{3} par différentes méthodes basées sur l’indice D
2.5
2
1.5
0.5
0
1900 2000 2100 2200 2300 2400 2500
2 (
!#"%$'& )!#"%*'&
1.5 (
!#"%$'& ,
+ !#"%*'&
1
0.5
0
1900 2000 2100 2200 2300 2400 2500
0.995
DEF
F!G"%*&
0.99 D F
!#"%$'&
0.985
1900 2000 2100 -/.0214362200
5879:;=<?>,@)A=BC70: 2300 2400 2500
Figure 4.9 – Diagnostic du défaut F{1,7} par différentes méthodes basées sur l’indice SPE
126
4.5. Exemple de synthèse
2.5
2
1.5
0.5
0
1900 2000 2100 2200 2300 2400 2500
6 (
!#"%$'& )!#"%*'&
(
4 !#"%$'& ,
+ !#"%*'&
0.998
FG
0.996 :!H"%*&
F
0.994 !#"%$'&
Figure 4.10 – Diagnostic du défaut F{1,7} par différentes méthodes basées sur l’indice
SWE
1.5
1
0.5
0
1900 2000 2100 2200 2300 2400 2500
5 #
"! $ %"!
4 #
3 "! '& %"!
2
1
0
1900 2000 2100 2200 2300 2400 2500
1
0.99
0.98
BC
0.97 6D E %!
B
0.96 "!
0.95
1900 2000 2100 (*),+.-0/22200
14365879;:=<'>$?;@A36+87 2300 2400 2500
Figure 4.11 – Diagnostic du défaut F{1,7} par différentes méthodes basées sur l’indice
T2
127
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
3
2
0
1900 2000 2100 2200 2300 2400 2500
1.01
@A4 BC#
1.005 @
0.995
1900 2000 2100 &('*),+.-02200
/214365 798;:%<"=9>?14)65 2300 2400 2500
Figure 4.12 – Diagnostic du défaut F{1,7} par différentes méthodes basées sur l’indice ϕ
3
2
0
1900 2000 2100 2200 2300 2400 2500
4 !
"#
!
2 %$ #
−2
1.015 @A
4BC#
1.01 @
1.005
0.995
1900 2000 2100 &('*),+.-02200
/214365 798;:%<"=9>?14)65 2300 2400 2500
Figure 4.13 – Diagnostic du défaut F{1,7} par différentes méthodes basées sur l’indice D
128
4.5. Exemple de synthèse
3
2
0
2500 2550 2600 2650 2700 2750 2800 2850 2900 2950 3000
'
3 "!$#&% (*)+!$&%
'
"!$#&% -
, *)+!$&%
2
2500 2550 2600 2650 2700 2750 2800 2850 2900 2950 3000
0.999
Figure 4.14 – Diagnostic du défaut F{6,8} par différentes méthodes basées sur l’indice
SPE
3
2
0
2500 2550 2600 2650 2700 2750 2800 2850 2900 2950 3000
6 (
!#"%$'& )+*"%'&
(
4 !#"%$'& -
, +*"%'&
2500 2550 2600 2650 2700 2750 2800 2850 2900 2950 3000
0.999
FG
;+*G"%&
0.998 F
!#"%$'&
0.997
2500 2550 2600 2650 2700.0/1325472750
698;:<=?>A@-B)C?DE8;12800
< 2850 2900 2950 3000
Figure 4.15 – Diagnostic du défaut F{6,8} par différentes méthodes basées sur l’indice
SWE
129
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
3
2
0
2500 2550 2600 2650 2700 2750 2800 2850 2900 2950 3000
3 "
! # !
2
−1
−2
2500 2550 2600 2650 2700 2750 2800 2850 2900 2950 3000
1.002
0.998 ?
0.996 ?@
!
0.994
2500 2550 2600 2650 2700$&%('*),+.2750
-0/214357698#:<;7=>/2'42800
3 2850 2900 2950 3000
Figure 4.16 – Diagnostic du défaut F{6,8} par différentes méthodes basées sur l’indice
T2
3
2
0
2500 2550 2600 2650 2700 2750 2800 2850 2900 2950 3000
2
1.5
1
0.5
0
−0.5
2500 2550 2600 2650 2700 2750 2800 2850 2900 2950 3000
1.002
0.998 :
; <0
0.996 :=
0.994
2500 2550 2600 2650 2700 "!$#&%(2750
'*),+.-0/2143 576289),!.2800
- 2850 2900 2950 3000
Figure 4.17 – Diagnostic du défaut F{6,8} par différentes méthodes basées sur l’indice ϕ
130
4.6. Conclusion
3
0
2500 2550 2600 2650 2700 2750 2800 2850 2900 2950 3000
3 !
2
1
0
−1
−2
−3
2500 2550 2600 2650 2700 2750 2800 2850 2900 2950 3000
1.002
0.998 =
0.996 =>
0.994
2500 2550 2600 2650 2700"$#&%('*),2750
+.-0/2135476 8:95;<-0%22800
1 2850 2900 2950 3000
Figure 4.18 – Diagnostic du défaut F{6,8} par différentes méthodes basées sur l’indice D
4.12, 4.13, nous constatons que cette méthode a assuré une plus grande contribution pour
l’ensemble des variable {1, 7}, ce qui signifie que le défaut F{1,7} est correctement identifié
par la RBC en utilisant les indices ϕ et D.
D’après le tableau 4.2 ainsi que les figures 4.16, 4.17 et 4.18, le défaut F{6,8} qui a
été introduit aux niveaux des variables x6 et x8 a été correctement localisé par les trois
approches en utilisant les indices T 2 de Hotelling, ϕ et D. Par ailleurs, l’investigation de ce
défaut avec l’approche de reconstruction et la RBCr en s’appuyant sur les indices SP E et
SW E a abouti à l’identification de sept ensembles de variables en défaut (voir tableau 4.2).
Les figures 4.14 et 4.15 montrent que l’ensemble {6, 8} composé des variables réellement
en défaut ainsi qu’à titre d’exemple l’ensemble {4, 6} disposent des courbes qui sont au
dessous de l’unité en particulier avec l’indice SP E. En se référant à l’équation (4.120),
l’approche de contribution multidimensionnelle (RBC) utilisant les indices SP E et SW E
a assuré des valeurs positives exceptionnellement durant les dernières observations du
défaut (figures 4.14 et 4.15). D’après l’analyse de diagnosticabilité, l’amplitude du défaut
F{6,8} durant ces quelques dernières observations est importante permettant ainsi à la
RBC de garantir un diagnostic correct.
4.6 Conclusion
Dans ce chapitre, nous avons étendu le concept d’isolabilité de défauts par l’approche
de reconstruction à tout indice de détection ayant une forme quadratique. Une telle gé-
néralisation nous a permis d’élaborer une analyse théorique d’isolabilité de défauts par
131
Chapitre 4. Théorie d’un diagnostic de défauts par ACP
132
Conclusion générale & perspectives
133
Conclusion générale & perspectives
Les trois premiers sont utilisables uniquement avec des données non normalisées entachées
par un bruit blanc. Le quatrième critère qui représente la variance non reconstruite est
originairement conçu afin qu’il soit valable indépendamment de la nature des données.
Toutefois, il est préférable que ces données soient exprimées dans la même échelle pour
une meilleure mise en évidence d’une ACP. Puisque le critère VNR est en relation directe
avec les paramètres fournis par l’ACP, nous avons étudié son comportement vis-à-vis des
données normalisées contrairement aux trois autres critères.
A partir des résultats de simulation, nous avons constaté que le critère AIC surestime
souvent le nombre utile des CPs. En s’appuyant sur une comparaison approfondie des
résultats de tous les critères présentés, le MDL semble être le critère le plus efficace.
Néanmoins, sa précision dans le choix de la dimension du modèle est fortement liée au
nombre N d’observations considérées pour la modélisation. Une sélection basée sur le
MDL converge vers le nombre correct des CPs lorsque le nombre d’observations est
assez important. En effet, le paramètre N entre en vigueur d’une façon explicite dans
l’expression d’un tel critère. Ainsi, l’optimalité est assurée d’un point de vue mathématique
lorsque N tend vers l’infini. Dans la pratique, un système est généralement représenté par
un nombre fini d’observations qui peut être pour autant insuffisant afin que le critère
MDL exprime convenablement le nombre nécessaire des CPs. Par conséquent, on ne peut
pas savoir si un tel critère converge finalement vers le nombre correct des CPs. D’après les
résultats de simulation et pour un nombre insuffisant d’observations, nous avons constaté
que ce critère ne retient pas souvent les CPs associées aux variables indépendantes de
faibles variances.
Le critère IE abandonne souvent les CPs de faibles variances bien qu’elles soient théo-
riquement supposées être retenues dans le modèle. Cet inconvénient a été montré théori-
quement dans le cadre de cette thèse. L’avantage dans l’utilisation du critère VNR étant
dans la considération des données normalisées, ce qui signifie que toutes les variables sont
exprimées dans la même échelle. Malgré cette caractéristique, nous avons remarqué qu’un
tel critère ne prend pas en compte les variables indépendantes et quasi-indépendantes
bien qu’en l’absence de bruit de mesures ces variables se transforment en des CPs dont
les variances sont non nulles. Dans se stade, nous avons également contribué par une dé-
monstration théorique confirmant la limitation de ce critère. En effet, nous avons montré
que le nombre des CPs qui correspond au minimum d’un tel critère est invariant en l’addi-
tion des variables indépendantes et quasi-indépendantes. Autrement dit, le critère VNR
est insensible à la présence de ce type des variables. Ainsi, son minimum correspond au
nombre des CPs uniquement pour les variables qui sont linéairement corrélées les unes
aux autres. En outre, une telle démonstration met en évidence l’inefficacité d’un tel critère
en considérant des données non normalisées présentant des variables indépendantes. La
synthèse d’une telle étude comparative nous a permis de conclure que seuls les critères
MDL et VNR peuvent être considérés intéressants à l’égard de leur comportement et
principe respectivement. Cependant, ils présentent des inconvénients rendant souvent les
décisions incertaines.
Dans le but d’exploiter le principe du critère VNR tout en comptant les variables
indépendantes et quasi-indépendantes, nous avons établi à travers une généralisation la
variance de l’erreur de reconstruction d’un indice quelconque ayant une forme quadratique.
Celle-ci a pour objectif de révéler la variance non reconstruite de chacun des indices de
134
détection connus dans le cadre de l’ACP. Notamment, la variance de l’erreur de recons-
truction de l’indice SP E n’est autre que le classique critère VNR. Les variances non
reconstruites relatives aux restes des indices représentent des nouveaux critères présentés
dans cette thèse. Une analyse théorique des comportements de tels critères nous a permis
de déduire que les variances non reconstruites des indices SW E, T 2 de Hotelling ainsi que
la distance de Mahalanobis ne peuvent pas être utilisées pour le choix d’un modèle ACP.
Par ailleurs, la particularité est constatée dans la variance de l’erreur de reconstruction
de l’indice combiné. Une telle variance dépend du nombre des CPs ainsi qu’un seuil de
signification introduit implicitement dans les limites de contrôle des indices que combine
la distance combinée. Dans ce cadre, il est difficile d’établir une consistance théorique de
ce nouveau critère. Par contre, les résultats de simulation ont montré qu’il est capable de
déterminer le nombre optimal des CPs en s’appuyant sur un choix très approprié et non
ordinaire du seuil de signification. Nous avons également constaté qu’il présente parfois
des résultats non stationnaires. Pour remédier à ces inconvénients, nous avons proposé
une variance non reconstruite relative à un nouvel indice combiné. L’objectif étant de
faciliter la tâche du choix de la valeur du seuil de signification. Le nouveau critère montre
des résultats plus efficaces et mieux stationnaires. Néanmoins, les deux critères propo-
sés demeurent dans leurs globalités incertains, aussi faut-il disposer d’une connaissance a
priori ou d’une expertise pour prendre la décision convenable. En effet, les deux critères
sont considérés comme étant empiriques car ils s’appuient uniquement sur l’expérience.
L’originalité principale dans nos contributions pour un choix optimal du modèle ACP
est introduite par la proposition d’un troisième critère noté VNRVI. Celui-ci représente
la variance de l’erreur de reconstruction relative à des nouvelles données. En s’appuyant
sur un changement de représentation des données, nous avons supposé que ces données
qui sont normalisées et observées réellement sont en réalité issues d’une transformation
linéaire d’autres données mieux exploitables en présence des variables indépendantes et
quasi-indépendantes. En se basant sur ce nouveau critère, la détermination du nombre
optimal des CPs des nouvelles données sert à déduire celui des données réellement ob-
servées en comptant évidemment ce type des variables. Dans ce cadre, nous avons établi
théoriquement les conditions garantissant l’optimalité de sélection à travers un tel critère.
Les résultats de simulation ont validé notre théorie en prouvant ainsi qu’un tel critère
étant plus efficace qu’aux autres critères présentés dans cette thèse.
Dans l’objectif d’un diagnostic de défauts par l’approche de reconstruction, la première
contribution était élaborée par une généralisation du concept d’isolabilité de défauts à tout
indice de détection ayant une forme quadratique. Cette généralisation nous a permis en
conséquence de réaliser une analyse théorique d’isolabilité de défauts par reconstruction
de l’indice combiné versus celles des indices que combine (SP E et T 2 de Hotelling). Une
telle analyse a mis en avant l’avantage que peut jouer la distance combinée dans l’isolation
des défauts caractérisant plus particulièrement les variables colinéaires. Ainsi, il peut y
exister des défauts qui ne sont garantis isolables ni par l’indice SP E ni par celui du T 2
par contre ils peuvent être garantis isolables uniquement par la distance combinée.
Dans le cadre d’un diagnostic de défauts basé sur les approches des contributions,
celles-ci sont dédiées pour diagnostiquer plus particulièrement les défauts simples. Ainsi,
nous avons proposé une nouvelle méthode de contribution par décomposition partielle de
l’indice SP E. Une analyse de diagnosticabilité de défauts basée sur une telle approche ga-
135
Conclusion générale & perspectives
136
A
Limitation du critère VNR
représente leur matrice de covariance ou de corrélation dans le cas où les données sont nor-
malisées. P et Λ représentent respectivement les matrices des vecteurs et valeurs propres
de Σ.
En présence d’un bruit de variance non nulle, il existe alors un nombre optimal de q CPs
assurant le minimum de la variance non reconstruite de chaque variable. En considérant
une matrice de corrélation donc les données sont normalisées, le minimum du critère VNR
est atteint pour ` = q :
q = arg min {VNR(`)} (A.2)
`
avec
m
X ξjT C̃ΣC̃ξj
VNR(`) = (A.3)
j=1
(ξjT C̃ξj )2
T
où C̃ = P̃P̃ et P̃ ∈ Rm×(m−`) est une matrice composée des (m − `) vecteurs propres
de la matrice P. Puisque le modèle optimal est engendré par les q premières CPs, une
subdivision appropriée de P nous permet d’écrire :
P = Û Ũ (A.4)
137
Annexe A. Limitation du critère VNR
avec ∈ Rm est un vecteur caractérisé par une norme qui tend vers zéro puisque la
variable ajoutée est indépendante. Ce vecteur est composé des coefficients de corrélation
d’une telle variable avec les autres. V et D représentent respectivement les matrices des
vecteurs et valeurs propres de M.
En considérant la condition d’indépendance de la variable ajoutée, kk ≈ 0, la matrice
V peut être exprimée approximativement en fonction de P en appliquant des subdivisions
appropriées :
Û φ2 Ũ
V≈ T (A.6)
φ1 ω φT3
où φ1 ∈ Rq , φ2 ∈ Rm et φ3 ∈ R(m−q) sont des vecteurs dont les normes tendent respecti-
vement vers des zéros ou également kφ1 k |ω|, kφ2 k |ω| et kφ3 k |ω|. Puisque V
est une matrice orthonormée, cela implique que |ω| est proche de l’unité.
Notons par z et ~ respectivement la nouvelle variance non reconstruite globale et
le nouveau paramètre qui désigne le nombre des CPs exprimés dans la nouvelle base de
données en prenant en considération la variable ajoutée :
m+1 T T
X ξiT ṼṼ MṼṼ ξi
z(~) = T
(A.7)
i=1 (ξiT ṼṼ ξi )2
où Û1 ∈ Rm×~ et Û2 ∈ Rm×(q−~) sont respectivement composées des ~ premiers et (q − ~)
derniers vecteurs de la matrice Û. φ11 ∈ R~ et φ12 ∈ R(q−~) sont deux vecteurs respecti-
vement constitués des ~ premiers et (q − ~) derniers éléments du vecteur φ1 .
Cette décomposition nous permet d’exprimer la matrice Ṽ comme suit :
Û2 φ2 Ũ
Ṽ = T (A.9)
φ12 ω φT3
En considérant les approximations présentées au départ, nous montrons que :
" #
T T
ṼṼ ≈ Û2 Û2 + ŨŨ θ
T
(A.10)
θT ω2
et " #
T T T T
ṼṼ MṼṼ ≈ Û2 Û2 ΣÛ2 Û2 + ŨŨ ΣŨŨ ψ
T T
T
(A.11)
ψ ω4
138
où θ ∈ Rm et ψ ∈ Rm . D’après ces deux dernières équations ainsi que celle de (A.7), le
critère z peut être exprimé comme suit :
T T
h T T
i
T
m
X i ξ Û Û
2 2 Σ Û Û
2 2 + ŨŨ ΣŨŨ ξi
z(~ ≤ q) ≈ 1 + h T T
i (A.12)
T 2
i=1 (ξi Û2 Û2 + ŨŨ ξi )
Puisque Û2 et Ũ sont orthogonales, nous montrons que le deuxième terme de l’équation
(A.12) représente l’expression du critère VNR(`) avec ` = ~ ≤ q :
T T
h T T
i
m ξ T Û Û ΣÛ Û + ŨŨ ΣŨŨ ξi m T T
X i 2 2 2 2 X ξiT P̃P̃ ΣP̃P̃ ξi
h T T
i = T
i=1 (ξi
T
Û Û
2 2 + ŨŨ ξi )2
i=1 (ξiT P̃P̃ ξi )2
m
X ξjT C̃ΣC̃ξj
=
j=1
(ξjT C̃ξj )2
= VNR(` ≤ q) (A.14)
2ème cas : ~ = q + 1 Ce cas représente le calcul du critère z lorsque le nombre des CPs
sélectionnées correspond à la variable intercalée. Autrement dit, cette dernière qui repré-
sente toute seule une CP sera considérée dans le sous-espace principal. D’après l’équation
(A.9), la matrice Ṽ aura la forme suivante :
Ũ
Ṽ = T (A.16)
φ3
T
Puisque Ũ est une matrice orthonormée, c’est à dire Ũ Ũ = I(m−q) , nous pouvons
calculer ce qui suit :
" T T T
#
T T ŨŨ + Ũφ3 φT3 Ũ Ũφ3 + Ũφ3 φT3 Ũ
ṼṼ ṼṼ ≈ T T (A.18)
φT3 Ũ + φT3 φ3 φT3 Ũ φT3 φ3 + (φT3 φ3 )2
139
Annexe A. Limitation du critère VNR
T
Puisque ṼṼ représente une matrice idempotente, i.e. :
T T T
ṼṼ ṼṼ = ṼṼ (A.19)
l’identification entre les termes des équations (A.17) et (A.18), nous mène à déduire que
Ũφ3 est un vecteur nul. Egalement, φT3 φ3 représente un scalaire qui tend vers zéro, ce qui
implique que (φT3 φ3 )2 est très négligeable devant φT3 φ3 . Ainsi, φT3 φ3 ≈ φT3 φ3 + (φT3 φ3 )2 . Ces
déductions nous permettent d’écrire :
" T T T
#
T
T T ŨŨ ΣŨŨ ŨŨ φ3 φ3
ṼṼ MṼṼ ≈ T (A.20)
φ3 φ3 ŨŨ φ3 φ3 + (φT3 φ3 )2
T T T
D’après (A.7),
m T T
1 X ξ T ŨŨ ΣŨŨ ξ
i i
z(~ = q + 1) ≈ 1 + T + (A.21)
φ3 φ3 i=1 (ξ T ŨŨT ξ )2
i i
3ème cas : ~ > q + 1 Ce cas sera représenté par une matrice résiduelle Ṽ composée des
(m + 1 − ~) dernières colonnes de la matrice V de l’équation (A.6) ou également (A.16).
Une décomposition appropriée du dernier bloc de V comme suit :
Ũ Ũ1 Ũ2
= T (A.23)
φT3 φ13 φT23
140
ainsi
m T T
1 X ξ T Ũ Ũ ΣŨ Ũ ξ
i 2 2 2 2 i
z(~ > q + 1) ≈ 1 + T + T
(A.27)
φ23 φ23 i=1 T
(ξ Ũ Ũ ξ )2
i 2 2 i
Notamment, le troisième terme de cette équation correspond au critère VNR pour
` = (~ − 1) CPs, d’où :
1
z(~ > q + 1) ≈ 1 + + VNR(` = ~ − 1) (A.28)
φT23 φ23
Nous notons d’après (A.23) que (φT23 φ23 )−1 ≥ (φT3 φ3 )−1 . Selon l’hypothèse de l’équation
(A.2), le minimum du critère VNR correspond à q CPs. Par conséquent, l’équation (A.29)
montre que :
arg min {z(~)} = arg min {VNR(`)} = q (A.30)
~ `
Cela implique que la variance non reconstruite ne prend plus en considération les
variables indépendantes et quasi-indépendantes. En effet, elle est insensible à leurs pré-
sences. Le nombre des CPs qui correspondent au minimum du critère VNR appliqué sur
des données normalisées représente tout simplement le nombre des CPs uniquement entre
les variables corrélées.
141
Annexe A. Limitation du critère VNR
142
B
Limitation du critère IE
En présence d’un bruit i.i.d de variance identique σ 2 non nulle et d’après (2.71), les
valeurs propres de la matrice de covariance Σ représentent les éléments diagonaux de la
matrice suivante : " #
ˆ 2
Λ = Λ̊ + σ Iq 2 0 (B.1)
0 σ Im−q
ˆ
où Λ̊ ∈ Rq×q est la matrice diagonale donnée par (2.32). Elle est constituée par les q valeurs
propres non nulles de la matrice de covariance des variables étudiées sans la présence du
bruit de mesures.
Selon Malinowski (1977), le critère IE est supposé être efficace uniquement dans le
cas d’une matrice de covariance de données entachées par un bruit indépendant et iden-
tiquement distribué. Par conséquent, l’étude d’un tel critère se base principalement sur
l’équation (B.1). Afin d’établir une consistance théorique, Malinowski (1977) s’est limité à
l’étude du comportement de la fonction IE en montrant sa croissance au-delà de la qème
CP. Une telle propriété est justifiable car, d’après (B.1) et (2.52), ce critère peut s’écrire
pour un nombre de CPs supérieure ou égale à q comme suit :
12
`σ 2
IE(` ≥ q) = (B.2)
Nm
q
! 12
2
` X `σ
IE(` < q) = λ̊a + (B.3)
N m(m − `) a=`+1 Nm
143
Annexe B. Limitation du critère IE
Puisque IE présente des valeurs positives ou nulles, on peut alors vérifier le signe de
la différence suivante pour étudier son comportement :
q
X
2
(m − `) (` − 1)λ̊` − (m − ` + 1)σ −m λ̊a
2 2 a=`+1
(IE(` − 1)) − (IE(`)) = (B.4)
N m(m − ` + 1)(m − `)
Malgré que la qème CP dispose d’une variance (λ̊q ) non nulle en l’absence du bruit
de mesures, l’inégalité précédente prouve qu’une telle CP ne peut pas être retenue par le
critère IE si λ̊q ne satisfait pas une telle condition.
En outre, une telle condition est paramétrée en fonction du nombre des variables m
ainsi que le nombre q, ce qui représente un inconvénient majeur pour ce critère. A titre
d’exemple, on peut supposer une augmentation du nombre m de variables sans changement
de la valeur de q. Par conséquent, le terme à droite de l’inégalité (B.6) sera plus sévère,
ce qui augmentera la chance de l’élimination de la qème CP.
144
C
Démonstration de la décroissance d’une
fonction
Ainsi, les mêmes remarques sont également valables pour les valeurs propres :
dκ+1 0
D̃ = (C.4)
0 D̃r
D’après les deux équations précédentes, celle de (3.130) peut se réécrire comme suit :
145
Annexe C. Démonstration de la décroissance d’une fonction
en posant
T
a = ζiT G̃r G̃r ζi et b = ζiT gκ+1 gTκ+1 ζi (C.7)
Par conséquent, et après simplifications, nous montrons que :
T
! !
T T T
ζi g κ+1 gκ+1 ζi ζ i G̃r G̃r ζi
ũ2i (κ) = ũ2i (κ + 1) + dκ+1 T T
(C.8)
ζiT G̃r G̃r ζi ζiT gκ+1 gTκ+1 ζi + ζiT G̃r G̃r ζi
avec −1
T T
ũ2i (κ + 1) = ζiT G̃r D̃r G̃r ζi ζiT G̃r G̃r ζi (C.9)
Ce qui permet de calculer la différence suivante :
T T
ζi gκ+1 gκ+1 ζi
ũ2i (κ) − ũ2i (κ + 1) = T
T
ζiT gκ+1 gTκ+1 ζi + ζiT G̃r G̃r ζi ζiT G̃r G̃r ζi
T
T
× ζi G̃r dκ+1 Ir − D̃r G̃r ζi (C.10)
où Ir est une matrice identité de même dimension que celle de D̃r . Il est clair que :
T T
ζi gκ+1 gκ+1 ζi ≥0
T
T
(C.11)
T T T T
ζi gκ+1 gκ+1 ζi + ζi G̃r G̃r ζi ζi G̃r G̃r ζi
En outre, dκ+1 Ir − D̃r est une matrice diagonale ayant la forme suivante :
Donc
ũ2i (κ) ≥ ũ2i (κ + 1) (C.14)
Celle-ci prouve que la fonction ũ2i est monotone décroissante en κ.
146
D
Consistance théorique du critère VNRVI
avec G̃ ∈ Rm×(m−κ) est composée par les (m − κ) derniers vecteurs propres de la matrice
G de l’équation (3.120). Ainsi, D̃ ∈ R(m−κ)×(m−κ) est constituée des (m − κ) dernières
valeurs propres de la matrice D de l’équation (3.121).
Notons par G̃q ∈ Rm×q et D̃q ∈ Rq×q deux matrices composées par les q derniers
vecteurs et valeurs propres respectivement de G et D. Pour κ = m − q, on peut écrire ce
qui suit :
T
2
ζiT G̃q D̃q G̃q ζi dm−q+1
σi (κ = m − q) = T
≤ T
(D.2)
(ζiT G̃q G̃q ζi )2 ζiT G̃q G̃q ζi
Afin que σi2 soit monotone croissante, i.e. σi2 (κ ≥ m − q) ≥ σi2 (κ = m − q), il faut que :
dm−q+1 dm
T
≤ T
(D.4)
ζiT G̃q G̃q ζi ζiT G̃ G̃ ζi
Ce qui implique que :
T
dm−q+1 ζiT G̃q G̃q ζi
≤ T
(D.5)
dm ζiT G̃ G̃ ζi
147
Annexe D. Consistance théorique du critère VNRVI
2ème cas : κ < m − q En considérant ce cas, les matrices G̃ et D̃ peuvent être décom-
posées respectivement comme suit :
h i
G̃ = G̃1 G̃q (D.6)
D̃1 0
D̃ = (D.7)
0 D̃q
où G̃1 ∈ Rm×(m−κ−q) et D̃1 ∈ R(m−κ−q)×(m−κ−q) . Les matrices G̃q et D̃q sont celles utilisées
dans le 1er cas. Puisque G̃1 et G̃q sont orthogonales, on peut déduire que :
T T
ζiT G̃1 D̃1 G̃1 ζi ζiT G̃q D̃q G̃q ζi
σi2 (κ < m − q) = T
+ T
(D.8)
(ζiT G̃ G̃ ζi )2 (ζiT G̃ G̃ ζi )2
ainsi,
T T !
T (ζiT G̃q G̃q ζi )2 − (ζiT G̃ G̃ ζi )2
σi2 (κ < m − q) − σi2 (κ = m − q) = ζiT G̃q D̃q G̃q ζi T T
(ζiT G̃ G̃ ζi )2 (ζiT G̃q G̃q ζi )2
T
ζiT G̃1 D̃1 G̃1 ζi
+ T
(ζiT G̃ G̃ ζi )2
T T !
T (ζiT G̃ G̃ ζi )2 − (ζiT G̃q G̃q ζi )2
≥ −ζiT G̃q D̃q G̃q ζi T T
(ζiT G̃ G̃ ζi )2 (ζiT G̃q G̃q ζi )2
T
ζiT G̃1 G̃1 ζi
+dm−q T
(ζiT G̃ G̃ ζi )2
T T T T !
T T ζi G̃ G̃ ζi + ζi G̃q G̃q ζi
= dm−q − ζi G̃q D̃q G̃q ζi T
(ζiT G̃q G̃q ζi )2
T
ζiT G̃1 G̃1 ζi
× T
(ζiT G̃ G̃ ζi )2
T T !
ζiT G̃ G̃ ζi + ζiT G̃q G̃q ζi
≥ dm−q − dm−q+1 T
(ζiT G̃q G̃q ζi )2
T
ζiT G̃1 G̃1 ζi
× T
(D.9)
(ζiT G̃ G̃ ζi )2
Pour garantir que σi2 (κ < m − q) ≥ σi2 (κ = m − q), il faut que le terme à droite de la
dernière inégalité soit positif ou nul ce qui implique que :
T
!
ζiT G̃ G̃ ζi
dm−q ≥ 1 + T
dm−q+1 (D.10)
ζiT G̃q G̃q ζi
148
E
Relation entre un seuil de contrôle et celui
reconstruit
1 1
∗ ∗T
= tr{ΞoI ΞoT o oT
I M E{x (k)x (k)} M ΞI ΞI }
2 2
= tr{ΞoI ΞoT
I M Σ} (E.5)
149
Annexe E. Relation entre un seuil de contrôle et celui reconstruit
Par conséquent, la réduction prévue dans l’indice γ ∗ due à la reconstruction dans Γ2I
est identique à tr{ΞoI ΞoT
I M Σ}. Ce résultat peut être utilisé pour estimer la limite de
contrôle de γI∗ lorsque celle-ci est caractérisée par la même loi de probabilité que celle de
γ ∗,
Γ2I = Γ2 − tr{ΞoI ΞoTI M Σ} (E.6)
Une telle équation implique que :
Γ2 ≥ Γ2I (E.7)
150
F
Démonstrations d’unification
Sous une notation vectorielle, les paramètres de l’équation (4.69) sont déterminés
comme suit :
xi (k) = ξiT x(k) (F.1)
151
Annexe F. Démonstrations d’unification
T
pai = ξiT P̃ζa = ζaT P̃ ξi (F.7)
avec ζa ∈ Rm−` est un vecteur qui représente la aème colonne d’une matrice identité
d’ordre (m − `).
Par conséquent, l’équation (4.73) peut être exprimée de la façon suivante :
t2
cia (k) = ta (k)pai xi (k)
T T
= ζaT P̃ x(k)ζaT P̃ ξi ξiT x(k)
T
= xT (k)P̃ζa ζaT P̃ ξi ξiT x(k) (F.8)
152
G
Invalidité d’un diagnostic par comparaison
des RBC à leurs seuils de contrôle
D’après l’équation (4.97), l’expression de la RBC se caractérise par une forme qua-
dratique. Sous des conditions normales, les seuils de contrôle des RBC peuvent être dé-
terminés en s’appuyant sur les travaux de Box (1954) comme suit :
2 2
ηRBC γ = g
RBC γ χ(h γ ,α)
(G.1)
I I RBC
I
avec
1 1
tr[(Σ M 2 ΞoI ΞoT 2 2
I M ) ]
gRBC γ = 1 1 (G.2)
I
tr[Σ M 2 ΞoI ΞoT
I M ]
2
et
1 1
(tr[Σ M 2 ΞoI ΞoT
I M ])
2 2
hRBC γ = 1 1 (G.3)
I
tr[(Σ M 2 ΞoI ΞoT 2 2
I M ) ]
Dans le cas des défauts complexes, les mesures qui représentent le fonctionnement
normal ne peuvent pas être négligées, ce qui implique que l’équation (2.59) est reconsidérée
de nouveau. Selon l’équation (4.97), le vecteur qui mène à calculer la RBC du Ième
ensemble de variables peut être réécrit comme suit :
1 1 1
∗
ΞoI ΞoT 2
o oT 2
o oT
I M x(k) = ΞI ΞI M x (k) + ΞI ΞI M ΞI f(k)
2 (G.4)
153
Annexe G. Invalidité d’un diagnostic par comparaison des RBC à leurs seuils de contrôle
Afin d’assurer que l’effet de propagation du défaut réel FJ étant capable de rendre les
contributions des autres ensembles I de variables supérieures à leurs limites de contrôle,
il faut que RBCIγ (k) > ηRBC
2
γ . En revanche et dans le but qu’un tel défaut soit également
I
garanti détectable, on doit supposer que :
Γ2 > ηRBC
2
γ (G.9)
I
Pour que l’inégalité (G.8) soit satisfaite, il est nécessaire d’imposer ce qui suit :
1 1
kΞoI ΞoT 2 o oT 2
I M x(k)k ≥ (kΞI ΞI M ΞJ f(k)k − Γ) > Γ
2 2
2
(G.10)
On déduit alors que tout défaut réel FJ dont l’amplitude satisfait une telle inégalité
garantit que la RBC du Ième ensemble de variables soit supérieure au seuil de contrôle
correspondant. Si l’amplitude d’un tel défaut est importante, il est possible d’identifier
tous les ensembles de variables comme responsables en procédant à un diagnostic de
défauts par l’approche RBC comparée à ses seuils de contrôle.
154
Références bibliographiques
Acosta, G., González, C.A., et Pulido, B. (2001). Basic tasks for knowledge-based su-
pervision in process control. Engineering Applications of Artificial Intelligence, 14(4),
441–455.
Adrot, O. (2000). Diagnostic à base de modèles incertains utilisant l’analyse par inter-
valles : l’approche bornante. Thèse de doctorat, Institut National Polytechnique de
Lorraine.
Akaike, H. (1973). Information theory and an extension of the maximum likelihood prin-
ciple. In Second International Symposium on Information Theory, 267–281. Tsahkadsor,
Armenian SSR.
Alcala, C.F. et Qin, S.J. (2009). Reconstruction-based contribution for process monitoring.
Automatica, 45(7), 1593–1600.
Alcala, C.F. et Qin, S.J. (2011). Analysis and generalization of fault diagnosis methods
for process monitoring. Journal of Process Control, 21(3), 322–330.
Anderson, T.W. (1963). Asymptotic Theory for Principal Component Analysis. Annals
of Mathematical Statistics, 34(1), 122–148.
Bartlett, M.S. (1954). A Note on the Multiplying Factors for Various χ2 Approximations.
Journal of the Royal Statistical Society. Series B (Methodological), 16(2), 296–298.
Basseville, M. et Nikiforov, I.V. (1993). Detection of Abrupt Changes : Theory and Ap-
plication. Prentice-Hall, Inc.
Box, G.E.P. (1954). Some Theorems on Quadratic Forms Applied in the Study of Analysis
of Variance Problems, I. Effect of Inequality of Variance in the One-Way Classification.
Ann. Math. Statist., 25(2), 290–302.
155
Références bibliographiques
Cattell, R.B. (1966). The Scree Test For The Number Of Factors. Multivariate Behavioral
Research, 1(2), 245–276.
Chen, J., Bandoni, A., et Romagnoli, J.A. (1996). Robust statistical process monitoring.
Computers & Chemical Engineering, 20, Supplement 1, S497–S502.
Cheng, S.W. et Thaga, K. (2006). Single Variables Control Charts : an Overview. Quality
and Reliability Engineering International, 22(7), 811–820.
Cherry, G.A. et Qin, S.J. (2006). Multiblock principal component analysis based on a
combined index for semiconductor fault detection and diagnosis. IEEE Transactions
on Semiconductor Manufacturing, 19(2), 159–172.
Choi, S.W., Lee, C., Lee, J.M., Park, J.H., et Lee, I.B. (2005). Fault detection and
identification of nonlinear processes based on kernel PCA. Chemometrics and Intelligent
Laboratory Systems, 75(1), 55–67.
Cinar, A., Palazoğlu, A., et Kayihan, F. (2007). Chemical process performance evaluation.
CRC Press.
Conlin, A.K., Martin, E.B., et Morris, A.J. (2000). Confidence limits for contribution
plots. Journal of Chemometrics, 14(5-6), 725–736.
Duncan, A.J. (1956). The Economic Design of x̄ Charts Used to Maintain Current Control
of the Process. Journal of the American Statistical Association, 51(274), 228–242.
Dunia, R. et Qin, S.J. (1998a). A unified geometric approach to process and sensor fault
identification and reconstruction : the unidimensional fault case. Computers & Chemical
Engineering, 22(7-8), 927–943.
Dunia, R. et Qin, S.J. (1998b). Joint diagnosis of process and sensor faults using principal
component analysis. Control Engineering Practice, 6(4), 457–469.
Dunia, R., Qin, S.J., Edgar, T.F., et McAvoy, T.J. (1996). Identification of faulty sensors
using principal component analysis. AIChE Journal, 42(10), 2797–2812.
Fortuna, L., Graziani, S., Rizzo, A., et Xibilia, M.G. (2006). Soft Sensors for Monitoring
and Control of Industrial Processes (Advances in Industrial Control). Springer-Verlag
New York, Inc.
156
Gentil, S. (2007). Supervision des procédés complexes. Hermes Science Publications.
Gerlter, J.J. (1998). Fault Detection and Diagnosis in Engineering Systems. Marcel
Dekker.
Harkat, M.F., Djelel, S., Doghmane, N., et Benouaret, M. (2007). Sensor Fault Detection,
Isolation and Reconstruction Using Nonlinear Principal Component Analysis. Interna-
tional Journal of Automation and Computing, 4(2), 149–155.
Harkat, M.F., Mourot, G., et Ragot, J. (2006). An improved PCA scheme for sensor FDI :
Application to an air quality monitoring network. Journal of Process Control, 16(6),
625–634.
Hawkins, D.M. (1974). The Detection of Errors in Multivariate Data Using Principal
Components. Journal of the American Statistical Association, 69(346), 340–344.
Hayter, A.J. et Tsui, K.L. (1994). Identification and Quantification In Multivariate Qua-
lity Control Problems. Journal of Quality Technology, 26(3), 197–208.
Hotelling, H. (1947). Selected Techniques of Statistical Analysis for Scientific and Indus-
trial Research and Production and Management Engineering, chapter Multivariate Qua-
lity Control, Illustrated by the Air Testing of Sample Bombsights, 111–184. McGraw-
Hill Book Company.
157
Références bibliographiques
Huang, Y., Gertler, J., et McAvoy, T.J. (2000). Sensor and actuator fault isolation by
structured partial PCA with nonlinear extensions. Journal of Process Control, 10(5),
459–469.
Hubert, M., Rousseeuw, P.J., et Branden, K.V. (2005). ROBPCA : A New Approach to
Robust Principal Component Analysis. Technometrics, 47(1), 64–79.
Hunter, J.S. (1986). The exponentially weighted moving average. Journal of Quality
Technology, 18(4), 203–210.
Jackson, J.E. (1980). Principal Components and Factor Analysis : Part I - Principal
Components. Journal of Quality Technology, 12(4), 201–213.
Jackson, J.E. (1991). A User’s Guide to Principal Components. John Wiley & Sons Inc.
Jackson, J.E. et Mudholkar, G.S. (1979). Control Procedures for Residuals Associated
with Principal Component Analysis. Technometrics, 21(3), 341–349.
Jia, F., Martin, E.B., et Morris, A.J. (1998). Non-linear Principal Components Analysis
for Process Fault Detection. Computers & Chemical Engineering, 22, Supplement 1,
S851–S854.
Kaiser, H.F. (1961). A note on Guttman’s lower bound for the number of common factors.
British Journal of Statistical Psychology, 14(1), 1–2.
Kariwala, V., Odiowei, P.E., Cao, Y., et Chen, T. (2010). A branch and bound method
for isolation of faulty variables through missing variables analysis. Journal of Process
Control, 20(10), 1198–1206.
Kourti, T. (2005). Application of latent variable methods to process control and multiva-
riate statistical process control in industry. International Journal of Adaptive Control
and Signal Processing, 19(4), 213–246.
Kourti, T. et MacGregor, J.F. (1995). Process analysis, monitoring and diagnosis, using
multivariate projection methods. Chemometrics and Intelligent Laboratory Systems,
28(1), 3–21.
158
Kourti, T. et MacGregor, J.F. (1996). Multivariate SPC Methods for Process and Product
Monitoring. Journal of Quality Technology, 28(4), 409–428.
Kourti, T., Nomikos, P., et MacGregor, J.F. (1995). Analysis, monitoring and fault diag-
nosis of batch process using multiblock and multiway PLS. Journal of Process Control,
5(4), 277–284.
Kresta, J.V., MacGregor, J.F., et Marlin, T.E. (1991). Multivariate statistical monitoring
of process operating performance. The Canadian Journal of Chemical Engineering,
69(1), 35–47.
Lawley, D.N. (1956). Tests of Significance for the Latent Roots of Covariance and Corre-
lation Matrices. Biometrika, 43(1/2), 128–136.
Lee, J.M., Yoo, C., Choi, S.W., Vanrolleghem, P.A., et Lee, I.B. (2004). Nonlinear process
monitoring using kernel principal component analysis. Chemical Engineering Science,
59(1), 223–234.
Li, W. et Qin, S.J. (2001). Consistent dynamic PCA based on errors-in-variables subspace
identification. Journal of Process Control, 11(6), 661–678.
Lowry, C.A., Woodall, W.H., Champ, C.W., et Rigdon, S.E. (1992). A Multivariate
Exponentially Weighted Moving Average Control Chart. Technometrics, 34(1), 46–53.
Malinowski, E.R. (1977). Determination of the number of factors and the experimental
error in a data matrix. Analytical Chemistry, 49(4), 612–617.
Mason, R.L., Tracy, N.D., et Young, J.C. (1995). Decomposition of T2 for Multivariate
Control Chart Interpretation. Journal of Quality Technology, 27(2), 109–119.
Mason, R.L., Tracy, N.D., et Young, J.C. (1996). Monitoring a Multivariate Step Process.
Journal of Quality Technology, 28(1), 39–50.
Miller, P., Swanson, R.E., et Heckler, C.E. (1998). Contribution plots : A missing link in
multivariate quality control. Applied Mathematics and Computer Science, 8(4), 775–
792.
Mnassri, B., Ananou, B., El Adel, E.M., Ouladsine, M., et Gasnier, F. (2008a). Détection
et localisation de défauts des Wafers par des approches statistiques multivarièes et calcul
des contributions. In Conférence Internationale Francophone d’Automatique. Bucarest,
Romanie.
Mnassri, B., El Adel, E.M., Ananou, B., et Ouladsine, M. (2009a). Détection et Identifica-
tion de défauts par Analyse en Composantes Principales. In 3èmes Journées Doctorales
/ Journées Nationales MACS. Angers, France.
159
Références bibliographiques
Mnassri, B., El Adel, E.M., Ananou, B., et Ouladsine, M. (2009b). Fault Detection and
Diagnosis Based on PCA and a New Contribution Plots. In 7th IFAC Symposium on
Fault Detection, Supervision and Safety of Technical Processes, 834–839. Barcelona,
Spain.
Mnassri, B., El Adel, E.M., Ananou, B., et Ouladsine, M. (2010a). A Generalized Variance
of Reconstruction Error Criterion for Determining the Optimum Number of Principal
Components. In 18th Mediterranean Conference on Control and Automation, 868–873.
IEEE, Marrakech, Morocco.
Mnassri, B., El Adel, E.M., Ananou, B., et Ouladsine, M. (2010b). Selection of the Number
of Principal Components Based on the Fault Reconstruction Approach Applied to a
New Combined Index. In 49th IEEE Conference on Decision and Control, 3307–3312.
Atlanta, Georgia, USA.
Mnassri, B., El Adel, E.M., et Ouladsine, M. (2008b). Fault Localization Using Principal
Component Analysis Based on a New Contribution to the Squared Prediction Error.
In 16th Mediterranean Conference on Control and Automation, 65–70. IEEE, Ajaccio,
France.
Mnassri, B., El Adel, E.M., et Ouladsine, M. (2010c). New VRE Criterion to Select the
Optimum Number of PCs. In 11th International conference on Sciences and Techniques
of Automatic control & computer engineering, 1–13. Monastir, Tunisia.
Mnassri, B., El Adel, E.M., et Ouladsine, M. (2011b). Une généralisation sur les conditions
suffisantes de détectabilité de défauts multidimensionnels par ACP. In Conférence
Méditerranéenne sur l’Ingénierie Sûre des Systèmes Complexes. Agadir, Maroc.
Mnassri, B., El Adel, E.M., et Ouladsine, M. (2012a). Unified Sufficient Conditions for
PCA-based Fault Detectability and Isolability. In 8th IFAC Symposium on Fault De-
tection, Supervision and Safety of Technical Processes, 421–426. Mexico City, Mexico.
Mnassri, B., Ouladsine, M., et El Adel, E.M. (2012b). Diagnostic de défauts par l’ap-
proche RBC ratio. In Conférence Internationale Francophone d’Automatique, 114–119.
Grenoble, France.
160
Nomikos, P. (1996). Detection and diagnosis of abnormal batch operations based on
multi-way principal component analysis. ISA transactions, 35(3), 259–266.
Nomikos, P. et MacGregor, J.F. (1995). Multivariate SPC Charts for Monitoring Batch
Processes. Technometrics, 37(1), 41–59.
Pearson, K. (1901). On Lines and Planes of Closest Fit to Systems of Points in Space.
Philosophical Magazine, 2(6), 559–572.
Qin, S.J. (2003). Statistical process monitoring : basics and beyond. Journal of Chemo-
metrics, 17(8–9), 480–502.
Qin, S.J. et Dunia, R. (2000). Determining the number of principal components for best
reconstruction. Journal of Process Control, 10(2), 245–250.
Qin, S.J., Valle, S., et Piovoso, M.J. (2001). On unifying multiblock analysis with appli-
cation to decentralized process monitoring. Journal of Chemometrics, 15(9), 715–742.
Ripoll, P. (1999). Conception d’un système de diagnostic flou appliqué au moteur auto-
mobile. Thèse de doctorat, Université de Savoie.
Roberts, S.W. (1959). Control Chart Tests Based on Geometric Moving Averages. Tech-
nometrics, 1(3), 239–250.
Schölkopf, B., Smola, A., et Müller, K.R. (1998). Nonlinear Component Analysis as a
Kernel Eigenvalue Problem. Neural Computation, 10(5), 1299–1319.
Schwarz, G. (1978). Estimating the Dimension of a Model. The Annals of Statistics, 6(2),
461–464.
Shao, R., Jia, F., Martin, E.B., et Morris, A.J. (1999). Wavelets and non-linear principal
components analysis for process monitoring. Control Engineering Practice, 7(7), 865–
879.
161
Références bibliographiques
Smilde, A.K., Bro, R., et Geladi, P. (2004). Multi-way analysis with applications in the
chemical sciences. J. Wiley.
Sun, R., Tsung, F., et Qu, L. (2007). Evolving kernel principal component analysis for
fault diagnosis. Computers & Industrial Engineering, 53(2), 361–371.
Tharrault, Y., Mourot, G., Ragot, J., et Maquin, D. (2008). Fault detection and isolation
with robust principal component analysis. Int. J. Appl. Math. Comput. Sci., 18(4),
429–442.
Valle, S., Li, W., et Qin, S.J. (1999). Selection of the Number of Principal Components :
The Variance of the Reconstruction Error Criterion with a Comparison to Other Me-
thods. Ind. Eng. Chem. Res., 38(11), 4389–4401.
Vargas, V.C.C., Lopes, L.F.D., et Souza, A.M. (2004). Comparative study of the perfor-
mance of the CuSum and EWMA control charts. Computers & Industrial Engineering,
46(4), 707–724.
Verron, S., Tiplica, T., et Kobi, A. (2008). Fault detection and identification with a
new feature selection based on mutual information. Journal of Process Control, 18(5),
479–490.
Wang, H., Zhou, H., et Hang, B. (2004). Number selection of principal components with
optimized process monitoring performance. In 43th IEEE Conference on Decision and
Control, 4726–4731. Paradise Island, Bahamas.
162
Westerhuis, J.A., Gurden, S.P., et Smilde, A.K. (2000a). Generalized contribution plots
in multivariate statistical process monitoring. Chemometrics and Intelligent Laboratory
Systems, 51(1), 95–114.
Westerhuis, J.A., Gurden, S.P., et Smilde, A.K. (2000b). Standardized Q-statistic for
improved sensitivity in the monitoring of residuals in MSPC. Journal of Chemometrics,
14(4), 335–349.
Wise, B.M., Gallagher, N.B., Bro, R., Shaver, J.M., Windig, W., et Koch, R.S. (2006).
PLS Toolbox User Manual. Eigenvector Research, Inc., Wenatchee, USA.
Woodward, R.H. et Goldsmith, P.L. (1964). Cumulative sum techniques. Oliver & Boyd.
Yoon, S. et MacGregor, J.F. (2001). Fault diagnosis with multivariate statistical models
part I : using steady state fault signatures. Journal of Process Control, 11(4), 387–400.
Yue, H.H. et Qin, S.J. (2001). Reconstruction-Based Fault Identification Using a Combi-
ned Index. Ind. Eng. Chem. Res., 40(20), 4403–4414.
Zwingelstein, G. (1995). Diagnostic des défaillances : théorie et pratique pour les systèmes
industriels. Traité des nouvelles technologies. Série Diagnostic et maintenance. Hermès.
163
Résumé
Ce mémoire de thèse présente une étude fondamentale enrichie par des contributions qui sont articulées
autour de la modélisation de processus ainsi qu’un diagnostic de défauts en utilisant l’analyse en composantes
principales (ACP).
Dans l’objectif d’un choix optimal du modèle ACP, une étude comparative de quelques critères connus
dans la littérature nous a permis de conclure que le problème rencontré est souvent lié à une ignorance des
variables indépendantes et quasi-indépendantes. Dans ce cadre, nous avons réalisé deux démonstrations mettant
en évidence les limitations de deux critères en particulier la variance non reconstruite (VNR). En s’appuyant sur
le principe d’une telle variance, nous avons proposé trois nouveaux critères. Parmi eux, deux ont été considérés
comme étant empiriques car seule l’expérience permettra de prouver leur efficacité. Le troisième critère noté
VNRVI représente un remède à la limitation du critère VNR. Une étude de sa consistance théorique a permis
d’établir les conditions garantissant l’optimalité de son choix. Les résultats de simulation ont validé une telle
théorie en prouvant ainsi que le critère VNRVI étant plus efficace que ceux étudiés dans cette thèse.
Dans le cadre d’un diagnostic de défauts par ACP, l’approche de reconstruction des indices de détection ainsi
que celle des contributions ont été utilisées. A travers une étude de généralisation, nous avons étendu le concept
d’isolabilité de défauts par reconstruction à tout indice quadratique. Une telle généralisation nous a permis
d’élaborer une analyse théorique d’isolabilité de défauts par reconstruction de la distance combinée versus celles
des indices SP E et T 2 de Hotelling en mettant en avant l’avantage de l’utilisation d’une telle distance. D’autre
part, nous avons proposé une nouvelle méthode de contribution par décomposition partielle de l’indice SP E.
Cette approche garantit un diagnostic correct de défauts simples ayant de grandes amplitudes. Nous avons
également étendu une méthode de contribution classiquement connue par la RBC au cas multidimensionnel.
Ainsi, la nouvelle forme garantit un diagnostic correct de défauts multiples de grandes amplitudes. En considérant
la complexité de défauts, nous avons exploité la nouvelle approche de contribution RBC afin de proposer une
nouvelle qui s’appelle RBCr. Cette dernière s’appuie sur un seuil de tolérance pour l’isolation de défauts.
Une analyse de diagnosticabilité basée sur la RBCr montre que celle-ci garantit l’identification des défauts
détectables. Ces derniers sont garantis isolables si leurs amplitudes satisfont les mêmes conditions d’isolabilité
établies pour l’approche de reconstruction des indices.
Mots-clés : ACP, modélisation de processus, variance non reconstruite, détection et détectabilité de défauts,
isolation et isolabilité de défauts, reconstruction, contribution, diagnostic.
Abstract
This thesis presents a fundamental study enhanced by some contributions that are focused on process
modelling and fault diagnosis using principal component analysis (PCA).
In order to find an optimal PCA model, we have concluded through a comparative study of some popular
criteria that the problem is often related to an ignorance of the independent and quasi-independent variables. In
this framework, we have performed two demonstrations highlighting the limitations of two selection criteria in
particular the unreconstructed variance (VNR). Based on the principle of VNR approach, we have proposed
three new criteria, among them two methods were considered as empirical criteria because only the experience
will prove their effectiveness. However the third one which is noted VNRVI represents a cure for the limitation
of the classical VNR criterion. Thus, the conditions that ensure an optimal selection were derived according
to a theoretical consistency study of the VNRVI approach. The simulation results have successfully validated
the VNRVI criterion by proving that is more effective than the other studied criteria in the present thesis.
The reconstruction and contribution approaches were used for fault diagnosis using PCA. According to a
unified study, we have extended the fault isolability concept based on the reconstruction method to any detection
index which has a quadratic form. Such generalization has allowed us to develop a theoretical fault isolability
analysis based on the reconstruction of the combined index versus those of SP E and T 2 indices. This analysis has
highlighted the advantage of using the combined index for fault isolation. On the other hand, we have proposed
a new contribution approach by applying a partial decomposition of the SP E index. This approach guarantees
correct diagnosis of simple faults with large magnitudes. We have also extended the classical contribution
method of RBC to the multidimensional fault cases. Therefore, the new approach guarantees correct diagnosis
of multiple faults with large magnitudes. In order to consider the more complex faults, we have proposed a
new diagnosis method called RBCr. Based on a theoretical diagnosability analysis, such method guarantees the
identification of detectable complex faults. These faults are guaranteed isolable if their magnitudes satisfy the
same fault isolability conditions that are established for the reconstruction approach.
Keywords: PCA, process modelling, unreconstructed variance, fault detection and detectability, fault isolation
and isolability, reconstruction, contribution, diagnosis.
View publication stats