Equations Structurelles PLS
Equations Structurelles PLS
Equations Structurelles PLS
Mail : balambo@gmail.com
Jamal EL BAZ
Mail : j.elbaz@uiz.ac.ma
Résumé : Les équations structurelles ont connu une grande popularité en sciences de gestion,
surtout dans la littérature traitant les relations inter organisationnelles. En effet, cette
littérature fait appel à des variables voulant mesurer les attitudes des partenaires (confiance,
engagement, …) (Valette Florence, 1988 ; Livolsi et Meschi, 2003). Celles-ci correspondent à
des variables latentes qui représentent des phénomènes indirectement observables. Cette
littérature tend également à vouloir construire des modèles qui prétendent approcher la
complexité des situations réelles, ce qui les amène à construire des modèles à plusieurs
variables et à interactions complexes. Ceci a amené les chercheurs à faire appel de plus en
plus aux équations structurelles qui permettent de satisfaire à ces besoins. Nous démontrons
dans cette communication l’intérêt de l’utilisation de l’approche PLS dans les recherches en
Logistique comme alternative à l’utilisation de l’approche LISREL , une technique émergente
pour l’analyse des relations structurelles qui s’avère adaptée aux recherches où l’unité
d’analyse est l’entreprise, et où les échantillons ne sont pas importants.
We show in this paper the interest of using the PLS approach to research logistics, an
emerging technique for the analysis of structural relationships which proves suitable for
research where the unit of analysis is the business, and where samples are not important.
1
Introduction:
Les méthodes de deuxième génération appelées méthodes des équations structurelles ont
permis de dépasser les limites des approches classiques, en permettant non seulement
l’évaluation et la comparaison de manière globale des modèles de recherche complexes en
prenant en compte les erreurs de mesure, mais aussi, comme noté par Lacroux (2010), de
tester de manière simultanée l’existence de relations causales entre plusieurs variables latentes
explicatives et plusieurs variables à expliquer. Ces méthodes permettent également la
construction puis le test de la validité et de la fiabilité des construits latents construits à partir
de plusieurs indicateurs.
Les méthodes d’équations structurelles ont connu leurs premiers balbutiements dans les
années 60, notamment grâce au travail de Jöreskog (1966). Ces méthodes avaient initialement
pour objectif de tester les relations causales multiples. Petit à petit, l’usage s’est élargi pour
couvrir d’autres champs d’analyse comme les analyses factorielles confirmatoires qui
analysent la validité des construits latents ou encore les analyses multi-groupes (El Akremi,
2005). Ces méthodes ont bouleversé le champ des analyses statistiques puisqu’elles
permettent de remplir des conditions qu’aucune méthode de première génération ne peut
remplir (Valette-Florence, 1988). Ces conditions sont résumées par Fornell (1982) qui défend
quatre conditions pour appartenir à cette génération de méthodes : capacité à traiter
simultanément plusieurs ensembles de variables observées explicatives et expliquées, capacité
à analyser les liens entre variables théoriques non observables et à tenir compte des erreurs au
niveau de la mesure et, enfin, capacité d’applications confirmatoires.
2
A ces méthodes d’équations structurelles sont associées des techniques d’analyse. La
technique la plus usitée dans la littérature en sciences de gestion est celle reposant sur
l’analyse des covariances (covariance based structural equation modeling). Elle fut la
première à être utilisée et à être implémentée dans un logiciel, qui fut le fruit d’une
collaboration entre Jöreskog et Sörbom (1970), connu sous le nom de LISREL (LInear
Structural RELations). La technique a fait l’objet de plus en plus d’améliorations et d’autres
logiciels ont vu le jour fondées toujours sur l’analyse des covariances telles que EQS de
Bentler (1980).
Une deuxième technique émergente utilisée dans les approches en équations structurelles est
celle fondée sur l’analyse des variances, appelée sous le nom de l’approche PLS (Partial Lest
Square) qui est adaptée à certains modèles structurels pour lesquels les procédures classiques
d’estimation peuvent se révéler délicates à utiliser (Lacroux, 2010). Cette technique fut
proposée par Wold comme une « modèlisation douce » (Soft Modeling), et a donné lieu à
plusieurs logiciel dont LVPLS de Löhmoller (1984), PLS Graph de Chin (1993), ou encore
un logiciel développé à l’université de Hambourg appelé Smart PLS par Ringle et al. (2005).
Le modèle des équations structurelles est construit suivant une logique déductive de
démonstration théorique puis fait l’objet de deux types de spécifications qui le scindant en
deux parties comme le démontre la figure suivante.
Construction théorique
Re-spécification
Identification des indicateurs
Modèle de
mesure
Estimation des relations entre indicateurs
et variables latentes
Modèle
Test des relations entre variables latentes structurel
3
Le modèle d’équation structurel se compose de deux parties. Un modèle de mesure qui
renvoie à l’identification et l’estimation des variables latentes à partir des indicateurs, et un
modèle structurel qui renvoie à la détermination des relations causales entre les variables
latentes et qui permet de tracer le sens des hypothèses composant le modèle de recherche à
tester.
Les cercles représentent les variables latentes explicatives et à expliquer et les carrés
correspondent aux indicateurs permettant de mesurer les variables latentes.
Le modèle de mesure est constitué de l’ensemble des relations entre les indicateurs et les
variables latentes qu’ils mesurent. Dans ce sens nous distinguons deux formes de
4
contributions des indicateurs à la variable latente. Les construits dits réflexifs et les construits
formatifs. Nous traiterons ces deux concepts dans la spécification des modèles d’équations
structurelles.
La spécification du modèle de mesure est une étape importante dans la démarche d’utilisation
des modèles d’équation structurelles. Une variable latente est une variable qui n’est pas
directement observable, et nécessite par conséquent le passage par des indicateurs ou
variables manifestes qui permettent de mesurer la variable.
Le paradigme dominant dans la théorie des tests fut celui représenté par Churchil (1979) et
qui considère que les variables manifestes sont toutes supposées représenter leur variable
latente. Dans ce sens, il est postulé que tous les indicateurs concordent dans leur manière de
mesurer le phénomène, et permettent tous de refléter la même variable. En conséquence, le
chercheur doit s’assurer de la significativité de la variable latente construite à la base de ces
indicateurs, qui doivent être significativement corrélés. Dans ce sens, une variable latente bien
construite est une variable dont la variation doit s’accompagner le plus fidèlement possible
par la variation de tous les indicateurs qui la composent. Cette théorie classique des tests
considéraient alors toutes les variables comme réflexives. Le passage par une étape
d’épuration des items par les différents chercheurs pour s’assurer de la cohérence interne et la
validité des variables comme étape préalable au test atteste de cette considération de la
réflexivité des variables.
Néanmoins, dans certaines recherches, il est possible de se retrouver avec certaines variables
latentes composées d’une combinaison d’indicateurs pas forcément corrélés, étant donné
qu’ils mesurent des phénomènes théoriquement différents. Ces indicateurs permettent alors de
former la variable latente. Nous parlerons alors de variables formatives où les relations de
causalité vont aller de ces indicateurs vers les construits. Un exemple récurrent en sciences de
gestion est celui de la mesure de la performance globale, qui peut être composé de plusieurs
indicateurs détaillant la performance financière et la performance non financière. Tous ces
5
indicateurs contribueront à mesurer la performance globale, sans supposer de corrélation entre
ces indicateurs qui ne mesurent pas le même phénomène.
Le schéma suivant permet de distinguer entre les variables latentes réflexives et formatives.
Figure 2: Spécification des relations entre les variables latentes et leurs indicateurs
Dans le premier type de spécification les indicateurs constituent le reflet de la variable latente
où elle demeure la cause des indicateurs, où chaque indicateur est lié à la variable latente par
une équation de régression simple du type :
Dans le deuxième type de spécification la variable latente constitue le reflet de tous les
indicateurs où il demeure la cause de la variable latente. Le modèle se formalise alors par une
équation de régression multiple :
6
Il est important pour une recherche de bien distinguer entre les construits réflexifs et
formatifs. En effet, une mauvaise spécification du modèle diminue la qualité du modèle de
mesure et par conséquent la qualité du modèle structurel (Mac Kenzie et al. 2005).
Il existe principalement deux grandes approches qui visent l’estimation des modèles
d’équations structurelles, l’approche « LISREL » fondée sur l’analyse des covariances et
l’approche « PLS » fondée sur l’analyse de la variance. L’estimation permet, en s’appuyant
sur différents types d’algorithmes, d’établir des liens dans le cadre du modèle de mesure entre
les indicateurs et les variables latentes d’une part, et de calculer les coefficients structurels
dans le cadre du modèle structurel d’autre part.
La distinction entre la méthode PLS et la méthode LISREL a été mise en évidence par Chin,
(1995) cité par (Lacroux, 2010) par analogie avec l’analyse factorielle. Pour lui, la différence
est du même ordre que celle qui existe entre l’analyse factorielle classique et l’analyse en
composantes principales. L’analyse en composantes principales ne prend pas en compte les
erreurs de mesure mais obtient toujours une solution. Dans ce sens, contrairement à
7
l’approche LISREL ou encore la régression multiple, l’approche PLS permet d’éviter les
solutions inadmissibles et les facteurs d’indétermination (Fornell et Bookstein, 1982). PLS
élimine le problème de facteur d’indétermination et fournit une définition exacte des scores
des composantes, en utilisant une technique d’estimation itérative.
Lacroux (2010) établit une comparaison intéressante entre les deux approches fondées sur les
travaux de (Jöreskog et Wold (1982), Chin (1995), Haenlein et Kaplan (2004), et Sosik et al.
(2009) qui permet de synthétiser les différentes caractéristiques et usages des approches
LISREL et PLS.
Dans ce sens, plusieurs différences existent entre l’approche LISREL et l’approche PLS. Dans
le cadre de l’approche LISREL, le chercheur doit respecter les conditions de multinormalité
pour pouvoir se fonder sur les algorithmes du maximum de vraisemblance, où toutes les
variables doivent être continues ou d’intervalle et distribuées normalement. Alors que
l’approche PLS est adaptée aux variables nominales, d’intervalle ou continues et n’exige que
peu de conditions statistiques sur les variables du modèle.
D’un autre côté, Si l’approche LISREL est bien adaptée aux modèles ayant fait l’objet d’une
construction théorique solide et fondée sur des échelles de mesure ayant déjà été testées
auparavant, l’approche PLS est adaptée aux analyses exploratoires et au test des modèles
partiels.
8
Enfin, la méthode LISREL présente l’avantage de tester les modèles récursifs et non récursifs.
Une manipulation qui n’est pas possible sous PLS qui ne traite que les modèles récursifs où la
causalité entre les variables latente doit être univoque.
L’approche PLS (Partial Least Squares) qui se fonde sur un algorithme des moindres carrés
partiels, a été développée principalement selon Chatelin et al. (2002) grâce aux travaux de
Wold (1985) et Lohmöller (1984, 1987 et 1989). Cette approche a l’avantage de vérifier
plusieurs liens entre plusieurs variables explicatives et à expliquer à des niveaux différents.
Elle a l’avantage également de ne pas exiger un nombre important d’observations et n’exige
pas une distribution normale des données de base. L’approche PLS semble également adaptée
à des études où les mesures ne sont pas très précises, elle correspond tout à fait à cet esprit
d’analyse des données (Tenenhaus, 1998).
La démarche de l’approche PLS commence sur la base du modèle théorique spécifié par une
estimation itérative, d’abord sur le modèle de mesure, en maximisant le pouvoir explicatif des
indicateurs pondérés et combinés par l’estimation des variables latentes. Puis, sur le modèle
structurel, en estimant les liens entre variables latentes par des régressions multiples entre les
variables choisies, et ce en vue de maximiser la covariance entre variable explicative et
variable à expliquer (Sosik et al. 2009).
L’approche PLS permet alors de modéliser directement les données en se fondant sur une
succession de régressions multiples sans hypothèses probabilistes de départ, contrairement à
l’approche LISREL. Elle n’exige donc pas de conditions de multinormalité comme c’est le cas
pour les analyses sur la covariance, ni de conditions par rapport à la nature des données.
L’approche PLS permet également le test simultané des variables latentes réflexives et
formatives ce que ne permet pas l’approche LISREL.
Si cette approche présente tous ces avantages, sa diffusion reste néanmoins limitée à cause de
certaines limites inhérentes à sa démarche. En effet, l’approche PLS ne permet pas la prise en
compte des erreurs de mesure ce qui réduit la qualité de l’estimation des mesures, ceci se
traduit par une sous estimation des relations structurelles et une surestimation des
9
contributions factorielles (loadings). Une seule solution est possible pour dépasser cette limite
(Mc Donald, 1996), c’est de détenir un nombre d’items très important par variable latente, et
de disposer d’un nombre d’observations extrêmement important.
Une autre limite inhérente à la démarche PLS est celle relative au test des modèles non
récursifs. En effet, l’approche PLS ne permet de tester que les modèles à relations de
causalités univoques puisqu’elle se fonde sur des procédures de régression multiple.
Enfin, une limite qui conduit au rejet de certains articles scientifiques dans des revues
internationales (Chin, 1998), est inhérente à l’absence d’indices d’ajustement des modèles (Fit
indices) dans le cadre de l’approche PLS. En effet, ces indices permettent de juger
l’ajustement du modèle aux données empiriques. Néanmoins, il existe quelques calculs qui
permettent de s’assurer de la significativité des coefficients, se fondant sur les contributions
factorielles et les coefficients de détermination.
Comme nous l’avons signalé supra, l’approche PLS est adaptée aux analyses exploratoires et
au test des modèles partiels, dans lesquelles le chercheur ne bénéficie pas souvent d’un
échantillon important, ni d’échelles de mesure robustes (Sosik et al. 2009 ; Lacroux, 2010), ce
qui est souvent le cas dans les recherches qui s’inscrivent dans une discipline aussi jeune que
le Management logistique, qui se situent la perspective inter organisationnelle. En effet,
malgré le fait que plusieurs études en logistique suivent un mode de raisonnement
confirmatoire visant à confirmer la théorie dans un terrain empirique spécifique, ces
recherches ont souvent un contexte empirique exploratoire.
Un autre élément paraît important à soulever. La méthode PLS paraît adaptée aux modèles
structurels complexes, qui peuvent aller selon (Lacroux, 2010) jusqu’à plusieurs centaines de
variables, ce qui est souvent le cas dans le cadre des modèles structurels en logistique
(Balambo, 2012 ;2013).
10
La méthode PLS permet en outre, de tester des modèles sur la base d’un petit échantillon, ce
que ne permet pas l’approche LISREL. En effet, l’approche PLS exige une règle empirique
qui stipule que le nombre d’observations soit supérieur ou égal à 10 fois le nombre
d’indicateurs de la variable formative la plus complexe, et/ou 10 fois le nombre de relations
structurelles émanant du construit central du modèle structurel (Chin, 1998). Dans ce sens,
nous croyons que cette souplesse au niveau de l’étroitesse de l’échantillon peut ouvrir la porte
aux études qui s’intéressent au contexte inter organisationnel de la logistique, où il s’avère
difficile de réunir un nombre important d’observations, étant donné que l’unité d’analyse
principale demeure l’entreprise. Beaucoup d’études qui s’intéressent aux relations inter
organisationnelles en Logistique et dont l’unité d’analyse est la dyade, le réseau, ou
l’entreprise éprouvent des difficultés à constituer des échantillons suffisamment importants
pour respecter les conditions requises par l’approche LISREL, l’approche PLS paraît alors
une alternative efficace qui peut surmonter la condition de l’importance en nombre de
l’échantillon qui est permise essentiellement par la technique du Boostraping.
Un autre élément est lié à la mobilisation par les études qui s’intéressent à la logistique dans
les relations inter organisationnelles de modèles explicatifs complexes engageant souvent,
pour mieux approcher le réel, des variables latentes et des construits qui peuvent être
formatifs ou réflexifs. Dans ce sens, l’approche PLS paraît une méthode souple, permettant de
tester des modèles comportant simultanément des variables formatives et réflexives (Lacroux,
2010). En effet, PLS est nettement adapté aux problématiques en logistique dont les données
sont récoltées par questionnaire, comme le remarquent (Sosik et al., 2009) cité par (Lacroux,
2010) : « La méthode PLS fonctionne mieux en pratique, parce que les données issues du
terrain utilisées dans la modélisation ne sont jamais parfaites, et sont souvent fortement
corrélées. En sélectionnant la meilleure combinaison linéaire pour prédire les variables
dépendantes, elle fournit des coefficients structurels plus significatifs que les méthodes basées
sur le maximum de vraisemblance (Lisrel). Les méthodes de type Lisrel donnent leur
meilleurs résultats lorsque les données sont obtenues en utilisant un design expérimental : or,
ce type de design est rarement possible en pratique, surtout lorsque les données sont obtenues
par questionnaire ».
11
Enfin, la méthode PLS permet d’éviter les solutions inadmissibles et les facteurs
d’indétermination et fournit une définition exacte des scores des composantes.
Conclusion:
Ceci permet d’ouvrir la voie à des chercheurs en logistique mobilisant souvent des variables
multidimensionnelles comme l’opportunisme, la confiance, l’engagement, l’enracinement… à
réexaminer la spécification des variables comme étant formatives.
12
Bibliographie :
Balambo M.A. (2012), « L’impact de la culture nationale sur la nature de l’intégration des
supply chains : une étude à travers l’effet médiateur de la nature de la confiance. Une
application aux équipementiers automobiles marocains », Thèse de doctorat en sciences de
gestion, CRETLOG, Aix-Marseille Université.
Balambo M.A., (2013), « Culture nationale et nature de l’intégration des supply chains
amont: le cas des équipementiers automobiles marocains », Revue Logistique & Management,
Volume 21, Numéro 4, pp. 71-82(12). Numéro spécial : Globalisation et Supply Chain
Management.
Bentler, P.M. (1980), « Multivariate analysis with latent variables: Causal modeling », Annual
Review of Psychology, 31, 419-456.
Chin W.W. (1998), « The partial least squares approach to structural equation modeling », In
G. A. Marcoulides (Ed.), Modern methods for business research, (pp. 295-336), Mahwah, NJ:
Lawrence Erlbaum.
El Akremi A. (2005), « Analyse des effets linéaires, non linéaires et d'interaction par les
méthodes d'équations structurelles sous Lisrel », in Roussel P., Wacheux F., Management des
Ressources Humaines : Méthodes de recherche en sciences humaines et sociales, Paris, De
Boeck.
Fornell, c., Bookstein, F. (1982), « Two Structural Equation Models: LISREL and PLS
Applied to Consumer Exit-Voice Theory », Journal of Marketing Research. 19, 440-452.
Lacroux A. (2010), « L’analyse des modèles de relations structurelles par la méthode PLS :
une approche émergente dans la recherche quantitative en GRH », XXème congrès de
l’AGRH, Toulouse
Livolsi, L., Meschi, P.-X. (2003). Méthodologie quantitative de la recherche en gestion des
ressources humaines, in Allouche, J. (éditeur), Encyclopédie des Ressources Humaines,
Vuibert, Paris, pp. 897-908.
MacKenzie, S.B., Podsakoff, P.M., and Jarvis, C.B. (2005), « The problem of measurement
model misspecification in behavioral and organizational research and some recommended
solutions », Journal of Applied Psychology, 90 (4), 710-730.
Ringle, C. M., Wende, S., & Will, A. (2005), SmartPLS 2.0 (M3) beta, Hamburg:
http://www.smartpls.de.
13
Roussel, P., Durrieu, F., Campoy, É., El Akremi, A., (2002), « Méthodes d’Équations
Structurelles : Recherche et Applications en Gestion », Économica, Paris
Sosik, J., Kahai, S., & Piovoso, M. (2009), « Silver Bullet or Voodoo Statistics? A Primer for
Using the Partial Least Squares Data Analytic Technique in Group and Organization
Research», Group & Organization Management, 34(1), 5-36.
Valette-Florence P. (1988), L’implication, variable médiatrice entre les styles de vie, valeurs
et mode de consommation, Thèse de science de gestion, Université de Grenoble.
14