Com Opti

ECOLE NATIONALE SUPERIEURE POLYTECHNIQUE DE DOUALA
Commande Optimale
Ecole Nationale Supérieure de Physique de Strabourg
3ème année
Option Ingénierie des Systèmes, Automatique et Vision
Master Images, Robotique et Ingénierie pour le Vivant

Parcours Automatique et Robotique
Edouard Laroche
laroche@lsiit.u-strasbg.fr
http://eavr.u-strasbg.fr/~laroche/student
2009–2010
Dr Idellette SOM
Table des matières
1 Introduction 5
2 Commande optimale 6
2.1 Position du problème . . . . . . . . . . . . . . . . . . . . . . . 6
2.2 Principe d’optimalité de Bellman . . . . . . . . . . . . . . . . 7
2.3 Principe du minimum de Pontriaguine . . . . . . . . . . . . . 8
2.4 Equation d’Euler-Lagrange . . . . . . . . . . . . . . . . . . . 10
2.5 Commande bang-bang . . . . . . . . . . . . . . . . . . . . . . 10
3 Commande Linéaire Quadratique 11

3.1 Commande LQ à horizon fini . . . . . . . . . . . . . . . . . . 11
3.2 Commande LQ à horizon infini . . . . . . . . . . . . . . . . . 13
3.3 Robustesse de la commande LQ . . . . . . . . . . . . . . . . . 14
3.3.1 Différence de retour . . . . . . . . . . . . . . . . . . . 14
3.3.2 Marges de stabilité . . . . . . . . . . . . . . . . . . . . 14
3.4 Structure des régulateurs . . . . . . . . . . . . . . . . . . . . . 15
3.5 Choix des pondérations . . . . . . . . . . . . . . . . . . . . . . 17
3.6 Commande LQ à temps discret . . . . . . . . . . . . . . . . . 17
3.6.1 Commande LQ à temps discret à horizon fini . . . . . . 17
3.6.2 Critère à horizon infini . . . . . . . . . . . . . . . . . . 20
3.7 Commande prédictive . . . . . . . . . . . . . . . . . . . . . . . 20
3.7.1 Suivi de consigne . . . . . . . . . . . . . . . . . . . . . 20
3.7.2 Rejet d’une perturbation connue . . . . . . . . . . . . . 21
4 Commande Linéaire Quadratique Gaussienne 27

4.1 Formulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2 Théorème de séparation . . . . . . . . . . . . . . . . . . . . . 27
4.3 Structure de la commande LQG . . . . . . . . . . . . . . . . 28
4.4 Choix des pondérations . . . . . . . . . . . . . . . . . . . . . . 29
4.4.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . 29
4.4.2 Réglage de l’estimateur d’état . . . . . . . . . . . . . . 29
4.4.3 Loop Transfert Recovery . . . . . . . . . . . . . . . . . 29
4.5 Commande LQG à temps discret . . . . . . . . . . . . . . . . 30
5 Commande H2 31
5.1 Norme H2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.1.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.1.3 Calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2
5.1.4 Formulation LMI . . . . . . . . . . . . . . . . . . . . . 33
5.2 Problème standard . . . . . . . . . . . . . . . . . . . . . . . . 34
5.3 Equivalence H2 et LQG . . . . . . . . . . . . . . . . . . . . . . 35
6 Forme LQG équivalente 36

6.1 Paramétrisation de Youla du correcteur LQG . . . . . . . . . 36
6.2 Calcul des paramètres . . . . . . . . . . . . . . . . . . . . . . 37
6.3 Application à l’interpolation de correcteurs . . . . . . . . . . . 38
A Optimisation et calcul des variations 41

A.1 Optimisation . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
A.1.1 Notations . . . . . . . . . . . . . . . . . . . . . . . . . 41
A.1.2 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . 41
A.1.3 Optimisation sans contrainte . . . . . . . . . . . . . . . 41
A.1.4 Optimisation avec contrainte . . . . . . . . . . . . . . . 42
A.2 Calcul des variations . . . . . . . . . . . . . . . . . . . . . . . 42
A.2.1 Problématique . . . . . . . . . . . . . . . . . . . . . . . 42
A.2.2 Équation d’Euler-Lagrange . . . . . . . . . . . . . . . . 43
A.2.3 Prise en compte des conditions initiales et finales . . . 44
A.2.4 Prise en compte de contraintes . . . . . . . . . . . . . . 44
B Systèmes linéaires multivariables 47

B.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
B.2 Pôles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
B.3 Commandabilité et observabilité . . . . . . . . . . . . . . . . . 47
B.4 Système linéaire à temps variant . . . . . . . . . . . . . . . . . 48
B.4.1 Modèle LTV . . . . . . . . . . . . . . . . . . . . . . . . 48
B.4.2 Observabilité . . . . . . . . . . . . . . . . . . . . . . . 49
B.4.3 Commandabilité . . . . . . . . . . . . . . . . . . . . . 49
C Analyse des systèmes asservis multivariables 50

C.1 Position du problème . . . . . . . . . . . . . . . . . . . . . . . 50
C.2 Valeur singulière . . . . . . . . . . . . . . . . . . . . . . . . . 50
C.3 Tracé des valeurs singulières . . . . . . . . . . . . . . . . . . . 51
C.4 Stabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
C.5 Suivi de consigne . . . . . . . . . . . . . . . . . . . . . . . . . 53
C.6 Rejet de perturbation . . . . . . . . . . . . . . . . . . . . . . . 53
C.7 Robustesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3
D Inégalités matricielles affines 54
D.1 Positivité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
D.2 Inégalité matricielle affine ou linéaire . . . . . . . . . . . . . . 54
D.3 Exemple de LMI . . . . . . . . . . . . . . . . . . . . . . . . . 55
D.4 Résolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4
1 Introduction
Les problèmes de commande optimale se rencontrent dans la vie de tous
les jours : comment arriver à destination le plus rapidement possible, com-
ment minimiser sa consommation... Pour un système dynamique donné et
dont les équations sont connues, le problème de commande optimale con-
siste alors à trouver la commande minimisant un critère donné. C’est sous
cette forme que la commande optimale a été étudiée dès le XIXème siècle
avec le calcul des variations. Une des grandes applications de la commande
optimale a été l’application au lanceur Apollo dans les années 1960. Notons
néanmoins que les difficultés soulevées par ce genre de problème sont loin
d’être complètement résolues comme en témoignent les sessions dédiées à la
commande optimale dans les conférences d’automatique. La commande op-
timale reste donc un sujet de recherche d’actualité.
On s’intéressera dans une première partie (§2) à la commande optimale

telle qu’elle a été posée initialement et dans le cas des systèmes les plus
généraux. Dans une seconde partie (§3), on s’intéressera plus particulièrement
aux systèmes linéaires dans le cas d’un critère quadratique, cas connu sous
le nom de commande linéaire quadratique (LQ), et qui s’exprime sous la
forme d’un retour statique d’état. On s’intéressera ensuite (§4) à la com-
mande linéaire quadratique gaussienne (LQG) permettant de synthétiser un
correcteur dynamique pour un système dont l’état n’est que partiellement
mesuré. On verra au §5 comment la commande LQG peut se formaliser
comme la synthèse d’un correcteur minimisant une norme matricielle (norme
H2 ) entre des signaux particuliers. Finalement, on s’intéressera à la possibilité
d’obtenir, pour un correcteur quelconque, une forme LQG équivalente.
5
2 Commande optimale
Plutôt que de présenter de manière approfondie le problème de la com-
mande optimale, cette partie constitue plutôt une introduction au sujet. Le
choix a été fait de présenter un résultat s’appuyant sur le principe du max-
imum de Pontriaguine sans rentrer dans la théorie du calcul des variations.
Pour approfondir ce domaine, pour pourrez consulter les ouvrages disponibles
[1, 2, 3]. D’autres cours sont également disponibles ; notamment celui de De-
nis Arzelier (http://www.laas.fr/~arzelier/cours.html).
2.1 Position du problème

Soit un système à temps continu de représentation d’état :
ẋ = f (x, u, t) (1)
et de condition initiale x(t0 ) = x0 , où t ∈ R, u ∈ Rm et x ∈ Rn . Les

signaux u et x sont des fonctions de R vers respectivement Rm et Rn . Pour
la condition initiale x0 et la commande u, l’équation d’état (1) définit une
trajectoire unique x pour l’état sur [t0 , tf ]. Celle-ci est fonction de la condition
initiale x0 et de la commande u sur [t0 , tf ].
Soit un critère :
Z tf
J(x0 , t0 , u) = θ(xf , tf ) + φ(x, u, t)dt (2)
t0
avec xf = x(tf ). Les fonctions θ et φ ainsi que les instants t0 et tf étant

donnés, ce critère ne dépend que de x0 et de u sur [t0 , tf ]. L’application qui
au signal de commande u associe le critère scalaire J(x0 , t0 , u) est une fonc-
tionnelle. On peut noter que différents critères existent dans la littérature :
– le problème de Lagrange :
Z tf
ψ(x, u, t)dt (3)
t0
– le critère de Bolza :
Z tf
θ(xf ) + φ(x, u, t)dt (4)
t0
– le critère de Mayer :
σ(xf , tf ) (5)
6
Eventuellement au moyen d’une augmentation d’état du système, il est intéressant
de noter qu’ils sont équivalents.
En plus de l’équation d’état qui lie les trajectoires de u et de x, d’autres
contraintes peuvent intervenir (sans pour autant remettre en cause le critère
choisi). Typiquement :
– l’instant final peut être imposé ou libre ;
– la commande peut appartenir à un ensemble u ∈ U = 6 Rm ;
– des contraintes peuvent exister sur l’état final : xf ∈ X .
Le problème de la commande optimale consiste alors à trouver la com-
mande ũ minimisant J(x0 , t0 , u) :
ũ = min J(x0 , t0 , u) (6)

u∈U
˜ 0 ) = J(x0 , t0 , ũ)
On notera alors x̃ la trajectoire correspondante de l’état et J(x
la valeur du critère.
2.2 Principe d’optimalité de Bellman

Soit le critère :
Z tf
t0
La trajectoire optimale sur [t0 , tf ] est ũ et le critère optimal :

˜ 0 , t0 ) = min J(x0 , t0 , u).
J(x (8)
u[t0 ,tf ]
Soit t1 ∈ [t0 , tf ]. Le principe d’optimalité de Bellman énonce que la trajectoire

optimale sur [t0 , tf ] contient la trajectoire optimale sur [t1 , tf ] avec comme
condition initiale x1 = x(t1 ). Autrement dit :
Z t1
˜
J(x0 ) = min ˜
φ(x, u, t)dt + J(x1 ) . (9)
u[t0 ,t1 ] ,x1 t0
Bien que les développements suivants ne s’appuient pas directement sur

ce principe, mais sur le principe du maximum, ce principe est un résultat clas-
sique de la commande optimale et se trouve souvent utilisé dans la littérature.
Il permet d’obtenir une solution optimale en découpant l’intervalle et en
résolvant un problème récursif.
7
2.3 Principe du minimum de Pontriaguine
Le principe du minimum de Pontriaguine [4] est ici brièvement énoncé.
On peut se référer à Sage et White [1] § 4.3.1 pour sa démonstration.
Soit le système d’équation d’état :
ẋ = f (x, u, t) (10)
et le critère de performance :
Z tf
t0
On définit l’hamiltonien du système :
H(x, u, p, t) = φ(x, u, t) + pT f (x, u, t) (12)
où p est appelé état-adjoint 1 . Le principe du minimum de Pontriaguine

énonce que la trajectoire optimale minimise l’hamiltonien du système. Autrement
dit :
H(x̃, ũ, p̃) 6 H(x̃, u, p̃) ∀u ∈ U (13)
Le long de la trajectoire optimale, on dispose d’un certain nombre d’équations
permettant de résoudre le problème de commande optimale. Ces équations
sont généralement établies en utilisant le calcul des variations. Pour plus
d’informations, se reporter à un ouvrage de référence.
L’extrémalité de la solution conduit à un jeu d’équations, appelées équations
canoniques de Hamilton, qui régissent les dynamiques de l’état d’une part et
de l’état adjoint d’autre part :
– état
∂H
= ẋ
∂p
– état adjoint
∂H
= −ṗ
∂x
Les équations provenant des conditions dites terminales, en t0 d’une part et
en tf d’autre part sont appelées équations de transversalité :
– à l’origine
T
∂θ ∂θ
−H(t0 ) + δt0 + p(t0 ) + δx0 = 0
∂t0 ∂x0
1. En Anglais : costate vector
8
– à l’arrivée
T
∂θ ∂θ
H(tf ) + δtf + −p(tf ) + δxf = 0
∂tf ∂xf
Enfin, selon la nature du problème, on aura encore certaines relations addi-

tionnelles :
– si aucune contrainte (de type saturation) n’est imposée sur u(t) à l’in-
stant t, on a :
∂H
(t) = 0
∂u
– si H n’est pas une fonction explicite du temps, on a :
dH ∂H
= =0
dt ∂t
Lien avec le calcul des variations

Il s’agit d’un problème d’optimisation sous contrainte égalité f (x, u, t) −
ẋ = 0. En s’appuyant sur le calcul des variations, on est amené à introduire un
multiplicateur de Lagrange p, qui est une fonction du temps, et à introduire
le Hermicien :
H(x, u, p, t) = φ(x, u, t) + pT f (x, u, t) (14)
Le critère s’écrit alors :
Z tf
J˜ = θ(xf , tf ) + (φ(x, u, t) + pT (f (x, u, t) − ẋ)) dt
t
Z 0tf
= θ(xf , tf ) + (H(x, u, p, t) − pT ẋ) dt
t
Z 0tf
= θ(xf , tf ) + (H(x, u, p, t) + ṗT x) dt − pT T
f xf + p (t0 )x0
t0
Z tf
= θ̃(x0 , t0 , xf , tf ) + (H(x, u, p, t) + ṗT x) dt (15)
t0
où θ̃(x0 , t0 , xf , tf ) = θ(xf , tf ) − pT T

f xf + p0 x0 . Le calcul des variations permet
de donner des conditions nécessaires pour résoudre ce problème (cf. para-
graphe A.2, page 42). On comprends ainsi l’apparition de l’équation de l’état
adjoint ∂H ∂x
= −ṗ.
9
2.4 Equation d’Euler-Lagrange
Cf. [1] §3.5 et [5] §4.1.3.
L’équation d’Euler-Lagrange, bien connue en mécanique, peut être retrouvée
à partir du principe du minimum. En notant T , l’énergie cinétique et U
l’énergie potentielle d’un système mécanique, le principe de moindre ac-
tion énoncé par Maupertuis postule que le système évolue en minimisant
l’intégrale : Z tf
(T − U )dt. (16)
t0
Notons q les cordonnées généralisées du système. Soit L(q, q̇) = T (q, q̇) −
U (q) le lagrangien, avec le critère :
Z tf
J(q0 , t0 , q̇) = L(q, q̇)dt (17)
t0
On considère un système dont on commande la vitesse, l’équation d’état du

système s’écrivant alors simplement :
q̇ = u (18)
L’hamiltonien s’écrit alors :
H(q, q̇) = L(q, q̇) + pT q̇ (19)
et le principe du minimum donne les deux équations suivantes :

∂H ∂L
= = −ṗ (20)
∂q ∂q
∂H ∂L
= +p=0 (21)
∂ q̇ ∂ q̇
En dérivant la seconde équation par rapport au temps puis en remplaçant ṗ
grâce à la première, on obtient l’équation d’Euler-Lagrange :
d ∂L ∂L
− = 0. (22)
dt ∂ q̇ ∂q
2.5 Commande bang-bang

Un type de commande optimal particulier bien connu est la commande
à temps minimal. Prenons un exemple : vous commandez l’accélération d’un
véhicule que vous devez amener d’une position initiale d’arrêt à une posi-
tion finale, également à l’arrêt, dans le temps le plus court possible. Si l’on
10
considère un mouvement enn ligne droite, on conçoit intuitivement que la
commande optimale est dans ce cas une accélération maximale jusqu’à un
certain instant à partir duquel il faudra freiner au maximum. On parle de
commande bang-bang parce que la commande est toujours saturée, alterna-
tivement à sa valeur minimale ou à sa valeur maximale. Quant à la robustesse
de la commande, c’est-à-dire la capacité à remplir la mission de manière
précise, lorsque la masse du véhicule est imparfaitement estimée, vous imag-
inez bien que ce genre de commande n’est pas très recommandable. Pour un
exemple de ce type de commande, cf. Sage & White [1], §5.3, p. 103.
Un exemple complet de commande en temps minimal sera traité en cours :
celui du double intégrateur.
3 Commande Linéaire Quadratique

On parle de commande linéaire quadratique : LQ ou LQR pour linear
quadratic regulator. Le système est linéaire et la commande est quadratique.
La commande optimale est un retour d’état.
3.1 Commande LQ à horizon fini

Cf. [1] § 5.1 et l’exemple 5.1-1 (très didactique) ; cf. annexe C de[2].
Soit le problème de commande optimale du système :
ẋ = A(t)x + B(t)u (23)
avec le critère :
Z tf
1 1 T
x Q(t)x + uT R(t)u dt,

J(x0 , t0 , u) = xf Sxf + (24)
2 t0 2
les matrices Q, R et S étant symétriques avec Q et S ≥ 0 et R > 0 2 .

L’hamiltonien s’écrit alors :
1
H(x, u, p, t) = pT A(t)x + pT B(t)u + (xT Q(t)x + uT R(t)u). (25)
2
L’hamiltonien, vérifie les conditions suivantes :
– équation de l’état adjoint
∂L
ṗ = − = −AT (t)p − Q(t)x (26)
∂x
R tf1 T
2. Remarquons que le critère t0 2
(y Qy (t)y + uT R(t)u)dt est équivalent avec Qy =
C T (t)Q(t)C(t).
11
– condition de transversalité
p(tf ) = Sxf (27)
– absence de contrainte sur la commande

∂L
= B T (t)p + R(t)u = 0 (28)
∂u
De l’équation (28), on déduit :
u = −R−1 (t)B T (t)p. (29)
Alors l’équation dynamique du système s’écrit :
ẋ = A(t)x − B(t)R−1 (t)B T (t)p. (30)
Les équations (26) et (30) peuvent se mettre sous la forme d’un système
matriciel appelé système hamiltonien :
A(t) −B(t)R−1 (t)B T (t)

d x x
= T (31)
dt p −Q(t) −A (t) p
Ecrivons p = P (t)x, comme nous y incite (27), avec, d’après (27), la

condition finale P (tf ) = S. L’équation (26) s’écrit alors :
ṗ = − AT (t)P (t) + Q(t) x.

(32)
Avec ṗ = Ṗ x+P ẋ et l’équation d’état (23) du système, l’équation (32) s’écrit

(en omettant la référence au temps afin d’alléger les notation) :
(Ṗ + P A + AT P − P BR−1 B T P + Q)x = 0 (33)
La solution est alors obtenue en résolvant l’équation (différentielle) de Riccati

suivante :
Ṗ + P A + AT P − P BR−1 B T P + Q = 0 (34)
avec la condition finale P (tf ) = S.
On montre que la condition :
xT (Ṗ + P A + AT P − P BR−1 B T P + Q)x = 0 (35)
s’écrit aussi :
d T
(x P x) + xT Qx + uT Ru = 0. (36)
dt
12
Le critère :
Z tf
1 1 T
J(x0 , t0 , u) = xf Sxf + (x Q(t)x + uT R(t)u)dt. (37)
2 t0 2
s’écrit alors :
Z tf
1 d T
J(x0 , t0 , u) = xf Sxf − (x P x)dt . (38)
2 t0 dt
soit, avec la condition de transversalité S = P (tf ) :
1
J(x0 , t0 , u) = xT P (t0 )x0 (39)
2 0
Le minimum du critère est donc :
˜ 0 ) = J0 (t0 , x0 , ũ) = 1 xT P (t0 )x0 .
J(x (40)
2 0
Il est intéressant de noter que la commande optimale obtenue s’écrit
comme un retour d’état u = −K(t)x avec :
K = −R−1 B T P. (41)
Néanmoins, n’oublions pas que, dans le cas présent, K varie en fonction du
temps, même dans le cas d’un système et d’un critère à temps invariant
(c’est-à-dire si les matrices A, B, Q et R ne dépendent pas du temps). En
effet, la matrice P (t) reste dépendant du temps dans le cas d’un critère à
temps fini.
3.2 Commande LQ à horizon infini

Intéressons nous ici au cas du système LTV précédent où :
Z ∞
1 T
x Q(t)x + uT R(t)u dt.

J(x0 , t0 , u) = (42)
t0 2
On montre que ce critère est fini si le système est stabilisable à tout instant t,
(c’est-à-dire qu’à chaque instant, il existe un K(t) tel que les valeurs propres
de A − BK soient à partie réelle négative). Remarquons par ailleurs que
la partie du critère concernant l’état final n’est plus pertinente car, sur un
horizon infini, l’état tend vers zéro si le système bouclé est stable.
Dans le cas d’un problème LTI (linéaire à temps invariant), la commande
optimale est un retour d’état statique u = −Kx où K est exprimé par
l’équation (41) et où P vérifie l’équation algébrique de Riccati :
P A + AT P − P BR−1 B T P + Q = 0. (43)
La résolution de l’équation algébrique de Riccati (43), disponible dans les
Toolboxes du logiciel Matlab, dépasse le cadre de ce cours.
13
3.3 Robustesse de la commande LQ
Cf. [2] pp. 104 & 122, cf. [6]. Sur les propriétés de robustesse de la com-
mande LQ, cf. [7].
3.3.1 Différence de retour

A partir de l’équation de Riccati, faisons apparaı̂tre les termes sI − A en
ajoutant P sI − sIP où I est la matrice unité 3 :
P (sI − A) + (−sI − AT )P + P BR−1 B T P = Q (44)
Multiplions à droite par (sI − A)−1 B et à gauche par B T (−sI − AT )−1 :
B T (−sI − AT )−1 P B + B T P (sI − A)−1 B

+B T (−sI − AT )−1 P BR−1 B T P (sI − A)−1 B (45)
= B T (−sI − AT )−1 Q(sI − A)−1 B.
En notant que d’après (41), on a B T P = RK et P B = K T R, on obtient :
B T (−sI − AT )−1 K T R + RK(sI − A)−1 B

+B T (−sI − AT )−1 P BR−1 B T P (sI − A)−1 B (46)
= B T (−sI − AT )−1 Q(sI − A)−1 B.
Le premier membre de l’égalité s’écrit :
(I + B T (−sI − AT )−1 K T )R(I + K(sI − A)−1 B) − R. (47)
On obtient finalement l’équation de la différence de retour :
(I + B T (−sI − AT )−1 K T )R(I + K(sI − A)−1 B)

(48)
= R + B T (−sI − AT )−1 Q(sI − A)−1 B.
3.3.2 Marges de stabilité

Reprenons l’équation de la différence de retour en fréquentiel avec s = jω
et en notant H(jω) = (jωI − A)−1 B. On obtient alors pour tout ω :
(I + KH(jω))H R(I + KH(jω)) = R + H H (jω)QH(jω) (49)
où M H est le hermitien de M , c’est-à-dire le conjugué transposé. On en déduit

alors l’inégalité de Kalman :
(I + KH(jω))H R(I + KH(jω)) ≥ R. (50)

3. Ces calculs sont repris de [8], § II.7 ; voir aussi [2], § 5.2.
14
Restreignons nous au cas où R = ρI et factorisons Q en 4 Q = LT L.
L’égalité (49) s’écrit alors :
1
(I + KH(jω))H (I + KH(jω)) = I + (LH(jω))H (LH(jω)) (51)
ρ
dont on déduit les valeurs singulières de I + H(jω)K :
p
σi (I + KH(jω)) = λi ((I + KH(jω))H (I + KH(jω))) (52)
s
1 H
= λi I + (LH(jω)) (LH(jω)) (53)
ρ
r
1
= 1 + σi2 (LH(jω)) (54)
ρ
≥ 1 (55)
où λi représente la ième valeur propre 5 . En monovariable, ce résultat s’in-

terprète facilement sur le lieu de Nyquist, comme le fait que la distance au
point −1 est toujours supérieure à 1. Ainsi, la commande LQ présente la
propriété de robustesse suivante : sa marge de module est égale à 1. On en
déduit ainsi les intervalles dans lesquels le gain et la phase peuvent varier :
– gain ]0, 5 ; +∞[,
– phase ] − 60˚ ; 60˚[
3.4 Structure des régulateurs

Lorsque des signaux de consigne y ∗ sont donnés pour certaines com-
posantes y de x, comment les intégrer à la loi de commande ? Imaginons
que les consignes concernent les premières composantes de x et décomposons
x et K ainsi :
y
Kx = [Ky Kz ] (56)
z
Alors la loi de commande sera :
u = Ky (y ∗ − y) − Kz z. (57)
Si y est donné par une loi de type équation de sortie, y = Cx, on peut effectuer
un changement d’état de sorte que le nouveau vecteur d’état contienne y, par
exemple en utilisant la forme canonique d’observabilité.
4. C’est toujours possible puisque Q ≥ 0, par exemple avec une factorisation de
Choleski.
5. En utilisant les propriétés σi2 (M ) = λi (M H M ) et λi (I + M ) = 1 + λi (M ).
15
La commande LQ est de type proportionnelle. Dans le but d’améliorer
les performances en régulation en présence de perturbations constantes, il est
souhaitable d’ajouter un effet intégral. Imaginons, à titre d’exemple, que la
première composante x1 de x doive être asservie à x∗1 sans erreur statique.
Construisons l’état supplémentaire :
Z t
I1 = (x1 (τ ) − x∗1 (τ ))dτ (58)
0
avec l’équation correspondante :

I˙1 = x1 − x∗1 (59)
En considérant x∗1 comme une perturbation constante et, de ce fait, en ne
l’intégrant pas dans le modèle, l’équation d’état du système augmenté de son
nouvel état I1 s’écrit :
ẋe = Ae (t)xe − Be (t)u (60)
où le vecteur d’état augmenté est :

x
xe = (61)
I1
et les matrices d’état sont 6 :

A On×1
Ae = (62)
[1 O1×n−1 ] 0

B
Be = (63)
O1×m
Sur ce modèle, un régulateur Ke ∈ Rm×n+1 de type LQ peut être synthétisé.
Décomposons Ke selon :

x
Ke xe = [K KI ] (64)
I1
Le régulateur obtenu, d’entrées x et x∗1 , et de sortie u est un système dy-
namique d’ordre 1 de modèle d’état :
I˙1 = x1 − x∗1

(65)
u = −KI I1 − Kx
La consigne x∗1 peut aussi être retranchée à x1 ; d’autres consignes peuvent
être intégrées de la même manière en retranchant leur valeur à l’état corre-
spondant. Si une commande en boucle ouverte (feed-forward) est disponible,
elle peut être également intégrée ; la commande sera alors la somme de la
commande en boucle fermée et de la commande en boucle ouverte.
6. La matrice Ok×l représente la matrice nulle de dimension k × l.
16
3.5 Choix des pondérations
Il est intéressant de remarquer d’abord que la multiplication des pondérations
Q et R par un même scalaire laisse inchangé le gain K. En effet, soit P so-
lution de (43) et soit le nouveau problème basé sur les pondérations Q̂ = λQ
et R̃ = λR. On vérifie que P̂ = λP est solution de l’équation de Riccati
correspondante. En effet :
K̂ = −R̂−1 B T P̂ = −RB T P = K (66)
Sans restriction, les pondérations peuvent être choisies symétriques. Elles

sont généralement choisies diagonales. Ainsi, on se ramène au choix de n
scalaires pour l’état et de p scalaires pour la commande. Voici une méthode
simple de choix et de modification des pondérations en vue d’aboutir à un
correcteur satisfaisant.
1. Au départ, on choisit généralement des pondérations égales aux matri-
ces identité.
2. Dans une seconde étape, on accélère ou décélère globalement le système
en multipliant la matrice Q par un scalaire λ (accélération avec λ > 1
et décélération avec λ < 1), jusqu’à obtenir une dynamique moyenne
adaptée.
3. Dans le cas où certains états auraient des dynamiques trop lentes par
rapport à d’autres, on peut choisir d’augmenter la pondération de Q
correspondant aux premiers.
4. Dans le cas où certains actionneurs seraient trop sollicités par rapport
à d’autres, on peut choisir d’augmenter la pondération de R leur cor-
respondant.
Les étapes 2, 3 et 4 peuvent être réitérées dans l’ordre souhaité jusqu’à obtenir
un correcteur satisfaisant le cahier des charges.
3.6 Commande LQ à temps discret

Cf. §9 de [9].
3.6.1 Commande LQ à temps discret à horizon fini

Formulation du problème. Soit le système dynamique à temps discret
défini par :
x(k + 1) = A(k)x(k) + B(k)u(k) (67)
17
avec la condition initiale x(0) = x0 et cherchons la commande minimisant le
critère :
k=n
1X T
J= x (k)Q(k)x(k) + uT (k)R(k)u(k). (68)
2 k=0
Ce problème est plus simple que celui à temps continu car il s’agit ici d’un
problème dont les inconnues sont les n + 1 valeurs de u(k) et non plus une
fonction du temps. Il s’agit d’une minimisation de (68) sous les contraintes
(67). Le Lagrangien s’écrit alors :
k=n
X 1 T 1
L= x (k)Q(k)x(k) + uT (k)R(k)u(k)
k=0
2 2
+pT (k + 1) (−x(k + 1) + A(k)x(k) + B(k)u(k))

(69)
et la solution optimale vérifie les équations suivantes :
∂L
= R(k)u(k) + B T (k)p(k + 1) = 0 (70)
∂u(k)
∂L
= Q(k)x(k) − p(k) + AT (k)p(k + 1) = 0 (71)
∂x(k)
∂L
= −x(k + 1) + A(k)x(k) + B(k)u(k) = 0 (72)
∂p(k + 1)
L’équation de la commande (70) donne :
u(k) = −R−1 (k)B T (k)p(k + 1). (73)
La dernière commande u(n) n’a aucun effet sur l’évolution du système sur
l’horizon considéré ; sa valeur optimale est donc nulle :
u(n) = 0. (74)
On a ainsi d’après (70) :
p(n + 1) = 0 (75)
et d’après l’équation adjointe (71) :
p(n) = Q(n)x(n). (76)
Il s’agit d’un problème aux deux bouts : une condition initiale est disponible
pour l’état alors que c’est une condition finale qui est disponible pour l’état
adjoint. Ainsi, la résolution du problème doit se faire pour l’ensemble de la
trajectoire, ce qui peut représenter une charge de calcul élevée dans le cas
d’un horizon n élevé.
18
Formulation sous forme d’équation de Riccati. Les équations précé-
dentes peuvent être résolues directement en x et p. On peut aussi adopter
la démarche suivante, basé sur un changement de variable suivant pour la
variable adjointe :
p(k) = P (k)x(k) (77)
où P (k) est une matrice qu’il faudra déterminer ; P (n) = Q(n). La commande
u(k) vérifie alors :
R(k)u(k) = −B T (k)P (k + 1)x(k + 1) (78)

= −B T (k)P (k + 1)(A(k)x(k) + B(k)u(k)) (79)
et peut donc s’écrire :

u(k) = −K(k)x(k) (80)
avec :
K(k) = R̃−1 (k)B T (k)P (k + 1)A(k) (81)
où :
R̃(k) = R(k) + B T (k)P (k + 1)B(k). (82)
Il reste maintenant à déterminer la matrice P (k). Partant de (71), on obtient :
P (k)x(k) = Q(k)x(k) + AT (k)P (k + 1)x(k + 1) (83)

T
= Q(k)x(k) + A (k)P (k + 1)(A(k)x(k) + B(k)u(k)) (84)
En utilisant (80), l’équation ci-dessus se réécrit :
P (k)x(k) = Q(k) + AT (k)P (k + 1)(A(k) − B(k)K(k)) x(k).

(85)
Comme cette équation doit être vérifiée pour tout x(k), il est nécessaire que :
P (k) = Q(k) + AT (k)P (k + 1)(A(k) − B(k)K(k)), (86)
ce qui s’écrit :
P (k) = Q(k) + AT (k)M (k + 1)A(k), (87)
avec :
M (k+1) = P (k+1)−P (k+1)B(k)(R(k)+B T (k)P (k+1)B(k))−1 B T (k)P (k+1).

(88)
Cette équation récursive à inconnue matricielle est appelée équation de Ric-
cati discrète. Sa condition finale est P (n) = Q(n) et sa résolution se fait donc
à rebours. Dans le cas de systèmes LTV où les matrices A, B dépendent ef-
fectivement de k ou bien si c’est le cas des matrices de pondération Q et R,
cela suppose de connaı̂tre à l’avance l’ensemble des matrices pour k = 0 . . . n.
19
3.6.2 Critère à horizon infini
Cherchons la commande minimisant le critère :
∞
1X T
J= x (k)Qx(k) + uT (k)Ru(k). (89)
2 k=0
Il s’agit du critère précédent où n tend vers l’infini.

On peut montrer alors que pour un système LTI le gain du retour d’état
est constant. Il s’écrit :
K = (R + B T P B)−1 B T P A (90)
où P est solution de l’équation algébrique de Riccati discrète :
P = Q + AT (P − P B(R + B T P B)−1 B T P )A. (91)
La résolution de cette équation non linéaire n’est pas triviale. Des algorithmes
[10] sont disponibles dans les Toolboxes du logiciel Matlab [11].
3.7 Commande prédictive

La commande linéaire quadratique sur un horizon a connu un succès par-
ticulier sous le nom de commande prédictive. Il s’agit d’une famille de com-
mande qui se basent sur des prédictions de l’évolution des signaux extérieurs
et des états internes pour le calcul du signal de commande optimal. La com-
mande LQ, présentée précédemment, permet de faire tendre vers zéro l’état
interne d’un système. La loi de commande obtenue peut être utilisée dans
le but de suivre un signal de consigne (on retranchera alors la consigne à
l’état utilisé dans la loi de commande) et pour un rejet de perturbation (les
commande en boucle fermée ont des propriétés naturelles de rejet de per-
turbation). Toutefois, le problème peut être formulé de manière spécifique
pour chacun de ces problèmes. On se limitera au cas des systèmes à temps
invariant. Ici, nous nous intéressons à la formulation pour les systèmes sous
forme de représentation d’état. Une formulation pour les fonctions de trans-
fert (approche polynomiale) est également disponible.
3.7.1 Suivi de consigne

On suppose que la consigne r(k) est connue à l’avance et on cherche la
commande permettant de minimiser le critère :
k=n
1X
J= (x(k) − r(k))T Q(x(k) − r(k)) + uT (k)Ru(k) (92)
2 k=0
20
Souvent, on préfère considérer le critère suivant :
k=n
1X
J= (x(k) − r(k))T Q(x(k) − r(k)) + ∆T
u (k)R∆u (k) (93)
2 k=0
où ∆u (k) = u(k) − u(k − 1). Ce critère pénalise l’amplitude des variations
du signal d’entrée au lieu de pénaliser directement son amplitude. Pour min-
z
imiser le critère (93), il suffit d’ajouter un intégrateur z−1 sur chacune des
entrées du système et de poursuivre avec le critère (92).
3.7.2 Rejet d’une perturbation connue

Position du problème. On considère cette fois que le système est affecté
par une perturbation v(k) dont on est capable de prédire l’évolution :
x(k + 1) = Ax(k) + Bu(k) + v(k) (94)
Le critère à minimiser (68) est identique au cas général. La démarche est

identique au cas précédent en tenant compte du nouveau modèle.
Le Lagrangien s’écrit :
k=n
X 1 1
L= xT (k)Qx(k) + uT (k)Ru(k)
k=0
2 2
+pT (k + 1) (−x(k + 1) + Ax(k) + Bu(k) + v(k))

(95)
Dans les équation (70-72), seule la troisième équation est modifiée :
∂L
= −x(k + 1) + Ax(k) + Bu(k) + v(k) = 0 (96)
∂p(k + 1)
L’équation de la commande (73) est inchangée. En remplaçant la commande

dans l’ équation (72) grâce à (73) et en reprenant (71), on obtient un système
d’équations dont les inconnues sont les signaux x(k) et p(k).
Qx(k) − p(k) + AT p(k + 1) = 0 (97)

−x(k + 1) + Ax(k) − BR−1 B T p(k + 1) + v(k) = 0 (98)
Pour l’état, on connait la condition initiale x(0) ; pour l’état adjoint, on

connait la condition finale p(n + 1) = 0. Il s’agit donc d’un problème aux
deux-bouts. La méthode de résolution générale consiste à écrire l’ensemble
des relations et à résoudre le système matriciel ainsi obtenu.
21
Résolution. En considérant (97) pour k = 1, · · · , n, on obtient le système :
 
I −AT O ··· O       
O
 I −AT · · · O   p(1) −Q O x(1) O
 .. .. .. . . .. . .
  ..  +  ..   ..  =  .. 
       
. . . .
I −AT  p(n)
 
O · · · O O · · · −Q x(n) O
O ··· ··· O I
(99)
−1 T
En notant S = BR B , l’équation (98) donne pour k = 0, · · · , n :
O ··· ··· O
 
  I  
S O ··· O  
−A · · ·
  v(0) + Ax(0)
O S · · · O p(1)  I O O x(1)
 
  ..   .. .. .. ..  ..  = 
 v(1) 

 .. . . ..  .   + O . . . .
 
 .   ..


. . . . . . . .
. . . .
    
p(n)  . . . . O  x(n)
O ··· O S v(n − 1)
O · · · O −A I
    (100)
x(1) p(1)
 ..   .. 
En notant x =  .  et p =  . , le système (99-100) se réécrit sous
x(n) p(n)
la forme :
M11 p + M12 x = O (101)

M21 p + M22 x = B2 (102)
Les matrices M11 et M22 sont inversibles ; il est donc possible d’éliminer x
dans les équations, afin d’obtenir :
−1
M 11 p = −M12 M22 B2 (103)
−1
où M 11 = M11 − M12 M22 M21 . Si M 11 est inversible, alors,
−1 −1
p = −M 11 M12 M22 B2 (104)
En réalité, d’après (73), seul p(1) est utile pour calculer u(0). On calcule ainsi
u(0) et on l’applique à l’instant t0 . A l’étape suivante (t1 ), au lieu d’appliquer
u(1) qui vient d’être calculé, on recommance la résolution du problème en
tenant compte des nouvelles mesures.
Réécriture de la loi de commande. En notant :
B2 = v + Ax(0) (105)
22
avec :  
A  
O v(0)
A =  ..  , v =  ..
,
   
. .
v(n − 1)
O
on peut réécrire le vecteur des états adjoints :
−1 −1
p = −M 11 M12 M22 (Ax(0) − v) (106)
Par ailleurs, on a :
p(1) = Cp
avec
C = I O ... O .
On peut donc écrire la commande sous la forme :
u(0) = −Kx(0) + Lv (107)

−1 −1
avec L = R−1 B T CM 11 M12 M22 et K = −LA.
Le calcul que nous venons de faire pour l’intant initial k = 0 peut être
fait pour tout instant k. En notant :
 
v(k)
v(k) =  ..
,
 
.
v(k + n)
la loi de commande se réécrit :
u(k) = −Kx(k) + Lv(k) (108)
On observe que la commande est un retour d’état avec une compensation

de la perturbation. Le calcul de K et L sera fait à l’avance, hors ligne, afin
d’alléger la charge de calcul à effectuer en ligne.
La commande u(k) à appliquer à l’instant tk est déterminée d’après la
valeur de l’état au même instant. Pourtant, un temps de calcul non nul est
nécessaire pour réaliser le calcul de la commande. En pratique, le calcul de
u(k) sera effectué pendant l’intervalle [tk−1 , tk ] en utilisant une prédiction de
x(k) : x̂(k) = Ax(k − 1) + Bu(k − 1) + v(k − 1). La loi de commande s’écrit
donc finalement :
u(k) = −K x̂(k) + Lv(k) (109)
Des techniques d’estimation optimale peuvent être utilisées pour déterminer
la trajectoire de l’état, notamment si l’ensemble de l’état n’est pas mesuré.
23
Exemple illustratif. La commande a été testée sur un système du second
ordre de fonction de transfert 7 :
1
H(s) = (110)
s2 + 2ξω0 s + ω02
avec ω0 = 10 rad/s, ξ = 2 et discrétisé à T = 0.1 s en considérant en entrée

un bloqueur d’ordre zéro, ce qui donne comme représentation d’état :
 
0.7889 −0.1465 0.0625
A B
=  0.1250 0 0  (111)
C D
0.0284 0.0662 0
Pour le critère, on a choisit R = I et Q = 106 C T C afin de minimiser la

sortie y. L’horizon de prédiction est choisi à n = 6. La perturbation est un
signal additif sur la commande, soit v(k) = Bw(k). Dans les simulations qui
suivent, on teste l’effet d’un échelon de perturbation à k = 21 en présence de
condition initiale non nulle, soit w(k) = 1 si k ≤ 20 et w(k) = 0 si k < 20.
Le correcteur obtenu s’écrit :

K = 12.9867 −1.8798
et

L= −12.8293 −22.9263 −2.5736 −6.2616 0.1052 0.2258 ...

... 0.0069 0.0176 −0.0005 −0.0012 −0.0000 −0.0000
En plus du système asservi par le GPC avec modèle de la perturbation,

ont été simulés le système en boucle ouverte et le système asservi par un
retour d’état statique K0 réglé par la méthode LQR (critère quadratique à
horizon infini) avec les mêmes matrices de pondération que le GPC :

K0 = 12.9867 −1.8798
On remarque que dans le cas présent, le correcteur LQR est sensiblement

identique à la partie “retour d’état” du correcteur prédictif.
Sur la figure 1, on observe que le correcteur prédictif permet de mieux
rejeter la perturbation. L’écart de la commande entre les correcteurs GPC
et LQR s’observe sur la figure 2 : on note que la commande du correcteur
prédictif commence à varier dès k = 19 alors que le correcteur LQR ne peut
réagir qu’à partir de k > 20.
7. Le code Matlab de cet exemple est disponible sur http://eavr.u-strasbg.fr/
~ laroche/student/#MIRIV.
24
Figure 1 – Allure des réponses des systèmes
Figure 2 – Allures de la perturbation et de la commande
Il faut toutefois préciser que ces simulation correspondent à une situ-

ation où la perturbation est supposée parfaitement connue. En réalité, on
sera amené à réaliser une prédiction de la perturbation en utilisant les ob-
25
servations passées. L’erreur de prédiction entrainera une dégradation des
résultats. Toutefois, les résultats devraient rester meilleurs que ceux obtenue
sans utiliser cette prédiction. A titre d’exemple d’application, citons la com-
pensation des mouvements physiologiques en robotique chirurgicale. Pour
mieux stabiliser la portion du cœur à opérer, un modèle de la perturbation
engendrée par le battement cardiaque peut être développé [12].
26
4 Commande Linéaire Quadratique Gaussi-
enne
Par rapport à la commande LQ, la commande LQG présente l’intérêt de
s’appliquer à des systèmes dont l’état n’est pas mesuré. Développée au début
de la seconde moitié du 20ème siècle et appliquée lors du programme spatial
Apollo pour la stabilisation de lanceurs, elle est apparu comme la première
méthode générale pour l’asservissement des systèmes multivariables. De ce
fait, elle a connu un grand succès comme en témoigne les nombreuses publi-
cations sur le sujet. Depuis la fin du 20ème siècle, la commande H∞ apparaı̂t
comme un sérieux concurrent pour l’asservissement robuste des systèmes
multivariables. Néanmoins, la commande LQG n’en demeure pas moins un
standard industriel.
4.1 Formulation
Soit le système dynamique stochastique d’équation d’état :

ẋ = Ax + Bu + v
(112)
y = Cx + w
où le bruit d’état v et le bruit de mesure w sont des bruits blancs centrés de
variance E{vv T } = V ≥ 0 et E{wwT } = W > 0. Le problème LQG consiste
en la minimisation du critère :
Z tf
1 T T

J(x0 , t0 , u) = lim E x Qx + u Ru dt , (113)
tf →∞ tf t0
où Q ≥ 0 et R > 0. Du fait des entrées de bruit v et w, les grandeurs u

et x sont des grandeurs stochastiques. Comme critère, il est ainsi naturel de
s’intéresser à l’espérance d’une intégrale. Comme pour la commande LQ, il
est possible de considérer des critères à temps fini.
4.2 Théorème de séparation

La solution de ce problème de commande optimale de processus stochas-
tique est bien connue sous le nom de théorème de séparation 8 . Ce théorème
énonce que la solution du problème est composée de deux parties :
– un observateur de Kalman permettant de donner l’estimée x̂ de x qui
est non biaisée et à variance minimale,
8. En Anglais : Seperation Theorem ou Certainty Equivalence Principle.
27
– la commande par retour d’état u = −K x̂ à appliquer à x̂ où K est
calculé en considérant le problème LQ correspondant (en enlevant v et
w de l’équation d’état et E dans le critère).
Ce théorème est intéressant dans la mesure où il donne la solution du problème
complet comme étant la réunion des solutions de deux problèmes plus sim-
ples et déjà résolus : celui de la commande LQ et celui de l’estimation de
Kalman. Pour une démonstration de ce théorème, cf. [2] § 8.2 et [13].
4.3 Structure de la commande LQG

L’estimée optimale x̂ est donnée par l’observateur d’équation d’état :
x̂˙ = Ax̂ + Bu + L(y − C x̂), (114)
où le gain de Kalman est :
L = ΣC T W −1 , (115)
avec Σ la solution de l’équation algébrique de Riccati :
ΣAT + AΣ − ΣC T W −1 CΣ + V = 0. (116)
La commande étant donnée par u = −K x̂, on peut réécrire les équations

de la commande d’entrée y et de sortie u :
x̂˙ = (A − BK − LC)x̂ + Ly

(117)
u = −K x̂
Le suivi d’une consigne y ∗ se fera par la loi de commande u = C(s)(y ∗ − y)

où la fonction de transfert du correcteur est :
C(s) = K(sI − A + BK + LC)−1 L. (118)
Ses équations d’état sont :
x̂˙ = (A − BK − LC)x̂ + L

(119)
u = K x̂
où = y ∗ −y. Notons que ce correcteur LTI a le même ordre que le processus.
28
4.4 Choix des pondérations
4.4.1 Généralités
Le réglage du correcteur LQG nécessite la donnée de quatre matrices de
pondération : Q et R pour le retour d’état ; V et W pour l’estimateur. La
méthode de réglage la plus simple repose sur un réglage séparé : régler V et W
de sorte que l’état soit ‘bien’ reconstruit et régler Q et R pour avoir un ‘bon’
retour d’état. Si les dynamiques de la régulation sont relativement lentes
devant celles de l’observation, on peut supposer que l’état est parfaitement
connu du point de vue du retour d’état et la commande sera robuste (marge
de module égale à 1). Si cette hypothèse n’est pas respectée, et ce sera le cas
dès que vous souhaiterez obtenir un régulateur avec des dynamiques élevées,
la robustesse n’est plus assurée. La méthode de réglage des pondérations Q
et R du retour d’état vue au paragraphe précédent reste valable. Abordons
la question du réglage de l’estimateur avant de présenter les méthodes de
recouvrement du gain destinées à rendre robuste la commande LQG.
4.4.2 Réglage de l’estimateur d’état

L’estimateur d’état s’appuie sur la commande u et sur la mesure y du
système pour donner l’estimée de l’état la plus plausible, compte-tenu des
incertitudes et bruits affectant le modèle et la mesure.
Une première approche du réglage du filtre concerne le cas où l’hypothèse
de départ sur le modèle est respectée ; c’est-à-dire que le seul défaut du
modèle est d’être affecté par des signaux stochastiques blancs. Dans ce cas,
le réglage se fera directement par une évaluation des variances des bruits.
Evaluer le bruit de mesure w en observant y est direct ; ce qui n’est pas le cas
du bruit d’état v. Ce bruit peut être attribué à la commande u en choisissant
V = BVu B T , avec Vu la variance du bruit de mesure.
Cependant, la principale source de bruit d’état d’un modèle provient
généralement des erreurs de modélisation qui sont déterministes et non stochas-
tiques. Néanmoins ces erreurs de modélisation sont généralement mal con-
nues et il n’est pas aberrant d’en tenir compte globalement grâce à un terme
stochastique. La validation du filtre de Kalman peut alors se faire en simu-
lation en introduisant des erreurs sur le modèle telles que des variations sur
ses paramètres.
4.4.3 Loop Transfert Recovery

Cf. [2] § 8.4, p.236.
29
La présence d’un observateur fait que les propriétés de robustesse du cor-
recteur LQ ne sont plus valables [14]. Les méthodes de Loop Transfert Recov-
ery (LTR ou en Français recouvrement du transfert de la boucle) consistent
à modifier les conditions de la synthèse afin de se rapprocher du transfert
qui serait obtenu avec un retour d’état LQ. Si ce transfert est obtenu, la
robustesse est alors assurée. Depuis les premiers travaux de Doyle et Stein en
1981 [15], de nombreux travaux ont été menés sur ce sujet [16, 17, 18]. C’est
cette première approche qui est présentée ici ; elle est également présentée
dans [6]. Elle a l’inconvénient de ne pas convenir aux systèmes à déphasage
non-minimal 9 . Des travaux ultérieurs se sont attachés à ce type de système
[19].
La méthode de recouvrement repose sur l’écriture de la matrice de co-
variance V de la forme :
V = V0 + q 2 BB T . (120)
On montre que le gain de la boucle ouverte C(s)G(s) tend vers K(sI − A)−1 B,
celui du régulateur LQ, lorsque q tend vers l’infini. Ainsi, à partir d’un cor-
recteur initial reposant sur les pondérations V0 et W , on augmente petit-à-
petit q jusqu’à obtenir la robustesse suffisante.
Une approche duale consiste à retoucher le gain du retour d’état en choi-
sissant la matrice de pondération Q de la forme :
Q = Q0 + q 2 C T C. (121)
La méthode reste la même : on augmente q jusqu’à obtenir la robustesse

désirée. Dans tous les cas, l’augmentation de la robustesse se fait au détriment
des performances et un compromis doit être trouvé.
4.5 Commande LQG à temps discret

A l’image de la commande LQG à temps continu, la version à temps
discret consiste en la combinaison d’un filtre de Kalman à temps discret et
d’un retour d’état. La méthode LTR s’applique également.
9. Il s’agit des systèmes possédant des zéros à partie réelle positive.
30
5 Commande H2
Les commandes LQ et LQG peuvent se mettre sous une forme particulière
dite forme standard. Il s’agit alors de synthétiser un correcteur minimisant
une norme sur les signaux de transfert.
5.1 Norme H2
La présentation de la norme H2 reprend celle de [6], §1.2.
5.1.1 Définition
Soit G(s) le système LTI multivariable défini par :

ẋ A B x
= (122)
z C D v
avec D = O (système strictement propre 10 ). On définit la norme matricielle

H2 de ce système par :
s Z
∞
1 H
||G||2 = tr [G (jω)G(jω)] dω (123)
2π −∞
5.1.2 Propriétés
Soit g la réponse impulsionnelle du système. Dans le cas monovariable, le
théorème de Parseval donne une forme équivalente 11 :
Z ∞
2
||G||2 = g T (t)g(t)dt. (124)
0
Dans le cas monovariable, la norme H2 du système est égale à l’énergie de la

réponse impulsionnelle.
Supposons maintenant que v soit un bruit blanc gaussien vérifiant
10. Cette restriction est nécessaire pour que la norme du système soit finie.
11. On rappelle que la fonction de transfert est la transformée de Laplace de la réponse
impulsionnelle.
31
E{v(t)v T (τ )} = Iδ(t − τ ) et calculons la puissance de sortie :
E{z T z} = tr E{zz T }

Z +∞ Z +∞
T T
= tr E g(t − τ1 )v(τ1 )v (τ2 )g (t − τ2 )dτ1 dτ2
−∞ −∞
Z +∞ Z +∞
T
T
= tr g(t − τ1 )E v(τ1 )v (τ2 ) g (t − τ2 )dτ1 dτ2
−∞ −∞
Z +∞
T
= tr g(t − τ )g (t − τ )dτ
−∞
Z +∞
T
= tr g(τ )g (τ )dτ
−∞
Z +∞
tr g T (τ )g(τ ) dτ

=
−∞
Z +∞
1
tr GH (jω)G(jω) dτ

=
2π −∞
= ||G||2
Ainsi, la norme H2 est la puissance de sortie lorsque le système est alimenté

pas un bruit blanc gaussien unitaire.
5.1.3 Calcul
La norme H2 peut être calculée pour tous les systèmes strictement propres
(D = O) et strictement stables. En effet, elle peut s’écrire ainsi :
Z ∞
2
tr g T (t)g(t) dt

||G||2 = (125)
0
Z ∞
B T exp(AT t)C T (C exp(At)B) dt

= tr (126)
0
Z ∞
T T T
= tr B exp(A t)C C exp(At)dtB (127)
0
ou encore :
Z ∞
||G||22 tr g(t)g T (t) dt

= (128)
0
Z ∞
(C exp(At)B) B T exp(AT t)C T dt

= tr (129)
0 Z ∞
T T T
= tr C exp(At)BB exp(A t)dtC (130)
0
32
soit :
||G||22 = tr B T Wo B = tr CWc C T

(131)
où Wo et Wc sont les gramiens de commandabilité et d’observabilité :
Z ∞
Wo = exp(At)BB T exp(AT t)dt (132)
0
Z ∞
Wc = exp(AT t)C T C exp(At)dt (133)
0
12
Ils peuvent être obtenus comme les solutions des équations de Lyapunov
suivantes :
AWc + Wc AT + BB T = 0 (134)
AT Wo + Wo A + C T C = 0 (135)
En effet, partons de :
d
exp(At)BB T exp(AT t) = A exp(At)BB T exp(AT t)+exp(At)BB T exp(AT t)AT .

dt
(136)
En notant que pour un système stable :
lim exp(At) = 0, (137)

t→∞
et en intégrant sur [0, ∞], on obtient directement les deux équations de Lya-
punov. C’est cette méthode qui est utilisée dans les Toolboxes de Matlab
pour le calcul de la norme H2 [11].
5.1.4 Formulation LMI

Les inégalités matricielles affines (LMI pour inégalités matricielles linéaires)
sont devenues un outil classique de l’automatique. Ils sont à la base de nom-
breuses méthodes innovantes et les méthodes classiques ont généralement une
formulation LMI. Une introduction sur les LMI est développée en Annexe B.
Voici la formulation LMI de la norme H2 [20].
12. D’après la théorie de Lyapunov, l’équation AX +X T A+Q = 0 d’inconnue X, avec Q
symétrique définie positive, a une solution positive si A est Hurwitz (ses pôles sont à partie
réelle strictement négative). Alors une solution symétrique peut être facilement obtenue
par la résolution d’un système de n(n + 1) équations linéaires à autant d’inconnues (les
composantes de X), où n est la dimension de A. La résolution de l’équation de Lyapunov
est disponible dans les Toolboxes [11].
33
Soit S0 la solution de l’équation de Lyapunov (134), c’est-à-dire vérifiant :
AS0 + S0 AT + BB T = 0, (138)
avec S0 = S0T ≤ 0. Alors toute matrice S vérifiant :
AS + SAT + BB T < 0 (139)
vérifie aussi S > S0 .
Le système G(s) stable avec D = 0 vérifie ||G||22 < ν si et seulement si il
existe une matrice symétrique positive, :
S > 0, (140)
vérifiant (139) et :
tr CSC T < ν.

(141)
L’ensemble des inégalités (139-141) constitue un système LMI et peut se
résoudre avec les solveurs disponibles [21, 22].
5.2 Problème standard

Soit le système dynamique LTI d’équations d’état :
    
ẋ A B1 B2 x
 z  =  C1 D11 D12   v  (142)
y C2 D21 D22 u
qui peut aussi s’écrire sous forme de fonction de transfert :

z(s) G11 (s) G12 (s) v(s)
= (143)
y(s) G21 (s) G22 (s) u(s)
avec :
G11 (s) = D11 + C1 (sI − A)−1 B1
G12 (s) = D12 + C1 (sI − A)−1 B2
(144)
G21 (s) = D21 + C2 (sI − A)−1 B1
G22 (s) = D22 + C2 (sI − A)−1 B2
On appelle problème standard le problème consistant à trouver la loi de
commande :
u(s) = K(s)y(s) (145)
tel que le transfert Tzv entre v et z, du système bouclé, minimise une norme
matricielle donnée.
En considérant la norme H2 , on parlera de synthèse H2 standard. Une
autre technique populaire repose sur la norme H∞ 13 et fait l’objet d’un
enseignement spécifique de la formation.
13. La norme H∞ d’un système G(s) est le maximum pour ω ∈ [0, ∞] de la plus grande
des valeurs singulières de G(jω).
34
5.3 Equivalence H2 et LQG
Considérons d’abord le cas de la commande LQ avec le critère :
Z ∞
xT Qx + uT Ru dt.

J= (146)
0
Ce critère peut s’écrire :

Z ∞
J= z T (t)z(t)dt. (147)
0
avec :
Q1/2 x
z= (148)
R1/2 u
En utilisant le théorème de Parseval , on obtient :
Z ∞
1
J= Z H (jω)Z(jω)dω. (149)
2π −∞
où Z(s) est la transformée de Laplace de z. En boucle fermée et en absence

de signal exogène, z ne dépend que de la condition initiale et on a Z(s) =
M (s)x0 . On a alors :
Z ∞
1 T H
J = tr x M (jω)M (jω)x0 dω (150)
2π −∞ 0
Z ∞
xT
0 x0
tr M H (jω)M (jω) dω

= (151)
2π −∞
= ||M ||22 x20 (152)
La commande LQ est alors la commande minimisant la norme H2 du transfert

entre x0 et z.
Considérons désormais la commande LQG et posons :
v = Lξ (153)
w = Nη (154)
où ξ et η sont des bruits blancs de variance unitaire. On montre alors que le
correcteur LQG est équivalent au correcteur H2 minimisant le transfert entre
[ξ T η T ]T et z = [xT Q1/2 uT R1/2 ]T [17].
35
6 Forme LQG équivalente
Un correcteur quelconque de même ordre que le processus peut se met-
tre sous la forme d’un correcteur LQG. Cette possibilité, expliquée dans ce
paragraphe, présente plusieurs intérêts. Tout d’abord, cela signifie qu’un cor-
recteur initial obtenu par une autre méthode et que l’on voudrait améliorer
grâce à une synthèse LQG peut servir de point de départ pour le réglage des
pondérations. Ensuite, la méthode LQG a comme intérêt que les états du cor-
recteur sont les estimées des états du système ; ils peuvent donc être utilisés
dans un but de diagnostic ou de supervision. Dans ce cas, il est intéressant
d’implanter le correcteur sous forme LQG quelle que soit la méthode de
synthèse. L’obtention de cette forme LQG équivalente repose sur une pro-
priété particulière de cette forme, donnant lieu à ce qu’on appelle la paramétrisation
de Youla. Des compléments sur la forme LQG équivalente peuvent être
trouvés dans les références [23, 24].
6.1 Paramétrisation de Youla du correcteur LQG

Considérons le système complet composé du processus et de sa commande
LQG avec le signal d’entrée w tel que u = w − Kc x̂ et comme sortie l’erreur
d’estimation de la sortie, également appelée innovation, y = y − ŷ = y − C x̂.
La représentation d’état de ce système bouclé s’écrit :

 ẋ = Ax − BK x̂ + Bw
x̂˙ = LCx + (A − BK − LC)x̂ (155)
y = Cx − C x̂

En utilisant comme vecteur d’état :

x x
= , (156)
x x − x̂
le modèle s’écrit :

 ẋ = (A − BK)x − BKx + Bw
˙x = (A − LC)x (157)
y = Cx

De par sa structure, il apparaı̂t que ce système présente n pôles non observ-

ables (les valeurs propres de A−BK qui sont indépendants du gain d’observa-
tion L) et n pôles non commandables (les valeurs propres de A − LC qui sont
indépendantes du gain de la commande K). Il s’agit là d’une autre expres-
sion du principe de séparation : les pôles du système bouclé sont réglables
36
indépendamment par le gain de la commande et par le gain de l’observa-
teur 14 . Ainsi, aucun mode du système n’est à la fois commandable (par
l’entrée w) et observable (par la sortie y ). Le transfert entre w et y est
donc nul. On peut alors ajouter un transfert N (s) quelconque sans changer
le comportement du système. Ce paramétrage du correcteur par un bouclage
sur un transfert extérieur N (s) est appelé paramétrisation de Youla .
En notant le modèle de N (s) :

ẋN = AN xN + BN y
(158)
w = CN xN + DN y
on peut alors écrire les équations du correcteur :
 x̂˙ = (A − LC − BK − BDN C)x̂ + BCN xN + (L + BDN )y


ẋ = −BN C x̂ + AN xN + BN y (159)
 N
u = −(K + DN C)x̂ + CN xN + DN y
6.2 Calcul des paramètres

Cherchons s’il est possible d’obtenir un correcteur LQG (c’est-à-dire les
gains K et L ainsi que le système N (s)) identique à un correcteur {AK , BK , CK , DK }
quelconque d’ordre n. Pour que les correcteurs soient de même ordre, N (s)
doit être statique, c’est-à-dire que seul DN est non nul parmi les matrices
d’état de N (s). Le modèle du correcteur LQG s’écrit alors :
x̂˙ = (A − LC − BK − BDN C)x̂ + (L + BDN )y

(160)
u = −(K + DN C)x̂ + DN y
Les deux correcteurs sont identiques du point de vue entrée/sortie s’il existe
un changement d’état T :
xK = T x̂ (161)
tel que
T −1 AK T = A − LC − BK − BDN C (162)
T −1 BK = L + BDN (163)
CK T = −K − DN C (164)
DK = DN (165)
14. Afin de mieux visualiser ce résultat, le lecteur est invité à représenter graphiquement
le système d’équations (157)
37
ce qui s’écrit :
DN = DK (166)
K = −CK T − DK C (167)
L = T −1 BK − BDK (168)
0 = −T BCK T − T (A − BDK C) + AK T + BK C (169)
La dernière équation est une équation algébrique de Riccati non symétrique

(GNARE pour Generalized Non-symetric Algebraic Riccati Equation) et
peut se mettre sous la forme hamiltonienne :

A + BDK C BCK I
[−T I] = 0. (170)
BK C AK T
Pour la résolution, cf. [24]. Une fois T déterminé, les matrices K, L et DN

peuvent être calculées.
6.3 Application à l’interpolation de correcteurs

Une application de ces techniques est la synthèse de correcteurs à gains
séquencés (gain scheduling en anglais) à partir d’interpolation de correcteurs
LTI. Imaginez que le comportement du système à asservir varie en fonction
d’une variable Θ dite variable de séquencement. Pour différentes valeurs con-
stantes Θk de Θ, le comportement de votre système est linéaire et connu
(par des lois de la physique ou par identification). On peut alors synthétiser
une batterie de correcteurs LTI Kk (s) valables pour les différents points de
fonctionnement. La question est maintenant de déterminer un correcteur val-
able pour toute la plage de fonctionnement par interpolation des correcteurs
Kk (s). Ce correcteur dépendra bien sûr de Θ et on peut le noter KΘ (s).
La question de l’interpolation de deux modèles n’est pas triviale. Bien en-
tendu, l’idée d’interpoler directement les matrices de la représentation d’état
n’a pas beaucoup de sens si rien n’est fait pour que les variables d’état aient
le même sens physique. En utilisant une représentation d’état particulière,
la représentation équilibrée (balanced en anglais), le résultat n’est pas non
plus satisfaisant. En effet, on observe que les pôles n’évoluent pas de manière
régulière entre deux points d’interpolation, même proches [25].
Une des méthodes présentes dans la littérature et qui donne de bons
résultats consiste à interpoler les gains d’observation et de commande de
la représentation LQG équivalente, établie à partir du modèle nominal du
processus. Dans le cas où le correcteur est d’ordre supérieur au système (c’est
généralement le cas des commandes H∞ ), on détermine tout d’abord une
38
représentation d’état augmentée du modèle nominal du processus en ajoutant
des états non commandables ou non observables afin de garder un paramètre
de Youla statique.
39
Annexes
40
A Optimisation et calcul des variations
A.1 Optimisation
A.1.1 Notations
Soit un vecteur x dans Rn de variables de désision et soit un critère J(x)
à valeur dans R définie sur E ⊂ Rn .
On note ∇J (x) = dJ dx
(x) le gradient de la fonction de J. Il s’agit d’une
n n ∂J
fonction de R vers R . La k ème composante de ∇J (x) s’écrit ∂x k
(x).
d2 J
On note HJ (x) = dx2 (x) le Hessien de la fonction de J. Il s’agit d’une
2J
fonction de Rn vers Rn×n . La composante (k, l) de HJ (x) s’écrit ∂x∂k ∂x l
(x).
A.1.2 Définitions
Définition 1 (Minimum global)
La fonction J présente un mimimum global en x0 ∈ E si J(x) > J(x0 ) ∀x 6=
x0 .
Définition 2 (Minimum local)

La fonction J présente un mimimum local en x0 ∈ E s’il existe un voisinage
V de x0 tel que J(x) > J(x0 ) ∀x ∈ V \x 6= x0 .
A.1.3 Optimisation sans contrainte

Lemme 1 (Condition du premier ordre d’existence d’un extremum)
dJ
Si le critère J présente un extrémum en x0 , alors on a dx
(x0 ) = 0.
Cette condition du premier ordre n’est pas suffisante car la connaissance

des dérivées d’ordre supérieur sont nécessaires pour conclure à la présence
d’un extrémum et à la détermination du type d’extrémum (minimum ou
maximum).
Lemme 2 (Condition suffisante d’existence d’un extremum)

2
Si dJ
dx
(x0 ) = 0 et si ddxJ2 (x0 ) > 0 15 , alors le critère J présente un minimum
en x0 .
2
Si dJdx
(x0 ) = 0 et si ddxJ2 (x0 ) < 0, alors le critère J présente un minimum
en x0 .
15. Cette inégalité doit être lue au sens des inégalités matricielles, c’est-à-dire que le
Hessien doit être défini positif, ce qui revient aussi à dire que ses valeurs propres sont
toutes strictement positives.
41
Dans l’hypothèse où les conditions précédentes ne seraient pas satisfaites,
il faut étudier les conditions d’ordre supérieures. On est en présence d’un
extrémum si la première dérivée non nulle est d’ordre pair 16 .
A.1.4 Optimisation avec contrainte

Intéressons nous désormais à la minimisation de J(x) sous la contrainte
φ(x) = Op×1 . La recherche du minimum se fait par l’introduction d’un vecteur
˜ λ) =
de Rp appelé Lagrangien et par l’introduction d’un critère modifié J(x,
T
J(x) + λ φ(x).
Lemme 3 (Condition du premier ordre d’existence d’un extremum)

Pour que x0 soit solution du problème d’extréma sous contrainte ci-dessus, il
faut qu’il existe un Lagrangien λ0 qui satisfasse les conditions suivantes :
∂ J˜
(x0 , λ0 ) = On×1 (171)
∂x
∂ J˜
(x0 , λ0 ) = Op×1 (172)
∂λ
Exercice 1 (Minimisation sous contrainte)
Pour x ∈ R2 , on considère le critère J(x) = xT x et la contrainte px = 1 où
p = 1 1 . Touvez la solution du problème de minimisation sous contrainte.
A.2 Calcul des variations

A.2.1 Problématique
Le calcul des variations est à la base des méthodes de la commande op-
timale. Dans ce paragraphe, nous nous contentons de donner un exemple
introductif. Dans ce cas, l’inconnue n’est plus un scalaire ni un vecteur, mais
une fonction. Autrement dit, la solution du problème est cherchée dans un
espace de dimension infinie.
On cherche une fonction y(x) minimisant une intégrale de la forme :
Z b
J(y) = φ(y(x), ẏ(x), x)dx.
a
Notant y ∗ (x) la fonction optimale qui doit vérifier :
J(y) ≥ J(y ∗ ) ∀y (173)

16. En effet, les fonctions polynomiales xk possèdent un minimum en 0 pour k pair mais
pas pour k impair.
42
L’argument de J est une fonction ; on qualifie souvent J de fonctionnelle,
c’est-à-dire de fonction de fonction.
En notant δy une petite variation de la fonction y, et δ ẏ la variation de
sa dérivée correspondante, on a :
Z b
∂φ ∂φ
J(y + δy) ' φ(y, ẏ, x) + (y, ẏ, x)δy(x) + (y, ẏ, x)δ ẏ(x) dx
a ∂y ∂ ẏ
Z b
∂φ ∂φ
' J(y) + (y, ẏ, x)δy(x) + (y, ẏ, x)δ ẏ(x) dx (174)
a ∂y ∂ ẏ
∂φ ∂φ
Pour la trajectoire optimale, il faut que ∂y
(y, ẏ, x)δy(x) + ∂ ẏ
(y, ẏ, x)δ ẏ(x)
soit nul tout au long de la trajectoire.
A.2.2 Équation d’Euler-Lagrange

La condition du premier ordre est donnée par la condition d’Euler-Lagrange.
Lemme 4 (Équation d’Euler-Lagrange)
La fonction optimale y(x) vérifie l’équation suivante :

∂φ d ∂φ
− =0 (175)
∂y dx ∂ ẏ
Dans le cas où φ ne dépend pas explicitement de x, la formule d’Euler-
Lagrange se reformule de la manière suivante :
Lemme 5 (Formule de Beltrami)
La fonction optimale y(x) vérifie l’équation suivante :
∂φ
φ − ẏ =k (176)
∂ ẏ
où k est une constance.
Démonstration 1
La formule d’Euler-Lagrange se réécrit :
∂φ ∂ 2φ ∂ 2φ
− ẏ − 2 ÿ = 0 (177)
∂y ∂y∂ ẏ ∂ ẏ
En calculant la dérivée par rapport à x de φ − ẏ ∂φ∂ ẏ
, on obtient après deux
lignes de calcul :
∂ 2φ ∂ 2φ

d ∂φ ∂φ
φ − ẏ = ẏ − ẏ − ÿ 2 (178)
dx ∂ ẏ ∂y ∂y∂ ẏ ∂ ẏ
= 0 (179)
43
A.2.3 Prise en compte des conditions initiales et finales
Les conditions initiales et finales peuvent être libres où imposées. On peut
imposer l’instant et/ou la valeurs de la fonction y. Considérons un critère
intégrant éventuellement une pénalité sur les conditions initiales et finales,
de la forme :
Z b
J= φ(y(x), ẏ(x), x)dx + ψ(a, b, y(a), y(b)) (180)
a
Les conditions correspondantes, appelées conditions de transversalité, s’écrivent :

∂φ ∂ψ ∂φ ∂ψ
(a) − δx(a) + φ(a) − (a)ẏ(a) − δa = 0 (181)
∂ ẏ ∂y(a) ∂ ẏ ∂a

∂φ ∂ψ ∂φ ∂ψ
(b) + δx(b) + φ(b) − (b)ẏ(b) + δb = 0 (182)
∂ ẏ ∂y(b) ∂ ẏ ∂b
où φ(a) = φ(y(a), ẏ(a), a) et φ(b) = φ(y(b), ẏ(b), b), pour alléger l’écriture.
Exercice 2 (Trajecoire optimale)

Rb
Déterminez la trajectoire y(x) optimale minimisant le critère a (xẏ(x) +
ẏ 2 (x))dt avec a = 0, y(a) = 1, y(b) = 5 et b libre.
A.2.4 Prise en compte de contraintes

Considérons le cas d’une minimisation du critère (180) avec les contraintes
suivantes : Rb
– contrainte intégrale a r(y, ẏ, x)dx = 0, r() ∈ Rr
– contrainte intantanée s(y, ẏ, x) = 0, s() ∈ Rs
La résolution se fait en introduisant les multiplieurs de Lagrange λ ∈ Rr
et µ(x) ∈ Rs et en substituant à la fonction φ le Hamiltonien :
H(y, ẏ, x, λ, µ) = φ(y, ẏ, x) + λT r(y, ẏ, x) + µT (x)s(y, ẏ, x).
L’équation d’Euler-Lagrange est inchangée :

∂H d ∂H
− =0 (183)
∂y dx ∂ ẏ
Problème de Didon. Ce problème bien connu 17 est lié à la fondation de

Carthage 18 . Didon se trouvait devant le problème de maximiser l’aire de la
cité entourée par les remparts pour une longueur de rempart donnée.
17. Voir par exemple sur http://serge.mehl.free.fr/anx/cv_didon.html.
18. http://serge.mehl.free.fr/anx/pb_didon.html
44
Figure 3 – Problème de Didon??
Mathématiquement, en partant de la figure 3, on peut se ramener à

deux variables (x, y) et considérer y comme fonction de x à déterminer.
R x=b
Il s’agit de maximiser la surface x=a y(x)dx tout en gardant le périmètre
R x=b p
x=a
1 + ẏ 2 (x)dx égal à L.
p
On note H(y, ẏ, λ) = y + λ 1 + ẏ 2 le Lagrangien. Comme il ne dépend
pas explicitement de x, on peut utiliser la formule de Beltrami, ce qui donne
p 2
y −λ 1 + ẏ + √ ẏ 2 = k. Cette relation se réécrit sous la forme (y −k)2 (1+
2 λ
1+ẏ
ẏ 2 ) = λ2 . Il s’agit désormais de montrer que la courbe est un cercle et de
dy
caractériser ce cercle. En posant Y = y − k et en remplaçant ẏ par dx , on
dy 2 λ2 Y

obtient 1 + dx = Y 2 , ce qui donne √λ2 −Y 2 dY = ±dx. En primitivant,
√
on obtient λ2 − Y 2 = x − c où c est une constante d’intégration ; le signe
positif est nécessaire pour que l’équation soir définie sur [a, b]. L’équation
s’écrit alors (y −k)2 +(x−c)2 = λ2 , ce qui est l’équation d’un cercle de centre
d’abscisse c et d’ordonnée k qui peuvent être obtenus par des considérations
géométriques.
Problème du brachistochrone. Soit un plan vertical de repère (0, x, y)

où x est l’axe horizontal et y est l’axe vertival ascendant. Le problème du
brachistochrone 19 , étudié et nommé par Jean Bernouilli, consiste à déterminer
la trajectoire permettant à une bille posée en (0, h) d’atteindre la position
finale (l, 0) le plus rapidement possible. L’inconnue étant la courbe y(x).
Exercice 3 (Brachistochrone)
Pour une trajectoire de la bille (x(t), y(t)) débutant en (0, 0) avec une vitesse
nulle et terminant en un point précis (l, −h), on se propose de vous guider
vers l’obtention de la trajectoire optimale :
19. Voir http://fr.wikipedia.org/wiki/Courbe_brachistochrone.
45
1. Montrez √ que le module de la vitesse de la bille en un point (x, y) est
égal à −2gy.
2. Calculez l’expression de la vitesse de progression selon x en fonction de
l’altitude y et de la dérivée y 0 = dy/dx de l’altitude.
3. Montrez que le temps ∆t mis par la bille pour parcourir l’ensemble du
trajet s’écrit :
Z x=l s
1 + y 02 (x)
∆t = dx (184)
x=0 −2gy(x)
4. A partir de l’équation de Beltrami, montrez que la solution optimale
vérifie une équation différentielle de la forme :
(1 + y 02 (x)) y(x) = k (185)
5. Par un changement de variable y 0 (x) = −cotan(φ/2), montrez que la

solution est de la forme :
x(θ) = a + b(θ − sin(θ)) (186)

y(θ) = c + d(θ − cos(θ)) (187)
6. Déterminez la constante et tracez l’allure de la solution. Vous pourrez

prendre comme application numérique l = 1 et h = 0, 4.
46
B Systèmes linéaires multivariables
Récapitulons les résultats fondamentaux concernant les systèmes multi-
variables linéaires, tout d’abord à temps invariant (LTI) puis à temps variant
(LTV).
B.1 Généralités
Soit le système LTI défini par :

ẋ = Ax + Bu
(188)
y = Cx + Du
où A ∈ Rn×n , B ∈ Rn×m , C ∈ Rp×n et D ∈ Rp×m . La fonction de transfert

de ce système s’écrit :
H(s) = D + C(sIn − A)−1 B. (189)
où H(s) ∈ Rp×m . Elle est invariante par changement d’état x̂ = P x où
P ∈ Rn×n est inversible. Le système sera indifféremment représenté par sa
fonction de transfert ou par sa représentation d’état.
B.2 Pôles
On appelle pôles du système les pôles de la fonction de transfert qui sont
(par définition) aussi les valeurs propres de A. Ces pôles sont invariants par
changement d’état.
Le système est stable si ses pôles sont à parties réelles strictement négatives.
La matrice A d’un tel système est dit Hurwitz.
B.3 Commandabilité et observabilité

Un système est dit gouvernable s’il existe un retour d’état qui le stabilise ;
c’est-à-dire qu’il existe K ∈ Rm×n tel que A−BK soit Hurwitz. Puisque cette
propriété ne concerne que les matrices A et B, on dit que la paire {A, B} est
gouvernable.
Un système est dit commandable si on peut imposer arbitrairement les
pôles du système bouclé par un retour d’état, c’est-à-dire les pôles de A −
BK. La commandabilité est une condition plus forte que la gouvernabilité.
La commandabilité d’un système correspond à la stabilisabilité des modes
instables. La paire {A, B} est commandable si la matrice de commandabilité :
B AB . . . An−1 B

(190)
47
est de rang n.
Un système est dit détectable s’il existe un observateur d’état stable ; c’est-
à-dire s’il existe L ∈ Rn×p tel que A − LC soit Hurwitz. On dit que la paire
{A, C} est détectable.
Un système est dit observable si on peut imposer arbitrairement les pôles
de son observateur d’état, c’est-à-dire les pôles de A−LC. L’observabilité est
une condition plus forte que la détectabilité. La paire {A, C} est observable
si la matrice d’observabilité :
 
C
 CA 
(191)
 
 .. 
 . 
CAn−1
est de rang n.
Les propriétés de commandabilité et d’observabilité sont duales. Ainsi,
{A, C} est observable si et seulement si {AT , C T } est commandable. Il en est
de même pour la gouvernabilité et la détectabilité.
B.4 Système linéaire à temps variant

B.4.1 Modèle LTV
Soit le système LTV défini par :

ẋ = A(t)x + B(t)u
(192)
y = C(t)x + D(t)u
Sa matrice de transition Φ(t, t0 ) est définie par :

d
dt
Φ(t, t0 ) = A(t)Φ(t, t0 ),
(193)
Φ(t0 , t0 ) = In ,
où In est la matrice unité d’ordre n. La trajectoire de l’état s’écrit alors :

Z t
x = Φ(t, t0 )x0 + Φ−1 (τ, t)B(τ )u(τ )dτ (194)
t0
où x0 = x(t0 ). L’écriture de x sous cette forme a le mérite de faire ap-

paraı̂tre deux termes : l’un issu de la condition initiale et l’autre du sig-
nal de commande. Dans le cas d’un système LTI, la matrice de transi-
tion s’écrit Φ(t0 , t) = exp(A(t − t0 )). Une propriété intéressante est que
Φ(t, t0 ) = Φ−1 (t0 , t).
48
B.4.2 Observabilité
De manière générale, un système non linéaire est observable si on peut
déterminer son état initial à partir de l’enregistrement de sa sortie sur un
certain horizon. Une fois connu l’état initial, la trajectoire peut alors être
entièrement reconstruite à partir du modèle.
Supposons pour simplifier les calculs que l’entrée est nulle (u = 0) ; le
signal de sortie s’écrit y(τ ) = CΦ(τ, t0 )x0 . Multiplions cette relation à gauche
par ΦT (τ, t0 )C T et intégrons sur [t0 , t1 ], on obtient alors :
Z t1 Z t1
T T
Φ (τ, t0 )C y(τ )dτ = ΦT (τ, t0 )C T CΦ(τ, t0 )dτ x0 . (195)
t0 t0
| {z }
Wo (t0 ,t1 )
La condition initiale x0 est alors obtenue en multipliant à gauche par Wo (t0 , t1 )−1 .
Le système est donc observable si le gramien d’observabilité Wo (t0 , t1 ) est
défini 20 (non singulier) [26]. L’observabilité peut dépendre de la trajectoire
de l’état, celle-ci dépendant du signal d’entrée ; un signal d’entrée rendant le
système observable est dit entrée universelle.
B.4.3 Commandabilité
De manière générale, un système est dit (complètement) commandable si,
à partir d’une condition initiale x0 = x(t0 ), on peut trouver une commande
u permettant d’atteindre tout état final arbitraire xf = x(tf ) avec tf > t0 .
Remarquons que cette notion de commandabilité est équivalente à la possi-
bilité de suivre une trajectoire quelconque pour l’état, à condition toutefois
que cette trajectoire soit suffisamment régulière.
Le système LTV (192) est commandable sur l’horizon [t0 , tf ] si et seule-
ment si son gramien de commandabilité :
Z tf
Wc (t0 , tf ) = Φ−1 (t0 , τ )BB T Φ−T (t0 , τ )dτ (196)
t0
est défini.
Le caractère suffisant de cette condition se montre en considérant la com-
mande :
u = B T (t)Φ−T (t0 , t)Wc−1 (t0 , tf ) xf − Φ−1 (t0 , tf )x0

(197)
20. Toutes les valeurs propres de Wo (t0 , t1 ) sont réelles et positives puisque qu’elle est
symétrique.
49
C Analyse des systèmes asservis multivari-
ables
C.1 Position du problème
Considérons un processus linéaire multivariable y = G(s)u asservi par
un correcteur K(s), avec nu entrées et ny sorties. En tenant compte de la
consigne r et d’une perturbation d en entrée du processus, les équations
s’écrivent :
u = K(s)(r − y) (198)
y = G(s)(u + d) (199)
En notant Sy (s) = (Iny + K(s)G(s))−1 la sensibilité en sortie et Su (s) =

(Inu +G(s)K(s))−1 la sensibilité en entrée, on obtient les transferts en boucle
fermés suivants :
= Sy (s)r − Sy (s)G(s)d (200)

u = K(s)Sy (s)r − K(s)Sy (s)G(s)d (201)
= Su (s)K(s)r − Su (s)K(s)G(s)d (202)
y = Sy (s)G(s)K(s)r + Sy (s)G(s)d (203)
(204)
où = r − y est l’erreur de régulation.

Les objectifs de ce schéma général d’asservissement sont les suivants :
– stabilité,
– robustesse,
– un bon suivi de trajectoire,
– un bon rejet des perturbations.
Voici comment les évaluer à partir de la représentation fréquentielle des trans-
ferts en boucle fermée.
Les outils classiques de l’automatique monovariable (lieu de Bode, de
Black et de Nyquist) ne sont pas directement utilisables en multivariable.
Les outils présentés s’appuient sur le tracé des valeurs singulières, extension
de la notion de gain.
C.2 Valeur singulière

Définition 3 Les valeurs singulières d’une matrice complexe M sont les
racines carrées des valeurs propres de M H M où M H est le hermitien (trans-
posé conjugué) de M . On les note σi (M ).
50
Propriété 1 (Propriétés générales)
– Les valeurs singulières sont des nombres réels positifs.
– Les valeurs singulières non nulles de M sont identiques à celles de M H
(invariance par l’opération transposé/conjugué)
– Les valeurs singulières non nulles sont au plus au nombre de min(nu , ny ),
la plus petite dimension de M .
Propriété 2 (Norme matricielle) La valeur singulière maximale σ(M )

est une norme matricielle. Les propriétés générales des normes s’appliquent
donc.
– σ(λM ) = |λ|σ(M )
– σ(M + N ) ≤ σ(M ) + σ(N )
– σ(M N ) ≤ σ(M )σ(N )
Propriété 3 (Inversion de matrice) M est inversible si et seulement si

sa plus petite valeur singulière est non nulle (σ(M ) > 0). Alors, σ(M ) =
1
σ(M −1 )
et σ(M ) = σ(M1−1 ) .
On en déduit les propriétés suivantes :
Propriété 4 – σ(λM ) = |λ|σ(M )

– σ(M + N ) ≥ σ(M ) + σ(N )
– σ(M )σ(N ) ≤ σ(M N )
Propriété 5 (Interprétation) La norme σ est la norme induite sur les

matrices par la norme euclidienne des vecteurs :
||M z||2
σ(M ) = max
z6=0 ||z||2
zH M H M z
σ 2 (M ) = max (205)
z6=0 zH z
Ainsi, la norme σ est l’amplification maximale du système de transfert M .
C.3 Tracé des valeurs singulières

Pour un transfert dynamique multivariable M (s), la représentation fréquentielle
consiste en le tracé des valeurs singulières de M (jω) en fonction de ω sur
[0, ∞]. L’échelle logarithmique est généralement choisie pour les abscisses et
les ordonnées. Ce tracé généralise celui du gain aux systèmes multivariables.
51
Définition 4 (Norme H∞ ) La norme H∞ de M (s), notée ||M ||∞ est la
borne supérieure des valeurs singulières maximales de M (jω) lorsque ω varie
sur [0, ∞] :
||M ||∞ = sup σ(M (jω)) (206)
ω∈[0,∞]
Définition 5 (Norme L2 sur les signaux) Soit z un signal à valeur réelle

ou complexe sur [0, ∞] ; on note ||z||2 sa norme L2 définie par :
Z ∞
||z||2 = z H (t)z(t)dt (207)
0
Propriété 6 (Interprétation de la norme H∞ ) La norme H∞ est la norme

induite sur les systèmes par la norme L2 sur les signaux :
||M (s)z||2
||M (s)||∞ = max (208)
z6=0 ||z||2
Ainsi, la norme ||M (s)||∞ est l’amplification maximale.
Des critères de stabilité, robustesse, qualité du suivi de trajectoire et
qualité du rejet de perturbation peuvent s’évaluer à partir des représentations
fréquentielles de certains transferts du système bouclé. Cela fait l’objet des
paragraphes suivants. Pour obtenir les valeurs singulières d’un systèmes dy-
namique, vous pouvez utiliser sous Matlab la fonction sigma de la Control
System Toolbox ou la fonction vsvd de la µ-Analysis and Synthesis Toolbox.
C.4 Stabilité
La stabilité est évaluable à partir du lieu des pôles (tous les pôles de la
boucle fermée doivent être à partie réelle strictement positive), ce qui s’évalue
en multivariable de la même manière qu’en monovariable. Cependant, on sait
que la stabilité ne suffit pas et que des marges sont nécessaires. La marge
de module est définie en monovariable comme la distance minimale au point
−1 du transfert complexe en boucle ouverte, ce qui s’écrit avec les notations
utilisées :
∆M = min |1 + K(jω)G(jω)|. (209)
ω
En notant que :
min |1 + K(jω)G(jω)| = max |(1 + K(jω)G(jω))−1 |, (210)
ω ω
on définit en multivariable la marge de module en sortie :

1
∆M = , (211)
||Sy (s)||∞
52
et la marge de module en entrée :
1
∆M = . (212)
||Su (s)||∞
C.5 Suivi de consigne

Afin d’avoir un bon comportement en suivi de consigne, il faut que le
transfert entre la référence et l’erreur soit de type coupe-bas (ou passe-haut).
On pourra alors tracer la représentation fréquentielle de Sy (s) et relever la
bande passante à -3 dB ainsi que l’atténuation maximale (en continu).
C.6 Rejet de perturbation

Afin d’avoir un bon comportement en rejet de perturbation, il faut que le
transfert entre la perturbation et l’erreur soit le plus faible possible notam-
ment en basse fréquence. Ce transfert est généralement de type passe-bande.
On pourra alors tracer la représentation fréquentielle de Sy (s)G(s) et relever
l’atténuation maximale (en continu) ainsi que l’amplification maximale en
précisant la fréquence.
C.7 Robustesse
Les systèmes dynamiques physiques sont généralement de type passe-
bande et on dont un gain qui diminue en haute fréquence. Il en résulte
donc qu’au-delà d’une certaine bande de fréquences, ces dynamiques sont
nécessairement mal connues. Ainsi, une des sources classique de manque de
robustesse des systèmes asservis correspond à des amplifications de modes
hautes fréquence mal connus, entraı̂nant ainsi des instabilités. Afin de palier
ce problème, il convient de s’assurer que le gain du correcteur décroı̂t au-
delà de la bande passante. Une manière détournée de s’en assurer consiste à
considérer la réponse fréquentielle du transfert Su (s)K(s) ou K(s)Sy (s) du
transfert entre r et u.
53
D Inégalités matricielles affines
Les Inégalités Matricielles Affines ou LMI prennent une place de plus
importante dans les méthodes modernes de l’automatique. De nombreux
résultats antérieurs trouvent une formulation LMI et ce formaliste permet
aussi de résoudre de nouveaux problèmes qui n’avaient pas trouvé jusqu’alors
de solution.
D.1 Positivité
Définition 6 (Matrice positive) Une matrice A ∈ Rn est dite (semi-
définie) positive et on note A ≥ 0 si la forme quadratique xT Ax est positive
pour tout vecteur x.
Cette définition se transpose évidemment au cas négatif. On peut tou-

jours écrire une forme quadratique à partir d’une matrice symétrique. Ainsi,
xT Ax = 21 xT (AT +A)x. On ne contentera donc de considérer le cas des matri-
ces symétriques. Ces matrices ont la particularité d’avoir toutes leurs valeurs
propres réelles.
Propriété 7 (Matrice négative) Une matrice A symétrique est négative

si et seulement toutes ses valeurs propres sont négatives et on note A ≤ 0.
On définit aussi la positivité stricte et on dit qu’une matrice est définie

positive si toutes ses valeurs propres sont strictement positives. C’est équivalent
à dire que la forme quadratique correspondante xT Ax est strictement positive
pour tout x non nul.
Propriété 8 – Soit λ un scalaire, A − λI > 0 ⇐⇒ λi (A) > λ.

– P > 0 ⇔ −P < 0 ; on peut donc toujours se ramener à un problème
de positivité (ou de négativité).
D.2 Inégalité matricielle affine ou linéaire

Définition 7 (Inégalité Matricielle Affine) On appelle inégalité matricielle
affine (ou linéaire et en anglais linear matrix inequality noté LMI) le problème
suivant ; étant données les matrices réelles, carrées et symétriques Mk , k =
1..n, trouver les réels xk , k = 1...n tels que M (x) = M0 +x1 M1 +...+xn Mn >
0.
Le succès des LMI vient du développement des méthodes dites du point

intérieur (interior point methods) qui permettent de résoudre de manière
efficace ces problèmes [21].
54
Propriété 9 Un système de plusieurs LMI est une LMI. En effet :

P (x) > 0 P (x) 0
⇔ >0 (213)
Q(x) > 0 0 Q(x)
D.3 Exemple de LMI

Les LMI ne se présentent pas directement sous la forme de l’inégalité
présentée ci-dessus. Prenons un exemple classique de l’automatique ; la sta-
bilité au sens de Lyapunov pour un système linéaire ẋ = Ax. Il s’agit de
trouver une matrice réelle P = P T > 0 de même dimension que A telle que
AT P + P A < 0. Considérons à titre d’exemple, le cas où A est une matrice
2 × 2.
a1 a2
A= (214)
a3 a4
La matrice P dépend alors de 3 paramètres xi , k = 1..3 et peut s’écrire :

x1 x2
P = (215)
x2 x3
La condition de positivité de P s’écrit :

1 0 0 1 0 0
x1 + x2 + x3 >0 (216)
0 0 1 0 0 1
L’inégalité de Lyapunov, elle se réécrit :

2a1 a2 a2 + a3 a1 + a4 0 a2
x1 + x2 + x3 <0 (217)
a3 0 a1 + a4 a2 + a3 a3 2a4
D.4 Résolution
Afin de rendre les solveurs de LMI facilement utilisables pour les problèmes
de l’automatique, des interfaces ont été développées permettant d’écrire les
problème sous des formes matricielles simples. On peut citer LMI-Tools de El
Ghaoui 21 , la LMI Control Toolbox de MathWorks [22] et l’interface SeDuMi
développé au LAAS par Peaucelle et al. [27]. On pourra également utiliser
l’outil YALMIP 22 .
Les trois problèmes classiques que ces outils résolvent sont
– la faisabilité (ou existence) : trouver x solution de A(x) < 0,
21. http ://robotics.eecs.berkeley.edu/˜ elghaoui/
22. http ://control.ee.ethz.ch/˜ joloef/yalmip.php
55
– la minimisation d’une fonction linéaire ; trouver x minimisant cT x sous
la contrainte A(x) < 0,
– le problème de valeur propre généralisée : minimiser λ sous les con-
traintes A(x) < λB(x), B(x) > 0 et C(x) < 0.
Références
[1] A. P. Sage and C. C. White, Optimum Systems Control, Prentice Hall,
1977.
[2] B. D. O. Anderson and J. B. Moore, Optimal Control - Linear Quadratic
Methods, Prentice Hall, 1989.
[3] E. Ostertag, Commande et Estimation Multivariables, TechnoSup, El-
lipses, Paris, 2006.
[4] L. Pontriaguine, V. Boltianski, G. Gamkrelidze, and E. Michtchenko,
Théorie Mathématique des Processus Optimaux, Moscou : Mir, 1974.
[5] H. Bourles, Optimisation et Commande Optimale, École Normale
Supérieure de Cachan, 1996.
[6] G. Duc, Robustesse des Systèmes Linéaires Multivariables, École
Supérieure d’Électricité, 1994.
[7] N. A. Lehtomaki, N. R. Sandell, and M. Athans, “Robustness results
in linear quadratic gaussian based multivariable control design,” IEEE
Trans. Autom. Control.
[8] E. Ostertag, Filtrage Optimal et Commande Optimale, École Supérieure
de Physique de Strasbourg, 2002.
[9] G. F. Franklin, J. D. Powell, and M. L. Workman, Digital Control of
Dynamic Systems, Addison-Wesley, 1990.
[10] W. F. Arnold and A. J. Laub, “Generalized eigenproblem algorithms
and software for algebraic riccati equations,” Proceedings of the IEEE,
vol. 72, pp. 1746–1754, 1984.
[11] The MathWorks Inc., Getting Started with the Control System Toolbox,
2000-2002.
[12] W. Bachta, P. Renaud, E. Laroche, A. Forgiona, and J Gangloff, “Mo-
tion prediction for computer-assisted beating heart surgery,” IEEE
Transactions on Biomedical Engineering, 2009.
[13] M. H. A. Davis, Linear Estimation and Stochastic Control, Chapman
and Hall, 1977.
56
[14] J. C. Doyle and G. Stein, “Robustness with observers,” IEEE Trans.
Autom. Control.
[15] J. C. Doyle and G. Stein, “Multivariable feedback design : Concepts for
a classical/modern synthesis,” IEEE Trans. Autom. Control, vol. 26,
no. 1, 1981.
[16] J. B. Moore and L. Xia, “Loop recovery and robust state estimate
feedback design,” IEEE Transactions on Automatic Control, vol. 32,
no. 6, 1987.
[17] G. Stein and M. Athans, “The LQG/LTR procedure for multivariable
feedback control design,” IEEE Trans. Autom. Control, vol. 32, no. 2,
1987.
[18] J. D. Birdwell and A. J. Laub, “Balanced singular values for lqg/ltr
design,” International Journal of Control, vol. 45, no. 3, 1987.
[19] Z. Zhang and J. Freudenberg, “Loop transfert recovery for nonminimal
phase plants,” IEEE Transactions on Automatic Control, vol. 35, no. 5,
1990.
[20] C. Scherer, P. Gahinet, and M. Chilali, “Multi-objective output-feedback
control via LMI optimization,” IEEE Trans. Autom. Control, vol. 42,
no. 7, pp. 896–911, 1997.
[21] Y. Nesterov and A. Nemirovski, Interior-point Polynomial Methods in
Convex Programming, SIAM, 1994.
[22] P. Gahinet, A. Nemirovski, A. J. Laub, and M. Chilali, LMI Control
Toolbox, The MathWorks Inc., 1995.
[23] D. Alazard and P. Apkarian, “Exact observer-based structures for ar-
bitrary compensators,” International Journal of Robust and Nonlinear
Control, vol. 9, pp. 101–118, 1999.
[24] D. Alazard, C. Cumer, P. Apkarian, M. Gauvrit, and G. Ferrères, Ro-
bustesse et Commande Optimale, Cépaduès Éditions, 1999.
[25] M. Berriri, “Commande LPV d’un système d’entraı̂nement de bande
flexible,” 2004.
[26] G. Bornard, F. Celle-Couenne, and G. Gilles, Observation, Observabilité,
vol. 1, chapter 5, pp. 177–221, Masson, Paris, 1993, in A.J. Fossard and
D. Normand-Cyrot, Systèmes non-linéaires.
[27] D. Peaucelle, D. Henrion, Y. Labit, and K. Taitz,
User’s guide for SeDuMi interface, LAAS - CNRS,
http ://www.laas.fr/˜peaucell/SeDuMiInt.html, 2002.
57

Com Opti

Transféré par

Droits d'auteur :

Formats disponibles

Com Opti

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Com Opti

Transféré par

Droits d'auteur :

Formats disponibles

ECOLE NATIONALE SUPERIEURE POLYTECHNIQUE DE DOUALA

Master Images, Robotique et Ingénierie pour le Vivant

3 Commande Linéaire Quadratique 11

4 Commande Linéaire Quadratique Gaussienne 27

6 Forme LQG équivalente 36

A Optimisation et calcul des variations 41

B Systèmes linéaires multivariables 47

C Analyse des systèmes asservis multivariables 50

On s’intéressera dans une première partie (§2) à la commande optimale

2.1 Position du problème

et de condition initiale x(t0 ) = x0 , où t ∈ R, u ∈ Rm et x ∈ Rn . Les

avec xf = x(tf ). Les fonctions θ et φ ainsi que les instants t0 et tf étant

ũ = min J(x0 , t0 , u) (6)

2.2 Principe d’optimalité de Bellman

La trajectoire optimale sur [t0 , tf ] est ũ et le critère optimal :

Soit t1 ∈ [t0 , tf ]. Le principe d’optimalité de Bellman énonce que la trajectoire

Bien que les développements suivants ne s’appuient pas directement sur

On définit l’hamiltonien du système :

H(x, u, p, t) = φ(x, u, t) + pT f (x, u, t) (12)

où p est appelé état-adjoint 1 . Le principe du minimum de Pontriaguine

Enfin, selon la nature du problème, on aura encore certaines relations addi-

Lien avec le calcul des variations

où θ̃(x0 , t0 , xf , tf ) = θ(xf , tf ) − pT T

On considère un système dont on commande la vitesse, l’équation d’état du

L’hamiltonien s’écrit alors :

H(q, q̇) = L(q, q̇) + pT q̇ (19)

et le principe du minimum donne les deux équations suivantes :

2.5 Commande bang-bang

3 Commande Linéaire Quadratique

3.1 Commande LQ à horizon fini

ẋ = A(t)x + B(t)u (23)

les matrices Q, R et S étant symétriques avec Q et S ≥ 0 et R > 0 2 .

p(tf ) = Sxf (27)

– absence de contrainte sur la commande

u = −R−1 (t)B T (t)p. (29)

Alors l’équation dynamique du système s’écrit :

ẋ = A(t)x − B(t)R−1 (t)B T (t)p. (30)

A(t) −B(t)R−1 (t)B T (t)

Ecrivons p = P (t)x, comme nous y incite (27), avec, d’après (27), la

ṗ = − AT (t)P (t) + Q(t) x.

Avec ṗ = Ṗ x+P ẋ et l’équation d’état (23) du système, l’équation (32) s’écrit

(Ṗ + P A + AT P − P BR−1 B T P + Q)x = 0 (33)

La solution est alors obtenue en résolvant l’équation (différentielle) de Riccati

xT (Ṗ + P A + AT P − P BR−1 B T P + Q)x = 0 (35)

3.2 Commande LQ à horizon infini

3.3.1 Différence de retour

P (sI − A) + (−sI − AT )P + P BR−1 B T P = Q (44)

Multiplions à droite par (sI − A)−1 B et à gauche par B T (−sI − AT )−1 :

B T (−sI − AT )−1 P B + B T P (sI − A)−1 B

En notant que d’après (41), on a B T P = RK et P B = K T R, on obtient :

B T (−sI − AT )−1 K T R + RK(sI − A)−1 B

Le premier membre de l’égalité s’écrit :

(I + B T (−sI − AT )−1 K T )R(I + K(sI − A)−1 B) − R. (47)

On obtient finalement l’équation de la différence de retour :

(I + B T (−sI − AT )−1 K T )R(I + K(sI − A)−1 B)

3.3.2 Marges de stabilité

(I + KH(jω))H R(I + KH(jω)) = R + H H (jω)QH(jω) (49)

où M H est le hermitien de M , c’est-à-dire le conjugué transposé. On en déduit

(I + KH(jω))H R(I + KH(jω)) ≥ R. (50)

où λi représente la ième valeur propre 5 . En monovariable, ce résultat s’in-