Apuntes Control Optimo Cap 3-4
Apuntes Control Optimo Cap 3-4
Apuntes Control Optimo Cap 3-4
Supóngase que el tiempo final tf es fijo. El Hamiltoniano está definido como el integrando aumentado
del funcional de costo (1.20), esto es
H ( x(t ), u (t ), J *x , t ) g ( x(t ), u (t ), t ) pT (t ) f ( x(t ), u (t ), t )
1 T 1
H ( x (t ), u (t ), J *x , t ) x (t )Q (t ) x(t ) u T (t ) R (t )u (t )
2 2
p (t ) A(t ) x (t ) B (t )u (t )
T
1 T 1
H ( x(t ), u (t ), J *x , t ) x (t )Q(t ) x(t ) u T (t ) R (t )u (t )
2 2
p (t ) A(t ) x(t ) p (t ) B(t )u (t )
T T
6 [ yT Mz] z M T y
7 [ yT My] y My M T y
8 [ yT Mz] y Mz
18
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
19
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
p (t ) K (t ) x(t ) K (t ) x (t )
p (t ) K (t ) x(t ) K (t )[ A(t ) x(t ) B (t ) R 1 (t ) BT (t ) p (t )]
u (t )
1
Utilizando el controlador u(t ) R (t ) B (t ) K (t ) x(t ) , es posible demostrar que la solución óptima
T
Prueba:
J *
Suponiendo esta solución y puesto que x ( x(t ), t ) K (t ) x(t ) entonces
J *
u (t ) R 1 (t ) BT (t ) ( x(t ), t ) , así la Ec. J-H-B resulta en lo siguiente9:
x
0 J t H ( x(t ), u *( x(t ), J x , t ), J x , t )
* * *
0 J t* g ( x (t ), u (t ), t ) J x*T f ( x(t ), u (t ), t )
1 T 1
0 J t* x (t )Q (t ) x(t ) u T (t ) R(t )u (t ) J x*T A(t ) x(t ) B(t )u (t )
2 2
1 1
0 J t* xT (t )Q (t ) x(t ) J x*T B (t ) R 1 (t ) R (t ) R 1 (t ) BT (t ) J x* J x*T A(t ) x (t ) J x*T B(t ) R 1 (t ) BT (t ) J x*
2 2
1 1
0 J t* xT (t )Q (t ) x(t ) J x*T B (t ) R 1 (t ) BT (t ) J x* J x*T A(t ) x(t )
2 2
(0.23)
J *
9
Denotando J x* ( x (t ), t )
x
20
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
1 T 1
0 J t* x (t )Q (t ) x(t ) [ K (t ) x (t )]T B (t ) R 1 (t ) BT (t )[ K (t ) x (t )] [ K (t ) x(t )]T A(t ) x (t )
2 2
con J t* 1 . Desarrollando obtenemos10,11
x T Kx
2
1 T 1 1
0 x (t ) K (t ) x (t ) xT (t )Q (t ) x(t ) xT (t ) K (t ) B(t ) R 1 (t ) BT (t ) K (t ) x (t ) xT (t ) K (t ) A(t ) x (t )
2 2 2
M
1 T 1 1
0 x (t ) K (t ) x (t ) xT (t )Q (t ) x(t ) xT (t ) K (t ) B(t ) R 1 (t ) BT (t ) K (t ) x (t )
2 2 2
1 1 T
xT (t ) K (t ) A(t ) K (t ) A(t ) K (t ) A(t ) K (t ) A(t ) x(t )
T
2 2
1 T 1 1
0 x (t ) K (t ) x (t ) xT (t )Q (t ) x(t ) xT (t ) K (t ) B(t ) R 1 (t ) BT (t ) K (t ) x (t )
2 2 2
1 1 1
xT (t ) K (t ) A(t ) A(t )T K (t ) x(t ) xT (t ) K (t ) A(t ) x(t ) xT (t ) K (t ) A(t ) x(t )
T
2 2 2
Puesto que la transpuesta de un escalar es igual a sí mismo
T
xT (t ) K (t ) A(t ) x (t ) xT (t ) K (t ) A(t ) x (t ) xT (t ) A(t )T K (t ) x (t ) xT (t ) K (t ) A(t ) x (t ) ,
T T T
sólo contribuye la parte simétrica y no la antisimétrica:
1 T
0 x (t ) K (t ) Q(t ) K (t ) B(t ) R 1 (t ) BT (t ) K (t ) K (t ) A(t ) AT (t ) K (t ) x(t )
2
0 K (t ) Q(t ) K (t ) B (t ) R 1 (t ) BT (t ) K (t ) K (t ) A(t ) AT (t ) K (t )
K (t ) K (t ) A(t ) AT (t ) K (t ) Q(t ) K (t )B(t ) R1 (t ) BT (t ) K (t )
1 T
Por lo que, se cumple la ecuación H-J-B para J * ( x (t ), t ) x (t ) K (t ) x(t ) y para el controlador
2
u(t ) R1 (t ) BT (t ) K (t ) x(t ) cuando se satisface la ecuación de Riccati.
Ejemplo 1: Encuentre la ley de control óptimo u* del sistema y funcional de costo dados por
𝑥̇ = 𝑥 (𝑡)
𝑥̇ = 2𝑥 (𝑡) − 𝑥 (𝑡) + 𝑢(𝑡)
1 1
𝐽= 𝑥 + 𝑥 + 𝑢 𝑑𝑡
2 4
Solución:
0 1 0 0
𝐴= ;𝐻=
2 −1 0 0
0 2 0
𝐵= ;𝑅= ;𝑄=
1 0 1
10
[AB]T=BTAT
11
M 12 [ M M ] 12 [ M T M T ] 12 [ M M T ] 12 [ M M T ]
21
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
El tamaño matricial de 𝐾̇ (𝑡) y K(t) es igual al tamaño de 𝑄(𝑡), entonces la ec. de Riccati es
𝑘 ̇ = −4𝑘 − 2 + 2𝑘
𝑘 ̇ = −𝑘 + 𝑘 − 2𝑘 + 2𝑘 𝑘
𝑘 ̇ = 2𝑘 − 2𝑘 − 1 + 2𝑘
Ejemplo 2: Encuentre la ley de control óptimo u* del sistema y funcional de costo dados por
𝑥̇ = 𝑥 (𝑡) − 𝑥 (𝑡)
𝑥̇ = −2𝑥 (𝑡) − 3𝑥 (𝑡) + 𝑢(𝑡)
1
𝐽= [𝑥 +𝑥 + 𝑢 ] 𝑑𝑡
2
Solución:
−1 1 0 0
𝐴= ;𝐻=
−2 −3 0 0
0 1 0
𝐵= ; 𝑅 = [1] ; 𝑄 =
1 0 1
El tamaño matricial de 𝐾̇ (𝑡) y K(t) es igual al tamaño de 𝑄(𝑡), entonces la ec. de Riccati es
𝑘 ̇ = 2𝑘 + 4𝑘 − 1 + 𝑘
̇
𝑘 = −𝑘 + 4𝑘 + 2𝑘 + 𝑘 𝑘
𝑘 ̇ = −2𝑘 + 6𝑘 − 1 + 𝑘
22
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
23
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
Bajo ciertas condiciones del regulador lineal cuadrático, la ganancia óptima es invariante en el
tiempo, este resultado se muestra a continuación.
En el caso en que el proceso a controlar es para un intervalo de duración infinita, R.E. Kalman demostró
que si: a) la planta es completamente controlable, b) H=0, y c) A, B, R, Q son matrices constantes,
entonces K (t ) K constante cuando t f .
Esto tiene implicaciones en ingeniería importantes, ya que, al tener la ganancia óptima invariante en
el tiempo, es decir constante, esto significa que la implementación puede hacerse con electrónica
básica como amplificadores operacionales.
Desde un punto de vista práctico es posible utilizar la ley de control constante aun para los procesos de
duración finita, puesto que las ganancias son casi constantes, excepto en el intervalo de tiempo cercano
al tiempo final, obteniendo en ese caso un control subóptimo.
Ejemplo 1: Encuentre la ley de control óptimo u* del sistema y funcional de costo dados por
dx(t)/dt = x(t) + u(t)
J= ∫ 𝑢 (𝑡)dt
K̇= -KA-ATK-Q+KBR-1BTK
K̇= -K-K-0+K( )-1K
K̇= -K-K+2K2
𝐾̇ = 2K2-2K
u*1= 0
u*2= -2x(t)
Para resolverlas, nótese que la primera ecuación es cuadrática de 1 sola incógnita, sustituyendo
su solución en la tercera ecuación queda una cuadrática de 1 sola incógnita, sustituyendo ambas
soluciones en la segunda ecuación simplemente se despeja la incógnita restante. Cuando existen
múltiples soluciones (como en las ecuaciones cuadráticas), es conveniente elegir las soluciones
positivas (no las negativas, ni cero) para no generar señales de control que provoquen
inestabilidad del sistema en lazo cerrado.
Las soluciones K obtenidas son utilizadas luego para calcular la matriz de ganancia estática de
retroalimentación determinada por K R B K , para u *(t ) K·x(t ) .
1 T
12
Este software es gratuito, funciona en diferentes sistemas operativos y se descarga de
https://www.scilab.org/download
26
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
se pueden resolver para el caso algebraico K 0 , mediante el siguiente código en Scilab:
//Ec de Riccati:
function dk=ecriccati(k)
k11=k(1); k12=k(2); k22=k(3);
dk(1) = -4*k12-2+2*k12^2
dk(2) = -k11+k12-2*k22+2*k12*k22
dk(3) = -2*k12+2*k22-1+2*k22^2
endfunction
//----MUESTRA RESULTADOS:
mprintf(‘Las soluciones de la Ec. algebraica de Riccati son:\nk_11=%f \nk_12=%f
\nk_22=%f’,k11,k12,k22)
Puesto que existen múltiples soluciones, es conveniente elegir las soluciones positivas (no las
negativas, ni cero) para no generar señales de control que provoquen inestabilidad del sistema
en lazo cerrado. Por ello, se inició con una ‘semilla’ de ks=[10;10;10]; ya que con valores
cercanos a 0 produce soluciones indeseadas. Así, la solución numérica de las ecuaciones de
Riccati resulta en
k11 6.031273
k12 k21 2.414214
k22 1.278824
Ejemplo 4: Calcular el control óptimo del siguiente sistema con el funcional de costo dado:
x1 x2 (t )
x (t ) 0.0025u 2 (t )dt
tf
x2 2 x1 (t ) x2 (t ) u (t ) J (u ) 1
2
t0
Puesto que se cumplen las condiciones necesarias, se puede aplicar la ec. algebraica de Riccati:
0 K (t ) A(t ) AT K (t ) Q(t ) K (t ) B (t ) R 1 (t ) BT (t ) K (t )
0 4k12 2 200k12 2
0 k11 k12 2k22 200k12 k22
0 2k12 2k22 200k22 2
Por otro lado, la ley de control óptima es
𝑢∗ (𝑡) = −𝑅 (𝑡)𝐵 (𝑡)𝐾(𝑡)𝑥(𝑡)
𝑘 𝑘 𝑥
𝑢∗ (𝑡) = −[200][0 1] 𝑥
𝑘 𝑘
𝑘 𝑥 +𝑘 𝑥
𝑢∗ (𝑡) = −[200][0 1]
𝑘 𝑥 +𝑘 𝑥
𝑢∗ (𝑡) = −200𝑘 𝑥 − 200𝑘 𝑥
//Ec de Riccati:
function dk=ecriccati(k)
k11=k(1); k12=k(2); k22=k(3);
dk(1) = -4*k12-2+200*k12^2
dk(2) = -k11+k12-2*k22+200*k12*k22
dk(3) = -2*k12+2*k22+200*k22^2
endfunction
//Simulación de modelo
x=(ode('rk',x0,t0,t,planta))';//solución de la ec de estado
28
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
//----MUESTRA RESULTADOS:
mprintf(‘Las soluciones de la Ec. algebraica de Riccati son:\nk_11=%f \nk_12=%f
\nk_22=%f’,k11,k12,k22)
mprintf(‘\n\nEl valor de costo en tiempo final es:\nJ(t_f)=%f’,x($,3))
//Gráficas
figure(1)
plot(t,x(:,1),t,x(:,2));
xgrid
xtitle('Estados del sistema','Tiempo t (s)','x(t)')
legend('x1','x2')
figure(2)
plot(t,-200*k12*x(:,1)-200*k22*x(:,2));
xgrid
xtitle('Entrada del sistema','Tiempo t (s)','u(t)')
Se inició con una ‘semilla’ de ks=[10;10;10]; ya que con valores cercanos a 0 producía
soluciones indeseadas. Así, la solución numérica de las ecuaciones de Riccati resulta en
k11 0.685659
k12 k21 0.110499
k22 0.028615
La respuesta de los estados x1 y x2 se ilustra en la Figura 4.4 y la señal de control en la Figura 4.5.
30
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
Si las desviaciones máximas de las salidas del servomecanismo son: x1max , x2max , y la desviación
máxima de control es umax , entonces el costo es:
Q(1,1) x12 Q(2, 2) x2 2 Ru 2
Los coeficientes de las matrices Q y R se pueden establecer relacionados con las reglas:
1 1 1
Q(1,1) 2
, Q(2, 2) 2
y R
( x1max ) ( x2max ) (umax ) 2
Esta regla se puede modificar para satisfacer las ubicaciones de raíz deseadas y la respuesta
transitoria para valores seleccionados. Uno debe evitar los efectos de saturación tanto de las
salidas como del control.
Solución:
La regla lleva a determinar que Q11=1, Q22=1 y R=0.5, esto es:
tf
1 1 1
J (u ) x12 (t ) x2 2 (t ) u 2 (t ) dt
t0
2 2 4
0 1 0 0 0 1 0 1
A ; B ; H ;Q ; R 0.5
1 1 1 0 0 0 1 2
Puesto que se cumplen las condiciones necesarias, se puede aplicar la ec. algebraica de Riccati:
0 K (t ) A(t ) AT K (t ) Q(t ) K (t ) B (t ) R 1 (t ) BT (t ) K (t )
0 0 𝑘 𝑘 0 1 0 1 𝑘 𝑘 1 0 𝑘 𝑘 0 [2][ 𝑘 𝑘
=− − − + 0 1]
0 0 𝑘 𝑘 1 1 1 1 𝑘 𝑘 0 1 𝑘 𝑘 1 𝑘 𝑘
0 0 𝑘 𝑘 +𝑘 𝑘 𝑘 1 0 𝑘 𝑘 𝑘 𝑘
=− − − +2
0 0 𝑘 𝑘 +𝑘 𝑘 +𝑘 𝑘 +𝑘 0 1 𝑘 𝑘 𝑘 𝑘
31
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
clear;clc;
//Datos de simulación
t0=0;
tf=30;
paso=0.1;
t=(t0:paso:tf)'; //tiempo para simulación
x0=[10;-10;0]; //condición inicial del estado y funcional de costo
//Modelo de estado
function dz=planta(t,z)//Ecs. de estado
x=[z(1);z(2)]; //vector de estados
//Simulación de modelo
x=(ode('rk',x0,t0,t,planta))';//solución de la ec de estado
//----MUESTRA RESULTADOS:
mprintf(‘Las soluciones de la Ec. algebraica de Riccati son:\nk_11=%f \nk_12=%f
\nk_22=%f’,k11,k12,k22)
mprintf(‘\n\nEl valor de costo en tiempo final es:\nJ(t_f)=%f’,x($,3))
32
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
//Gráficas
figure(1)
plot(t,x(:,1),t,x(:,2));
xgrid
xtitle('Estados del sistema','Tiempo t (s)','x(t)')
legend('x1','x2')
figure(2)
plot(t,-2*k12*x(:,1)-2*k22*x(:,2));
xgrid
xtitle('Entrada del sistema','Tiempo t (s)','u(t)')
La respuesta de los estados x1 y x2 se ilustra en la Figura 4.7 y la señal de control en la Figura 4.8.
33
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
Nótese que los valores de las amplitudes de estados y señal de control ya no son altos.
Un video que ilustra el regulador lineal cuadrático (LQR, por sus siglas en inglés) está en:
https://youtu.be/E_RDCFOlJx4=
34
Departamento de Electrónica y Automatización, FIME, UANL.
Apuntes de Control Óptimo Dr. Juan Ángel Rodríguez Liñán
1. El sistema
x1 x2
x2 x1 x2 u
con el funcional de costo dado por
tf
J ( x, u , t ) 12 x12 (t ) 12 x22 (t ) 14 u 2 dt .
t0
2. El sistema
x1 x1 x2 u
x2 2 x1 3x2 u
con el funcional de costo dado por
tf
J ( x, u , t ) 1
x12 (t ) x22 (t ) u 2 (t ) dt .
t0 2
Este único archivo PDF entregable, debe tener portada con nombre de la unidad de aprendizaje,
número y nombre de actividad, nombre y número de matrícula de estudiante, hora de clase, nombre
de profesor, fecha de entrega.
Se acepta SÓLO por NEXUS sin excepción, por lo que debe subirlo antes de la fecha y hora de
vencimiento para evitarse contratiempos o fallas de la plataforma.
35
Departamento de Electrónica y Automatización, FIME, UANL.