Notas Control Optimo PDF
Notas Control Optimo PDF
Notas Control Optimo PDF
Extracto de la propuesta presentada para el concurso de oposición del cargo interino de Profesor
Adjunto de Economı́a Matemática - Departamento de Métodos Matemático-cuantitativos, Facultad de
Ciencias Económicas y de Administración, Universidad de la República
Mijail Yapor
Diciembre 2011
Índice
1. Introducción 3
4. Referencias bibliográficas 21
1 Introducción
1. Introducción
El objeto central de estas notas es presentar los componentes básicos de la teorı́a de
Control Óptimo, ası́ como sus principales aplicaciones a la economı́a, en el marco de la
formación de grado universitario. La responsabilidad sobre lo que aquı́ figura es exclusiva
del autor.
La teorı́a de control óptimo, como cuerpo, podrı́a decirse que data de algo más de medio
siglo atrás, y se presenta como uno de los avances más importantes en el marco de los pro-
blemas de optimización dinámica. Desde los primeros problemas de cálculo de variaciones
hasta el uso creciente de la programación dinámica, el desarrollo de esta área se posiciona
como una de las de mayor trascendencia en el análisis económico actual. La conjugación
de matemática y economı́a (o si se prefiere la aplicación de la primera en la segunda), ha
adoptado un perfil creciente y vertiginoso en los últimos cincuenta años, reduciéndose en
algunos casos de forma notable el tiempo que transcurre entre el desarrollo de técnicas
matemáticas y su aplicación en la economı́a.
En lo que sigue, el segundo apartado tiene su foco en una breve perspectiva histórica
de la relación entre economı́a y matemática. En tercer lugar se presenta el desarrollo
teórico básico del Control Óptimo, avanzando hacia porblemas de mayor complejidad
como trabajar con más de una variable de estado y control. En último caso se presenta
la blibliografı́a utilizada.
Una posible definición de la economı́a matemática dirı́a que es una técnica que da ex-
presión matemática a la teorı́a económica. Es matemática aplicada; una asociación entre
matemática y economı́a (Allen, R; 1959). No es, por tanto, en sentido estricto una rama
más de la economı́a, como lo son la micro o macroeconomı́a. Su objeto es, fundamen-
talmente, la teorı́a económica, diferente a las técnicas de aplicación práctica como ser la
econometrı́a o estadı́stica.
La expansión de las herramientas matemáticas en la economı́a puede decirse que tu-
vo su ritmo más intenso en la segunda mitad del pasado siglo, en especial a finales de
la segunda guerra mundial. Sin embargo, el desarrollo de la economı́a matemática -o la
incorporación progresiva de la segunda en la primera- data de muchos años atrás. Pa-
ra acercarnos a una perspectiva histórica del desarrollo de la economı́a matemática se
seguirá en adelante la clasificación realizada por Arrow, K. e Intriligator, M (1984).
Según los autores, el desarrollo de la economı́a matemática puede dividirse en “tres grandes
y por momentos solapados perı́odos”: de 1838 a 1947, el perı́odo marginalista con base
en el cálculo; de 1948 a 1960, el perı́odo de la teorı́a de conjuntos/modelos lineales; y de
1961 en adelante un perı́odo de integración que unifica el instrumental matemático de los
dos anteriores.
El perı́odo marginalista se caracteriza por el intento de formalizar una teorı́a micro-
económica coherente del comportamiento de los agentes y una teorı́a completa del equili-
brio general. Las herramientas del cálculo como las derivadas parciales o el multiplicador
de Lagrange fueron los instrumentos principales utilizados. El trabajo germinal de Cour-
not (1838) sobre la teorı́a de la firma y los consumidores en el mercado, y las obras
independientes de Hicks (1946) y Samuelson (1947) integrando diversos desarrollos pre-
vios sobre la teorı́a del consumidor, la firma, el equilibrio general y la estabilidad del
equilibrio, representan los trabajos seminales que dan sentido a esta primera etapa.
El segundo perı́odo tiene su orı́gen en la posguerra, pero sin embargo pude decirse que
el trabajo de von Newman en 1937 representa la obra germinal. Uno de los avances
sustanciales de esta época es la incorporación de la teorı́a de conjuntos, que permite
generalizar el análisis económico-matemático a funciones no necesariamente continuas y
por tanto ampliar significativamente el horizonte de desarrollos en la materia. Los trabajos
de Wald (1933-1934) y Arrow y Debreu (1954) sobre la teorı́a del equilibrio general y
la existencia de equilibrio competitivo, son algunos ejemplos del desarrollo de la teorı́a
económica con fuerte base matemática de la época.
Se enmarca en estos ańos el desarrollo de la teorı́a de juegos y sus aplicaciones en economı́a.
RT
M ax V = 0 F (t, y, u)dt
sujeto a : ẏ = f (t, y, u) (1)
y(0) = yo y(T ) libre
yo , T dados
Por último, se establece un valor inicial fijo para la variable de estado (y(0) = yo ), mientras
que se deja libre el valor terminal. Esto último obedece a que pueden exisitr diferentes
formas terminales; su determinación se denomina condición de transversalidad y serán
analizadas en detalle posteriormente.
Seguramente el resultado más relevante de esta teorı́a, el principio del máximo representa
la condición necesaria de primer orden, cuya exposición se basa en la utilización del
Hamiltoniano (o función Hamiltoniana).
2
Considérese el siguiente planteo general del problema de control óptimo:
RT
M ax V = 0 F (t, y, u)dt
sujeto a : ẏ = f (t, y, u) (2)
y(0) = yo
Z T
λ(t)[f (t, y, u) − ẏ]dt = 0 (4)
0
2
Nótese que se omite la condición terminal, puesto que a los efectos del desarrollo siguiente no resulta
relevante. Su determinación será analizada con posterioridad.
Z T
J =V + λ(t)[f (t, y, u) − ẏ]dt , (5)
0
Z T Z T
J= F (t, y, u)dt + λ(t)[f (t, y, u) − ẏ]dt , (6)
0 0
o alternativamente
Z T
J= {F (t, y, u) + λ(t)[f (t, y, u) − ẏ]}dt (7)
0
Z T
J= [H(t, y, u, λ) − λ(t)ẏ]dt , (8)
0
es decir
Z T Z T
J= H(t, y, u, λ)dt − λ(t)ẏdt (9)
0 0
Z T
J= [H(t, y, u, λ) + y(t)λ̇]dt − λ(T )yT + λ(0)y0 (10)
0
∂H(t, y, u, λ)
= f (t, y, u) , (11)
∂λ
se llega a
∂H(t, y, u, λ)
⇒ ẏ = f (t, y, u)
ẏ = (12)
∂λ
Esta ecuación representa una de las condiciones del principio del máximo.
Continuando con la derivación de las restantes condiciones, pasemos ahora al estudio del
efecto del sendero de u(t) sobre la variable de estado y(t).
Si se conoce un sendero posible para las variables de estado y control, y ∗ y u∗ , y se le
adicionan perturbaciones, q(t) y p(t) respectivamente, se obtienen dos familias de senderos:
y(t) = y ∗ + q(t)
(13)
u(t) = u∗ + p(t)
T = T ∗ + ∆T ⇒ dT
d
= ∆T
∗ dyT (14)
yT = yT + ∆yT ⇒ d = ∆yT
Z T ()
J= {H[t, y ∗ + q(t), u∗ + p(t), λ)] + λ̇[y ∗ + q(t)]}dt − λ(T )yT + λ(0)y0 (15)
0
Queda ası́ expresado el Funcional objetivo en términos de , sobre el cual es posible aplicar
la condición de primer orden dJ
d
= 0:
Z T ()
dJ ∂H ∂H dT
= q(t) + p(t) + λ̇q(t) dt + [H + λ̇y]t=T − (16)
d 0 ∂y ∂u d
dyT dλ(T ) dT
−λ(T ) − yT =0
d dT d
o alternativamente:
Z T ()
dJ ∂H ∂H
= q(t) + p(t) + λ̇q(t) dt + [H + λ̇y]t=T ∆T − (17)
d 0 ∂y ∂u
−λ(T )∆yT − yT λ̇(T )∆T = 0
Si se toma en cuenta que uno de los componentes del segundo sumando de esta útlima
ecuación puede escribirse como:
dT
[λ̇y]t=T = λ̇(T )yT ∆T , (18)
d
Z T
dJ ∂H ∂H
= + λ̇ q(t) + p(t) dt + [H]t=T ∆T − λ(T )∆yT = 0 (19)
d 0 ∂y ∂u
Este diferencial está compuesto por tres sumandos, cuya determinación es afectada por
diferentes componentes: en el primero (la integral) aparecen las curvas de perturbación
p(t) y q(t), mientras que en los dos restantes se involucran las variaciones ∆T y ∆yT
respectivamente. Dado que la condición de primer orden implica que el diferencial sea
inequı́vocamente 0, los tres sumandos que lo componen deben serlo. Y para que esto sea
cierto debe suceder que:
∂H ∂H
λ̇ = − y = 0, (20)
∂y ∂u
El ejemplo más sencillo de condición terminal es la que fija tanto el momento final como el
valor de la variable de estado en dicho momento. Es decir, cuando T está dado e y(T ) = yT
es fijo. En este caso, la condición de transversalidad es simpliemente el punto terminal
y(T ) = yT . Adicionalmente, tomando la ecuación (19), pude observarse que esto hace
efectiva las condiciones [H]t=T ∆T = 0 y λ(T )∆yT = 0, puesto que tanto ∆T como ∆yT
resultan 0.
Un segundo caso posible es que T se encuentre fijo pero y(T ) = yT sea libre, el cual se
denomina lı́nea terminal vertical. Esto implica que si bien se fija el momento final de
planificación, no se imponen restricciones al valor final de la variable de estado. En este
caso, ∆T es cero pero no ası́ ∆yT . Por lo tanto, para que el miembro λ(T )∆yT = 0, la
condición de transversalidad es λ(T ) = 0.
Otro caso posible es el denominado lı́nea terminal horizontal, el cual implica que y(T ) = yT
sea fijo pero no el momento final T . Siguiendo el razonamiento de los casos anteriores,
∆T puede variar y para que [H]t=T ∆T = 0 la condición es [H]t=T = 0.
Existen otros casos de condiciones terminales, como ser los de curva terminal, lı́nea ter-
minal vertical u horizontal truncada, que no serán presentados aquı́. Para un desarrollo
de los mismos se puede consultar el texto Elements of dynamic optimization de Alpha C.
Chiang (páginas 182 a 184).
Una posible variación a los porblemas de control óptimo vistos hasta el momento es
cuando en ciertas aplicaciones económicas puede resultar de interés analizar un fenómeno
en términos corrientes. En estos casos debe incorporarse un factor de descuento en el
integrando del Funcional objetivo, el cual se denota con la expresión e−ρt . Esto obliga a
reformular el Hamiltoniano, como se verá a continuación.
Reescribiendo F como:
RT
M ax V = 0 G(t, y, u)e−ρt dt
sujeto a : ẏ = f (t, y, u) (22)
y : condiciones de borde
El Hamiltoniano ahora es:
De modo de hacer más sencillo el cálculo de las condiciones del principio del máximo, el
Hamiltoniano se reexpresa utilizando un multiplicador lagrangiano en tiempo corriente,
definido como:
m = λ(t)eρt (24)
∂Hc
=0
∂u
∂Hc
ẏ = (26)
∂m
∂Hc
ṁ = − + ρm
∂y
Resta analizar las variaciones en cuanto a las condiciones de transversalidad. El estudio
de cada caso se mantiene respecto de la situación en tiempo presente, mientras que varı́a
la formulación de las restricciones. Ahora:
Y la función integrando del problema puede escribirse como F (t, y1 , ..., yn , u1 , ..., um ).
El problema requiere a su vez de n condiciones iniciales y n condiciones terminales.
Incluir de esta forma el integrando, las ecuaciones de movimiento y las condiciones ini-
ciales y terminales en la formulación del problema de control óptimo puede resultar muy
engorroso. Si asumimos la siguiente notación vectorial:
y1 u1 y˙1 f 1 (t, y, u)
y ≡ ... u ≡ ... ẏ ≡ ... f (t, y, u) ≡ .. (30)
.
n
yn um y˙n f (t, y, u)
RT
M ax V = 0 F (t, y, u)dt
sujeto a : ẏ = f (t, y, u) (31)
y(0) = yo
condiciones de borde
Presentado el problema, para poder determinar el principio del máximo se requiere de una
reformulación del Hamiltoniano para el caso de n restricciones. El mismo puede escribirse
como:
3
En general, los porblemas de este tipo vistos en cursos de grado incluyen a lo sumo dos variables de
estado y/o de control, por lo que si bien la dificultad aumenta, siguen siendo de manejo relativamente
accesible.
n
X
H = F (t, y, u) + λj (t)f j (t, y, u) (32)
j=1
∂H
máx H ⇒ =0 (i = 1, . . . , m)
u ∂ui
∂H
y˙j = ⇒ ẏ = f j (t, y, u) (j = 1, . . . , n) (35)
∂λj
∂H
λ˙j = − (j = 1, . . . , n)
∂yj
Por último, resta estudiar qué sucede con las condiciones de transversalidad. Además del
caso trivial de punto terminal fijo y siguiendo la lı́nea desarrollada hasta el momento, sólo
se presentarán los casos de punto terminal libre y valor terminal de la variable de estado
libre.
En el caso de una sola variable de estado y control, la condición de transversalidad requerı́a
que la expresión [H]t=T ∆T − λ(T )∆yt fuera identicamente 0. Trabajando con n variables
de estado, esta condición se expande a:
Z ∞
dJ ∂H ∂H
= + λ̇ q(t) + p(t) dt + lı́m [H]∆T − lı́m λ(T )∆yt = 0 (39)
d 0 ∂y ∂u t→∞ t→∞
Dado que ahora T no es fijo, se debe cumplir que lı́mt→∞ [H] = 0, lo que resulta ser
la condición básica de transversalidad en condiciones de horizonte infinito. El otro caso
posible es que y(T ) = yT sea o no libre. Si no lo es, la condición adicional es simplemente
el dicho punto terminal. En caso contrario, si y(T ) es libre se debe imponer la restricción
de que lı́mt→∞ λ(T ) = 0.
RT
M ax V = 0 F (t, y, u)dt
sujeto a : ẏ = f (t, y, u) (40)
y(0) = yo
yo , T dados
Es posible establecer, para cada momento del tiempo y para y y λ dados, cierto u*
que maximice el Hamiltoniano. Si llamamos H 0 (t, y, λ) a dicho hamiltoniano maximizado,
se tiene que:
El teorema de Arrow establece que las condiciones del principio del máximo son suficientes
para hallar el máximo global de V , si el Hamiltoniano maximizado H 0 es cóncavo en la
variable de estado y para todo t perteneciente a [0, T ], y para un λ dado. Es decir, si
∂2H
∂y 2
< 0.
RT
M ax Π = 0
π(t, k, u)dt
sujeto a : k̇ = f (t, k, u) (42)
k(0) = ko
condiciones de borde
Asumiendo como k*, u* y λ∗ las trayectorias óptimas de las variables de estado, coontrol
y coestado respectivamente, y recordando la ecuación (10), podemos expresar el Funcional
objetivo en el óptimo como:
Z T
∗
Π = [H(t, k ∗ , u∗ , λ∗ ) + k ∗ (t)λ̇∗ ]dt − λ∗ (T )kT∗ + λ∗ (0)k0∗ (43)
0
Si se deriva esta expresión respecto de k0∗ y kT∗ se obtiene un primer resultado interesante.
Estas derivadas son:
∂Π∗
∗
= λ∗ (0) (44)
∂k0
∂Π∗
= −λ∗ (T ) (45)
∂kT∗
En el primer caso podrı́a decirse que λ∗ (0) representa el incremento marginal de los
beneficios frente a un aumento de capital inicial, es decir, la sensibilidad del beneficio
óptimo respecto del stock de capital inicial. En el segundo caso, λ∗ (T ) puede interpretarse
como el opuesto de la tasa de cambio de los beneficios respecto al stock de capital final;
esto es, el sacrificio en términos de beneficios asociado a la no utilización de una unidad
de capital en el momento T . En términos generales, en cada momento del timepo t, λ∗ (t)
representa la sensibilidad de los beneficios óptimos frente a cambios en el stock de capital,
es decir, la tasa a la cual se aprecia (deprecia) una unidad de capital en el momento t.
Producto de esta interpretación, a la variable de coestado suele denominársela como valor
imputado o precio sombra.
Un segundo resultado de interés refiere al sentido económico del Hamiltoniano. Siguiendo
el ejemplo:
∂H ∂π ∂f ∂π ∂f
= + λ(t) =0⇒ = −λ(t) (47)
∂u ∂u ∂u ∂u ∂u
∂H
k̇ = = f (t, k, u) (48)
∂λ
∂H ∂π ∂f (−1) ∂π ∂f
λ̇ = − =− − λ(t) =⇒ −λ̇ = + λ(t) (49)
∂k ∂k ∂k ∂k ∂k
Mientras que la primera describe la forma en que la variable de control afecta la trayectoria
del capital, la segunda ecuación muestra cómo la tasa depreciación del valor imputado
(−λ̇) debe igualarse a la suma de la contribución marginal del capital a los beneficios
presentes y de la contribución marginal del capital a su propia valorización. En otras
palabras, la condición a cumplir es que la depreciación del valor imputado del capital se
compense con la contribución del capital a los beneficios presentes y futuros.
Una última interpretación interesante del principio del máximo refiere a las condiciones
de transversalidad. En el caso de una lı́nea terminal vertical donde no se fija el valor
terminal de la variable de estado (k(T ) libre, T fijo), la condición de transversalidad
resultante era λ(T ) = 0. Esto implica que el valor imputado al capital en el momento
final de planificación debe ser 0. El sentido económico de este resultado es sumamente
razonable: razonando por el absurdo, si bajo estas condiciones al momento final el valor
marginal del capital fuese positivo, invertir una unidad adicional repercutirı́a en beneficios
positivos, por lo que la trayectoria elegida no serı́a óptima y se continuarı́a con la inversión.
En el caso de una lı́nea terminar horizontal (k(T ) fijo y T libre), la condición era [H]t=T =
0. Recordando la interpretación del Hamiltoniano, esta condición implica que para el
momento T resultante, la suma de beneficios presentes y futuro sea nula. Es decir, si se
llegase a dicho momento con el stock de capital prefijado y beneficios positivos, la elección
no serı́a óptima, pues continuar invirtiendo redundarı́a en mayores beneficios.
4. Referencias bibliográficas
Allen, R.(1965) Economı́a Matemática. Aguilar.
Simon, C. y Blume, L. (1994). Mathematics for economists. W.W. Norton and Com-
pany.