Notas Control Optimo PDF

Teorı́a de Control Óptimo y la Economı́a
Extracto de la propuesta presentada para el concurso de oposición del cargo interino de Profesor
Adjunto de Economı́a Matemática - Departamento de Métodos Matemático-cuantitativos, Facultad de
Ciencias Económicas y de Administración, Universidad de la República
Mijail Yapor
Diciembre 2011
Índice
1. Introducción 3
2. Breve reseña histórica 4
3. Teorı́a del Control Óptimo 6

3.1. Introducción e importancia . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2. Presentación básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.1. Trayectoria óptima: la toma de decisiones en varias etapas . . . . . 7
3.2.2. El concepto de Funcional . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3. El porblema de Control Óptimo . . . . . . . . . . . . . . . . . . . . . . . . 8
3.4. El principio del máximo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.4.1. Desarrollo y condiciones de primer orden . . . . . . . . . . . . . . . 9
3.4.2. Condiciones de transversalidad . . . . . . . . . . . . . . . . . . . . 12
3.4.3. El caso del Hamiltoniano Corriente . . . . . . . . . . . . . . . . . . 13
3.4.4. Problemas con más de una variable de estado y control . . . . . . . 14
3.4.5. Problemas con horizonte infinito . . . . . . . . . . . . . . . . . . . . 17
3.4.6. Condiciones suficientes . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.5. Interpretación económica del Principio del Máximo . . . . . . . . . . . . . 18
4. Referencias bibliográficas 21
1 Introducción
1. Introducción
El objeto central de estas notas es presentar los componentes básicos de la teorı́a de
Control Óptimo, ası́ como sus principales aplicaciones a la economı́a, en el marco de la
formación de grado universitario. La responsabilidad sobre lo que aquı́ figura es exclusiva
del autor.
La teorı́a de control óptimo, como cuerpo, podrı́a decirse que data de algo más de medio
siglo atrás, y se presenta como uno de los avances más importantes en el marco de los pro-
blemas de optimización dinámica. Desde los primeros problemas de cálculo de variaciones
hasta el uso creciente de la programación dinámica, el desarrollo de esta área se posiciona
como una de las de mayor trascendencia en el análisis económico actual. La conjugación
de matemática y economı́a (o si se prefiere la aplicación de la primera en la segunda), ha
adoptado un perfil creciente y vertiginoso en los últimos cincuenta años, reduciéndose en
algunos casos de forma notable el tiempo que transcurre entre el desarrollo de técnicas
matemáticas y su aplicación en la economı́a.
En lo que sigue, el segundo apartado tiene su foco en una breve perspectiva histórica
de la relación entre economı́a y matemática. En tercer lugar se presenta el desarrollo
teórico básico del Control Óptimo, avanzando hacia porblemas de mayor complejidad
como trabajar con más de una variable de estado y control. En último caso se presenta
la blibliografı́a utilizada.
Teorı́a de Control Óptimo y la Economı́a 3

2 Breve reseña histórica
2. Breve reseña histórica
Una posible definición de la economı́a matemática dirı́a que es una técnica que da ex-
presión matemática a la teorı́a económica. Es matemática aplicada; una asociación entre
matemática y economı́a (Allen, R; 1959). No es, por tanto, en sentido estricto una rama
más de la economı́a, como lo son la micro o macroeconomı́a. Su objeto es, fundamen-
talmente, la teorı́a económica, diferente a las técnicas de aplicación práctica como ser la
econometrı́a o estadı́stica.
La expansión de las herramientas matemáticas en la economı́a puede decirse que tu-
vo su ritmo más intenso en la segunda mitad del pasado siglo, en especial a finales de
la segunda guerra mundial. Sin embargo, el desarrollo de la economı́a matemática -o la
incorporación progresiva de la segunda en la primera- data de muchos años atrás. Pa-
ra acercarnos a una perspectiva histórica del desarrollo de la economı́a matemática se
seguirá en adelante la clasificación realizada por Arrow, K. e Intriligator, M (1984).
Según los autores, el desarrollo de la economı́a matemática puede dividirse en “tres grandes
y por momentos solapados perı́odos”: de 1838 a 1947, el perı́odo marginalista con base
en el cálculo; de 1948 a 1960, el perı́odo de la teorı́a de conjuntos/modelos lineales; y de
1961 en adelante un perı́odo de integración que unifica el instrumental matemático de los
dos anteriores.
El perı́odo marginalista se caracteriza por el intento de formalizar una teorı́a micro-
económica coherente del comportamiento de los agentes y una teorı́a completa del equili-
brio general. Las herramientas del cálculo como las derivadas parciales o el multiplicador
de Lagrange fueron los instrumentos principales utilizados. El trabajo germinal de Cour-
not (1838) sobre la teorı́a de la firma y los consumidores en el mercado, y las obras
independientes de Hicks (1946) y Samuelson (1947) integrando diversos desarrollos pre-
vios sobre la teorı́a del consumidor, la firma, el equilibrio general y la estabilidad del
equilibrio, representan los trabajos seminales que dan sentido a esta primera etapa.
El segundo perı́odo tiene su orı́gen en la posguerra, pero sin embargo pude decirse que
el trabajo de von Newman en 1937 representa la obra germinal. Uno de los avances
sustanciales de esta época es la incorporación de la teorı́a de conjuntos, que permite
generalizar el análisis económico-matemático a funciones no necesariamente continuas y
por tanto ampliar significativamente el horizonte de desarrollos en la materia. Los trabajos
de Wald (1933-1934) y Arrow y Debreu (1954) sobre la teorı́a del equilibrio general y
la existencia de equilibrio competitivo, son algunos ejemplos del desarrollo de la teorı́a
económica con fuerte base matemática de la época.
Se enmarca en estos ańos el desarrollo de la teorı́a de juegos y sus aplicaciones en economı́a.

2 Breve reseña histórica
Von Neuman y Morgenstern (1944), en la construcción de juegos cooperativos, y Nash

(1950) en la construcción de una axiomática con consistencia lógica y fundamento teórico,
son dos de los trabajos más destacados. Es también la etapa del desarrollo de los modelos
lineales, resaltando el trabajo de Leontief (1947) referente a la estructura de interrelaciones
entre sectores de producción. El desarrollo de la programación lineal corresponde también
a esta etapa. Entre el gran número de trabajos sobre la temática se pude resaltar el de
Dorfman, Samuelson y Solow (1958).
El tercer perı́odo que comienza en 1961 se caracteriza por la combinación de elementos del
cálculo, teorı́a de conjuntos y modelos lineales, siendo en estos ańos donde se extiende la
matemática prácticamente a todas las áreas de la economı́a. Los trabajos sobre problemas
con incertidumbre, el análisis global, el equilibrio temporal, la teorı́a de la elección social
y la teorı́a del crecimiento óptimo son algunos ejemplos entre tantos a resaltar. En la
actualidad los avances en la materia continúan, y como ya fuera mencionado, los métodos
basados en la optimización dinámica han tomado un rol central.

3 Teorı́a del Control Óptimo
3. Teorı́a del Control Óptimo
3.1. Introducción e importancia
La teorı́a de control óptimo se enmarca en un tipo de problema más general denomi-

nado optimización dinámica, cuya caracterı́stica sobresaliente es la incorporación de la
dimensión temporal en los problemas económicos de optimización. En contraposición a la
optimización estática, donde el objetivo es encontrar para cada variable de interés el valor
que maximiza o minimiza cierta función objetivo; en la optimización dinámica el objetivo
consiste en determinar el valor óptimo de las variables en cada momento o instante del
tiempo.
Para poder realizar este análisis se requiere de un cierto intervalo de tiempo sobre el cual
se estudiará la trayectoria óptima de las variables. A dicho intervalo se lo suele denominar
como el perı́odo de planificación, y puede tener tanto un horizonte finito (digamos el
perı́odo que va desde el momento 0 al momento T ), como un horizonte infinito (el perı́odo
[0, ∞)). Estos y otros conceptos necesarios para una cabal comprensión del tema serán
desarrollados con mayor detenimiento más adelante.
El desarrollo germinal de esta teorı́a puede ubicarse hacia finales de la década de los 50, a
partir de los trabajos de Pontryagin, quien generaliza el principio del máximo para todos
los problemas de variaciones (Kamien, M; Schwartz, N, 1991).
En los problemas de control óptimo, las variables se dividen en dos clases: variables de
estado y variables de control. El objetivo será encontrar las trayectorias óptimas, para
cada momento del tiempo, de ambas clases de variables, de forma de obtener el valor
máximo (o mı́nimo) de cierta función objetivo. Estas trayectorias o senderos óptimos
se representan a través de ecuaciones de movimiento, con la caracterı́stica de que las
ecuaciones de movimiento de las variables de estado dependen de la variable de control.
Planteado de esta manera el problema, las variables de control fungen como el instrumento
que, afectando las trayectorias de las variables de estado, permiten alcanzar el óptimo.
A continuación se presentan los principales componenetes teóricos de la teorı́a de contol
óptimo, partiendo de la formulación básica del problema y llegando a la presentación
de casos más generales como los problemas con varias variables de estado y control.
Concretamente, luego de comentar algunos conceptos previos necesarios y formulado el
problema báscico, la presente sección incluye: el principal resultado de la teorı́a y condición
necesaria denominado Principio del Máximo; las distintas condiciones de transversalidad
derivadas de condiciones terminales alternativas; el problema en tiempo corriente, con
más de una variable de estado y control y con horizonte infinito; y finalmente se incluye
una interpretación económica del principio del máximo.

3.2. Presentación básica
3.2.1. Trayectoria óptima: la toma de decisiones en varias etapas
Como se mencionara más arriba, la caracterı́stica distintiva de los problemas de optimi-

zación dinámica es la incorporación del tiempo. Alcanzar el óptimo a lo largo del tiempo
puede ser visto como un problema de obtener la secuencia óptima de valores en distintas
etapas. Sin embargo, no siempre el valor que represente el óptimo en cada etapa será la
solución óptima para el problema a lo largo del tiempo. Quizá un ejemplo trivial sirva
para comprender esto con mayor claridad.
Imaginemos una persona que viven en medio del campo y desea llegar a la ruta desde
su casa. Hacerlo lo menos cansado posible, sano y salvo, depende no sólo del largo de
los posibles caminos, sino de las condiciones en que se encuentran, su mayor o menor
seguridad, etc. En estas condiciones tomar un camino en lı́nea recta no necesariamente
será lo más conveniente. Si por ejemplo en medio del mismo se encontrara un tajamar, ir
paso a paso en lı́nea recta (asimilemos esto a una decisión por etapas) implicarı́a al menos
un importante chapuzón (y letal si no supiera nadar...).
Este sencillo ejemplo intenta mostrar que, alcanzar el óptimo etapa a etapa no necesaria-
mente implicará alcanzar la trayectoria óptima. Por tanto, resulta necesario desarrollar
un método que tome en cuenta todo el perı́odo de planificación, como lo hace la teorı́a de
control óptimo.
3.2.2. El concepto de Funcional
En el punto anterior se intentó relacionar la noción de sendero o trayectoria con el valor

óptimo buscado. Matemáticamente, esto requiere encontrar una relación funcional entre
funciones (las trayectorias) y número reales (los valores óptimos). A esta relación se le da
el nombre de Funcional.
Si se denomina y(t) al sendero, el Funcional se representa como V [y(t)]. Esto implica que
V mapea funciones en valores. En la notación habitual de funciones, esto se interpretarı́a
como una función compuesta de V e y(t), por lo que en definitiva V depende del tiempo.
En el caso de V [y(t)], el Funcional es una función únicamente de y(t) como unidad, el
sendero. En suma, para cada sendero, yi (t), tenderemos un valor del Funcional.

3.3. El porblema de Control Óptimo
Tomando en cuenta las consideraciones anteriores, el problema básico de control óptimo

puede escribirse de la siguiente manera: 1
RT
M ax V = 0 F (t, y, u)dt
sujeto a : ẏ = f (t, y, u) (1)
y(0) = yo y(T ) libre
yo , T dados
A efectos de la presentación, se ha optado por trabajar con un problema de maximización.

Sin embargo, si el caso de fuera de minimización, su resolución
RT es equivalente a la de
maximizar el opuesto del funcional objetivo. Es decir, M in 0 F (t, y, u)dt es equivalente
RT
a M ax 0 −F (t, y, u)dt.
Una segunda aclaración es importante: se presenta una versión simple del problema, con
una única variable de estado (y), y una única variable de control (u). Sin embargo, los
problemas económicos pueden implicar la presencia de más de una variable de control y
de estado, situación que puede ser tratada por la teorı́a de control óptimo sin mayores
dificultades.
Se asume que tanto F (t, y, u) como f (t, y, u) son diferenciables con derivadas parciales
contı́nuas respecto de sus tres argumentos. La variable de control u debse ser continua
respecto del tiempo al menos de a tramos; es decir, se admite un número finito de puntos
de discontinuidad. Por su parte, la variable de estado debe ser continua, admitiendo
sin embargo no diferenciabilidad en un número finito de puntos (admite la existencia
de puntos angulosos). La condición es que, de exisitr, los puntos de discontinuidad del
sendero de control deben coincidir con los puntos no diferenciables del sendero de estado.
La ecuación diferencial ẏ = f (t, y, u) se denomina ecuación de movimiento de la variable
de estado (o simplemente ecuación de estado) y muestra cómo la variable de control incide
en el sendero de la variable de estado. Para ilustrar esta interrelación, notemos que en
el momento inicial t = 0 e y(0) = y0 , el valor de f dependerá del valor inicial que tome
u. Si se repite este razonamiento para otros puntos del tiempo se evidencia de qué forma
la elección del valor de la variable de control se traslada al patrón de movimiento de la
variable de estado.
1
En la presente sección y siguientes del apartado se tomará, a grandes rasgos, la forma de presentación
desarrollada por Alpha Chiang en su libro Elements of Dinamic Optimization (1992).

Por último, se establece un valor inicial fijo para la variable de estado (y(0) = yo ), mientras
que se deja libre el valor terminal. Esto último obedece a que pueden exisitr diferentes
formas terminales; su determinación se denomina condición de transversalidad y serán
analizadas en detalle posteriormente.
3.4. El principio del máximo
3.4.1. Desarrollo y condiciones de primer orden
Seguramente el resultado más relevante de esta teorı́a, el principio del máximo representa
la condición necesaria de primer orden, cuya exposición se basa en la utilización del
Hamiltoniano (o función Hamiltoniana).
2
Considérese el siguiente planteo general del problema de control óptimo:
RT
sujeto a : ẏ = f (t, y, u) (2)
y(0) = yo
El correspondiente Hamiltoniano es:
H(t, y, u, λ) = F (t, y, u) + λ(t)f (t, y, u) (3)
Donde λ se denomina variable de coestado.
Si se reexpresa la ecuación de estado como f (t, y, u) − ẏ = 0 y se multiplica ambos

miembros de la igualdad por la variable de coestado, la suma contı́nua de esta expresión
entre el momento 0 y el momento T resulta:
Z T
λ(t)[f (t, y, u) − ẏ]dt = 0 (4)
0
2
Nótese que se omite la condición terminal, puesto que a los efectos del desarrollo siguiente no resulta
relevante. Su determinación será analizada con posterioridad.

Puesto que este término es identicamente 0, lo podemos sumar al Funcional objetivo V

sin alterar el resultado. Llamando J al nuevo Funcional objetivo, tenemos:
Z T
J =V + λ(t)[f (t, y, u) − ẏ]dt , (5)
0
lo que puede escribirse como
Z T Z T
J= F (t, y, u)dt + λ(t)[f (t, y, u) − ẏ]dt , (6)
0 0
o alternativamente
Z T
J= {F (t, y, u) + λ(t)[f (t, y, u) − ẏ]}dt (7)
0
Recordando la formulación del Hamiltoniano definida en (3), la expresión anterior puede

escribirse como sigue:
Z T
J= [H(t, y, u, λ) − λ(t)ẏ]dt , (8)
0
es decir
Z T Z T
J= H(t, y, u, λ)dt − λ(t)ẏdt (9)
0 0
Integrando por partes este resultado se llega a:
Z T
J= [H(t, y, u, λ) + y(t)λ̇]dt − λ(T )yT + λ(0)y0 (10)
0
Recordando la formulación inicial del Funcional objetivo V y J, siempre que se cumpla

la condición f (t, y, u) − ẏ = 0, el sendero λ(t) no debe afectar el valor del Funcional.
Tomando en cuenta esto y observando que:
∂H(t, y, u, λ)
= f (t, y, u) , (11)
∂λ

se llega a
∂H(t, y, u, λ)
⇒ ẏ = f (t, y, u)
ẏ = (12)
∂λ
Esta ecuación representa una de las condiciones del principio del máximo.
Continuando con la derivación de las restantes condiciones, pasemos ahora al estudio del
efecto del sendero de u(t) sobre la variable de estado y(t).
Si se conoce un sendero posible para las variables de estado y control, y ∗ y u∗ , y se le
adicionan perturbaciones, q(t) y p(t) respectivamente, se obtienen dos familias de senderos:
y(t) = y ∗ + q(t)
(13)
u(t) = u∗ + p(t)
Si a esto se le adiciona la condición de que el momento terminal T y el valor terminal de

la variable de estado yT sean variables, también se puede expresar:
T = T ∗ + ∆T ⇒ dT
d
= ∆T
∗ dyT (14)
yT = yT + ∆yT ⇒ d = ∆yT
Tomando las nuevas expresiones de y y u, y sustituyéndolas en J, tenemos que:
Z T ()
J= {H[t, y ∗ + q(t), u∗ + p(t), λ)] + λ̇[y ∗ + q(t)]}dt − λ(T )yT + λ(0)y0 (15)
0
Queda ası́ expresado el Funcional objetivo en términos de , sobre el cual es posible aplicar
la condición de primer orden dJ
d
= 0:
Z T ()
dJ ∂H ∂H dT
= q(t) + p(t) + λ̇q(t) dt + [H + λ̇y]t=T − (16)
d 0 ∂y ∂u d
dyT dλ(T ) dT
−λ(T ) − yT =0
d dT d
o alternativamente:
Z T ()
dJ ∂H ∂H
= q(t) + p(t) + λ̇q(t) dt + [H + λ̇y]t=T ∆T − (17)
d 0 ∂y ∂u
−λ(T )∆yT − yT λ̇(T )∆T = 0

Si se toma en cuenta que uno de los componentes del segundo sumando de esta útlima
ecuación puede escribirse como:
dT
[λ̇y]t=T = λ̇(T )yT ∆T , (18)
d
la ecuación (17) se simplifica. Tomando en cuenta este hecho y reagrupando el integrando

se llega a:
Z T
dJ ∂H ∂H
= + λ̇ q(t) + p(t) dt + [H]t=T ∆T − λ(T )∆yT = 0 (19)
d 0 ∂y ∂u
Este diferencial está compuesto por tres sumandos, cuya determinación es afectada por
diferentes componentes: en el primero (la integral) aparecen las curvas de perturbación
p(t) y q(t), mientras que en los dos restantes se involucran las variaciones ∆T y ∆yT
respectivamente. Dado que la condición de primer orden implica que el diferencial sea
inequı́vocamente 0, los tres sumandos que lo componen deben serlo. Y para que esto sea
cierto debe suceder que:
∂H ∂H
λ̇ = − y = 0, (20)
∂y ∂u
las cuales representan dos condiciones adicionales. A la primera se la denomina ecuación

de movimiento de la variable de coestado (o ecuación de coestado), mientras que a la
segunda representa la maximización del Hamiltoniano respecto de la variable de control.
El principio del máximo se completa con una cuarta condición denominada de transver-
salidad, que como fuera mencionado con antelación, depende de la condición terminal
particular del problema de control óptimo. El hecho notable es que dicha condición de
transversalidad se deriva de los dos restantes sumandos de la ecuación (19), como se verá a
continuación.
3.4.2. Condiciones de transversalidad
El ejemplo más sencillo de condición terminal es la que fija tanto el momento final como el
valor de la variable de estado en dicho momento. Es decir, cuando T está dado e y(T ) = yT
es fijo. En este caso, la condición de transversalidad es simpliemente el punto terminal

y(T ) = yT . Adicionalmente, tomando la ecuación (19), pude observarse que esto hace
efectiva las condiciones [H]t=T ∆T = 0 y λ(T )∆yT = 0, puesto que tanto ∆T como ∆yT
resultan 0.
Un segundo caso posible es que T se encuentre fijo pero y(T ) = yT sea libre, el cual se
denomina lı́nea terminal vertical. Esto implica que si bien se fija el momento final de
planificación, no se imponen restricciones al valor final de la variable de estado. En este
caso, ∆T es cero pero no ası́ ∆yT . Por lo tanto, para que el miembro λ(T )∆yT = 0, la
condición de transversalidad es λ(T ) = 0.
Otro caso posible es el denominado lı́nea terminal horizontal, el cual implica que y(T ) = yT
sea fijo pero no el momento final T . Siguiendo el razonamiento de los casos anteriores,
∆T puede variar y para que [H]t=T ∆T = 0 la condición es [H]t=T = 0.
Existen otros casos de condiciones terminales, como ser los de curva terminal, lı́nea ter-
minal vertical u horizontal truncada, que no serán presentados aquı́. Para un desarrollo
de los mismos se puede consultar el texto Elements of dynamic optimization de Alpha C.
Chiang (páginas 182 a 184).
3.4.3. El caso del Hamiltoniano Corriente
Una posible variación a los porblemas de control óptimo vistos hasta el momento es
cuando en ciertas aplicaciones económicas puede resultar de interés analizar un fenómeno
en términos corrientes. En estos casos debe incorporarse un factor de descuento en el
integrando del Funcional objetivo, el cual se denota con la expresión e−ρt . Esto obliga a
reformular el Hamiltoniano, como se verá a continuación.
Reescribiendo F como:
F (t, y, u) = G(t, y, u)e−ρt , (21)

y en consecuencia el problema de control óptimo como:
RT
M ax V = 0 G(t, y, u)e−ρt dt
sujeto a : ẏ = f (t, y, u) (22)
y : condiciones de borde
El Hamiltoniano ahora es:
H(t, y, u, λ) = G(t, y, u)e−ρt + λ(t)f (t, y, u) (23)

De modo de hacer más sencillo el cálculo de las condiciones del principio del máximo, el
Hamiltoniano se reexpresa utilizando un multiplicador lagrangiano en tiempo corriente,
definido como:
m = λ(t)eρt (24)
A partir de esta definición, se puede reexpresar el Hamiltonaino, obteniendo:
Hc = Heρt = G(t, y, u) + mf (t, y, u) (25)
Con estas consideraciones, el principio del máximo revisado resulta:
∂Hc
=0
∂u
∂Hc
ẏ = (26)
∂m
∂Hc
ṁ = − + ρm
∂y
Resta analizar las variaciones en cuanto a las condiciones de transversalidad. El estudio
de cada caso se mantiene respecto de la situación en tiempo presente, mientras que varı́a
la formulación de las restricciones. Ahora:
si antes λ(T ) = 0 ⇒ m(T )e−ρT = 0 (27)
si antes [H]t=T = 0 ⇒ m(T )[Hc ]t=T e−ρT = 0 (28)
3.4.4. Problemas con más de una variable de estado y control

En lo desarrollado hasta el momento se ha trabajado con problemas de una sola varia-
ble de estado y control. Sin embargo, la modelización de diversos problemas económicos
puede implicar la existencia de más de una de ellas. En esos casos, la formulación del

problema no conlleva mayores dificultas, siendo sin embargo su resolución relativamente

más complicada.3
Para presentar el nuevo problema, considérese la exisencia de n variables de estado y m
variables de control, y1 , ..., yn y u1 , ..., um respectivamente. Extendiendo el análisis de una
sola variable, para cada variable de estado tendremos ahora una ecuación de movimiento:
y˙1 = f 1 (t, y1 , ..., yn , u1 , ..., um )

.............................. (29)
y˙n = f n (t, y1 , ..., yn , u1 , ..., um )
Y la función integrando del problema puede escribirse como F (t, y1 , ..., yn , u1 , ..., um ).
El problema requiere a su vez de n condiciones iniciales y n condiciones terminales.
Incluir de esta forma el integrando, las ecuaciones de movimiento y las condiciones ini-
ciales y terminales en la formulación del problema de control óptimo puede resultar muy
engorroso. Si asumimos la siguiente notación vectorial:
       
y1 u1 y˙1 f 1 (t, y, u)
y ≡  ...  u ≡  ...  ẏ ≡  ...  f (t, y, u) ≡  .. (30)
       
. 
n
yn um y˙n f (t, y, u)
entonces la presentación el problema se simplifica notablemente y su presentación es simi-

lar al caso inicial de una sola variable de estado y control (recordando que en aquel caso
trabajábamos con escalares y aquı́ con vectores):
RT
sujeto a : ẏ = f (t, y, u) (31)
y(0) = yo
condiciones de borde
Presentado el problema, para poder determinar el principio del máximo se requiere de una
reformulación del Hamiltoniano para el caso de n restricciones. El mismo puede escribirse
como:
3
En general, los porblemas de este tipo vistos en cursos de grado incluyen a lo sumo dos variables de
estado y/o de control, por lo que si bien la dificultad aumenta, siguen siendo de manejo relativamente
accesible.

n
X
H = F (t, y, u) + λj (t)f j (t, y, u) (32)
j=1
Si aplicamos la notación matricial anterior, tomando:

 
λ1 (t)
λ ≡  ...  , (33)
 
λn (t)
el Hamiltoniano es:
H(t, y, u, λ) = F (t, y, u) + λ0 (t)f (t, y, u) (34)
A partir de este resultado las nuevas condiciones necesarias establecidas en el principio

del máximo son:
∂H
máx H ⇒ =0 (i = 1, . . . , m)
u ∂ui
∂H
y˙j = ⇒ ẏ = f j (t, y, u) (j = 1, . . . , n) (35)
∂λj
∂H
λ˙j = − (j = 1, . . . , n)
∂yj
Por último, resta estudiar qué sucede con las condiciones de transversalidad. Además del
caso trivial de punto terminal fijo y siguiendo la lı́nea desarrollada hasta el momento, sólo
se presentarán los casos de punto terminal libre y valor terminal de la variable de estado
libre.
En el caso de una sola variable de estado y control, la condición de transversalidad requerı́a
que la expresión [H]t=T ∆T − λ(T )∆yt fuera identicamente 0. Trabajando con n variables
de estado, esta condición se expande a:
[H]t=T ∆T − λ1 (T )∆y1T − λ2 (T )∆y2T − . . . − −λn (T )∆ynT = 0 , (36)
siendo las condiciones de transversalidad:

[H]t=T = 0 si T es libre (37)
λj (T ) = 0 si yjT es libre (38)
3.4.5. Problemas con horizonte infinito

Hasta aquı́ se ha desarrollado la teorı́a del control óptimo trabajando sobre un perı́do de
panificación finto. Sin emabrgo, puede resultar de interés económico analizar qué sucederı́a
si el perı́odo de planificación es infinito (o lo suficientemente extenso como para poder
considerarse como tal). En ese caso, el análisis anterior se ve modificado en sus condiciones
terminales, manteninendo las condiciones necesarias previas incambiadas. A continuación
se desarrollá brevemente esta variante del problema para el caso de una variable de estado
y control.
Adaptando la ecuación (19) a la nueva situación, se tiene que:
Z ∞
dJ ∂H ∂H
= + λ̇ q(t) + p(t) dt + lı́m [H]∆T − lı́m λ(T )∆yt = 0 (39)
d 0 ∂y ∂u t→∞ t→∞
Dado que ahora T no es fijo, se debe cumplir que lı́mt→∞ [H] = 0, lo que resulta ser
la condición básica de transversalidad en condiciones de horizonte infinito. El otro caso
posible es que y(T ) = yT sea o no libre. Si no lo es, la condición adicional es simplemente
el dicho punto terminal. En caso contrario, si y(T ) es libre se debe imponer la restricción
de que lı́mt→∞ λ(T ) = 0.
3.4.6. Condiciones suficientes

Se ha presentado el problema general de Control Óptimo y las condiciones necesarias
para su resolución, expresadas en el principio del máximo, para diversas situaciones. Sin
embargo, dicho principio sólo bajo ciertas circunstancias representa también una condición
suficiente. A continuación se describe someramente la idea básica presentada por Arrow
en su teorema de suficiencia.
Tomando una formulación básica del problema de control óptimo como la que sigue:

RT
sujeto a : ẏ = f (t, y, u) (40)
y(0) = yo
yo , T dados
Es posible establecer, para cada momento del tiempo y para y y λ dados, cierto u*
que maximice el Hamiltoniano. Si llamamos H 0 (t, y, λ) a dicho hamiltoniano maximizado,
se tiene que:
H 0 (t, y, λ) = F (t, y, u∗ ) + λf (t, y, u∗ ) (41)
El teorema de Arrow establece que las condiciones del principio del máximo son suficientes
para hallar el máximo global de V , si el Hamiltoniano maximizado H 0 es cóncavo en la
variable de estado y para todo t perteneciente a [0, T ], y para un λ dado. Es decir, si
∂2H
∂y 2
< 0.
3.5. Interpretación económica del Principio del Máximo

Dorfman (1969) afirma que la teorı́a de control óptimo es formalmente idéntica a la teorı́a
del capital, y para probarlo desarrolla una interpretación económica del principio del
máximo basándose en un ejemplo de maximización de beneficios. Siguiendo su ejemplo,
si se denota con la letra π al beneficio, k el capital (variable de estado) y u la variable de
control que representa una determinada polı́tica (de inventarios, por ejemplo), el problema
a resolver puede escribirse como:
RT
M ax Π = 0
π(t, k, u)dt
sujeto a : k̇ = f (t, k, u) (42)
k(0) = ko
condiciones de borde
Asumiendo como k*, u* y λ∗ las trayectorias óptimas de las variables de estado, coontrol
y coestado respectivamente, y recordando la ecuación (10), podemos expresar el Funcional
objetivo en el óptimo como:
Z T
∗
Π = [H(t, k ∗ , u∗ , λ∗ ) + k ∗ (t)λ̇∗ ]dt − λ∗ (T )kT∗ + λ∗ (0)k0∗ (43)
0

Si se deriva esta expresión respecto de k0∗ y kT∗ se obtiene un primer resultado interesante.
Estas derivadas son:
∂Π∗
∗
= λ∗ (0) (44)
∂k0
∂Π∗
= −λ∗ (T ) (45)
∂kT∗
En el primer caso podrı́a decirse que λ∗ (0) representa el incremento marginal de los
beneficios frente a un aumento de capital inicial, es decir, la sensibilidad del beneficio
óptimo respecto del stock de capital inicial. En el segundo caso, λ∗ (T ) puede interpretarse
como el opuesto de la tasa de cambio de los beneficios respecto al stock de capital final;
esto es, el sacrificio en términos de beneficios asociado a la no utilización de una unidad
de capital en el momento T . En términos generales, en cada momento del timepo t, λ∗ (t)
representa la sensibilidad de los beneficios óptimos frente a cambios en el stock de capital,
es decir, la tasa a la cual se aprecia (deprecia) una unidad de capital en el momento t.
Producto de esta interpretación, a la variable de coestado suele denominársela como valor
imputado o precio sombra.
Un segundo resultado de interés refiere al sentido económico del Hamiltoniano. Siguiendo
el ejemplo:
H = π(t, k, u) + λ(t)f (t, k, u) (46)

| {z } | {z }
I II
El primer sumando del lado izquierdo, I, representa los beneficios en el momento t

y dependen del capital corriente y la polı́tica tomada en dicho momento. El sumando
II se compone del producto entre el valor imputado al capital y la tasa de cambio del
mismo k̇. Dado que es un producto entre un componente fı́sico y un precio, el resultado es
un valor monetario, cuya interpretación usual es la “tasa de cambio del valor del capital
correspondiente a la polı́tica u”(traducción propia de Chiang, A., 1992, pág. 207). Repre-
senta por tanto una medida de los efectos sobre los beneficios futuros que tendrá cierta
polı́tica aplicada en el momento t. El Hamiltoniano es en definitiva una combinación de
dos efectos con perspectiva temporal distinta, y como el principio del máximo implica
su maximización, el planificador económico debe considerar ambos efectos. Se trata de
encontrar la combinación óptima entre los beneficios presentes derivados de cierta acción
y la potencial pérdida de beneficios futuros que ella conlleve. En términos matemáticos
esta idea puede verse mediante la maximización del Hamiltoniano respecto de u:

∂H ∂π ∂f ∂π ∂f
= + λ(t) =0⇒ = −λ(t) (47)
∂u ∂u ∂u ∂u ∂u
En el óptmio, la polı́tica llevada a cabo de igualar el aumento marginal de los benficios

futuros contra la caı́da de los beneficios futuros a través de del cambio en el stock de
capital.
La tercera interpretación relevante se deriva de las ecuaciones de movimiento. Las mismas
aplicadas a este caso son:
∂H
k̇ = = f (t, k, u) (48)
∂λ
∂H ∂π ∂f (−1) ∂π ∂f
λ̇ = − =− − λ(t) =⇒ −λ̇ = + λ(t) (49)
∂k ∂k ∂k ∂k ∂k
Mientras que la primera describe la forma en que la variable de control afecta la trayectoria
del capital, la segunda ecuación muestra cómo la tasa depreciación del valor imputado
(−λ̇) debe igualarse a la suma de la contribución marginal del capital a los beneficios
presentes y de la contribución marginal del capital a su propia valorización. En otras
palabras, la condición a cumplir es que la depreciación del valor imputado del capital se
compense con la contribución del capital a los beneficios presentes y futuros.
Una última interpretación interesante del principio del máximo refiere a las condiciones
de transversalidad. En el caso de una lı́nea terminal vertical donde no se fija el valor
terminal de la variable de estado (k(T ) libre, T fijo), la condición de transversalidad
resultante era λ(T ) = 0. Esto implica que el valor imputado al capital en el momento
final de planificación debe ser 0. El sentido económico de este resultado es sumamente
razonable: razonando por el absurdo, si bajo estas condiciones al momento final el valor
marginal del capital fuese positivo, invertir una unidad adicional repercutirı́a en beneficios
positivos, por lo que la trayectoria elegida no serı́a óptima y se continuarı́a con la inversión.
En el caso de una lı́nea terminar horizontal (k(T ) fijo y T libre), la condición era [H]t=T =
0. Recordando la interpretación del Hamiltoniano, esta condición implica que para el
momento T resultante, la suma de beneficios presentes y futuro sea nula. Es decir, si se
llegase a dicho momento con el stock de capital prefijado y beneficios positivos, la elección
no serı́a óptima, pues continuar invirtiendo redundarı́a en mayores beneficios.

4 Referencias bibliográficas
4. Referencias bibliográficas
Allen, R.(1965) Economı́a Matemática. Aguilar.
Arrow, K. y Intriligator, M. (1984).Handbook of Mthematical Economics. Elsevier

Science Publishers.
Chiang, A. (1992). Elements of dynamic optimization. Capı́tulos 7 en adelante.

McGraw-Hill, Inc.
Chiang, A. y Wainwgright, K. (2006).Métodos Fundamentales de la Economı́a Ma-

temática. Cuarta Edición. McGraw-Hill, Inc.
Debreu, G. (1991).The mathematizaion of economic theory. The American Economic

Review.
Dorfman, R. (1969). An Economic Interpretation Optimal Control Theory.The Ame-

rican Economic Review.
Kamien,M. y Schwartz. (2001). N. Dynamic Optimization.. Sexta edición. Elsevier

Science Publishers.
Pulido, A. (2002). Posibilidades y limitaciones de las Matemáticas en la Economı́a.

N˚1. Instituto L.R Klein - Centro Stone. Facultad de Ciencias Económicas y Em-
presariales, Universidad Autónoma de Madrid.
Samuelson, P. (1952).Economic theory and mathematics. An appraisal.
Simon, C. y Blume, L. (1994). Mathematics for economists. W.W. Norton and Com-
pany.

Notas Control Optimo PDF

Cargado por

Copyright:

Formatos disponibles

Notas Control Optimo PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Notas Control Optimo PDF

Cargado por

Copyright:

Formatos disponibles

Teorı́a de Control Óptimo y la Economı́a

2. Breve reseña histórica 4

3. Teorı́a del Control Óptimo 6

Teorı́a de Control Óptimo y la Economı́a 3

2. Breve reseña histórica

Teorı́a de Control Óptimo y la Economı́a 4

Von Neuman y Morgenstern (1944), en la construcción de juegos cooperativos, y Nash

Teorı́a de Control Óptimo y la Economı́a 5

3. Teorı́a del Control Óptimo

3.1. Introducción e importancia

La teorı́a de control óptimo se enmarca en un tipo de problema más general denomi-

Teorı́a de Control Óptimo y la Economı́a 6

3.2. Presentación básica

3.2.1. Trayectoria óptima: la toma de decisiones en varias etapas

Como se mencionara más arriba, la caracterı́stica distintiva de los problemas de optimi-

3.2.2. El concepto de Funcional

En el punto anterior se intentó relacionar la noción de sendero o trayectoria con el valor

Teorı́a de Control Óptimo y la Economı́a 7

3.3. El porblema de Control Óptimo

Tomando en cuenta las consideraciones anteriores, el problema básico de control óptimo

A efectos de la presentación, se ha optado por trabajar con un problema de maximización.

Teorı́a de Control Óptimo y la Economı́a 8

3.4. El principio del máximo

3.4.1. Desarrollo y condiciones de primer orden

El correspondiente Hamiltoniano es:

H(t, y, u, λ) = F (t, y, u) + λ(t)f (t, y, u) (3)

Donde λ se denomina variable de coestado.

Si se reexpresa la ecuación de estado como f (t, y, u) − ẏ = 0 y se multiplica ambos

Teorı́a de Control Óptimo y la Economı́a 9

Puesto que este término es identicamente 0, lo podemos sumar al Funcional objetivo V

lo que puede escribirse como

Recordando la formulación del Hamiltoniano definida en (3), la expresión anterior puede

Integrando por partes este resultado se llega a:

Recordando la formulación inicial del Funcional objetivo V y J, siempre que se cumpla

Teorı́a de Control Óptimo y la Economı́a 10

Si a esto se le adiciona la condición de que el momento terminal T y el valor terminal de

Tomando las nuevas expresiones de y y u, y sustituyéndolas en J, tenemos que:

Teorı́a de Control Óptimo y la Economı́a 11

la ecuación (17) se simplifica. Tomando en cuenta este hecho y reagrupando el integrando

las cuales representan dos condiciones adicionales. A la primera se la denomina ecuación

3.4.2. Condiciones de transversalidad

Teorı́a de Control Óptimo y la Economı́a 12

3.4.3. El caso del Hamiltoniano Corriente

F (t, y, u) = G(t, y, u)e−ρt , (21)

H(t, y, u, λ) = G(t, y, u)e−ρt + λ(t)f (t, y, u) (23)

Teorı́a de Control Óptimo y la Economı́a 13

A partir de esta definición, se puede reexpresar el Hamiltonaino, obteniendo:

Hc = Heρt = G(t, y, u) + mf (t, y, u) (25)

Con estas consideraciones, el principio del máximo revisado resulta:

si antes λ(T ) = 0 ⇒ m(T )e−ρT = 0 (27)

si antes [H]t=T = 0 ⇒ m(T )[Hc ]t=T e−ρT = 0 (28)

3.4.4. Problemas con más de una variable de estado y control

Teorı́a de Control Óptimo y la Economı́a 14

problema no conlleva mayores dificultas, siendo sin embargo su resolución relativamente

y˙1 = f 1 (t, y1 , ..., yn , u1 , ..., um )

entonces la presentación el problema se simplifica notablemente y su presentación es simi-

Teorı́a de Control Óptimo y la Economı́a 15

Si aplicamos la notación matricial anterior, tomando:

H(t, y, u, λ) = F (t, y, u) + λ0 (t)f (t, y, u) (34)